Significación estadistica

Páginas: 5 (1202 palabras) Publicado: 23 de marzo de 2010
SIGNIFICACIÓ ESTADÍSTICA D'UN APARELLAMENT DE SEQÜÈNCIES. EXERCICI

1) Fes servir les mateixes opcions (m. puntuació, Gap Penalty (open, extended), ... ) en les dues aplicacions (PRSS3, PRSS/PRFX) de tal manera que els paràmetres Lambda i K serien iguals o molt similars. Verifica el bon funcionament de les aplicacions.

Volem discutir la significació estadística de l’alineament de la segona itercera seqüències, que es troben a l’arxiu randomseqs.txt: 2a seqüència: NNFKIFMVADNWHSWQIINAVCQHGPQNCPPDSNWAFDASSDMDWIPMQCPSLHDHVRGY

3a seqüència: NNYKIFMVADQWHSWQIINTVCQRGPQNCSPDSNWAFEASSDMDWIPLQCPSLHDHVRGF

Totes dues seqüències contenen 60 aminoàcids. Utilitzem el programa PRSS3, el qual avalua la significació d'un alineament de seqüències de proteïnes. Podem accedir directament enaquest programa a través del següent enllaç: http://www.ch.embnet.org/software/PRSS_form.html Si volem avaluar la significació de l’alineament de la segona i la tercera seqüència, hem d’omplir els camps que mostra la següent imatge:

Les opcions que hem escollit són: number of suffles (200), windows size (10), scoring matrix (PAM250), gap opening penalty (12), gap extension penalty (2). I hemescrit les dues seqüències al camp corresponent en format FASTA. Un cop tenim els camps omplerts, executem el programa per tal d’obtenir una sortida de resultats.

A continuació adjuntem aquests resultats, i els estudiem.
PRSS output for 2nd sequence vs. 3rd sequence [ISREC-Server] Date: Thu Nov 12 17:21:42 2009 # /usr/molbio/bin/prss3 -s /usr/molbio/share/fasta3/pam250.mat -f -12 -g -2 -w 10wwwtmp/.PRSS.7480.1.seq wwwtmp/.PRSS.7480.2.seq 200 -q -O wwwtmp/.PRSS.7480.out PRSS evaluates statistical signficance using Smith-Waterman version 3.4t26 July 7, 2006 Please cite: W.R. Pearson (1996) Meth. Enzymol. 266:227-258 wwwtmp/.PRSS.7480.1.seq - >2nd sequence 60 bp 60 aa vs wwwtmp/.PRSS.7480.2.seq - 3rd sequence 60 bp shuffled sequence opt E() < 20 0 0: 22 0 0: one = represents 1 librarysequences 24 0 0: 26 0 0: 28 0 0: 30 0 0: 32 2 1:*= 34 2 3:==* 36 9 6:=====*=== 38 9 10:=========* 40 17 14:=============*=== 42 14 17:============== * 44 25 18:=================*======= 46 17 19:================= * 48 13 18:============= * 50 15 16:===============* 52 10 14:========== * 54 13 12:===========*= 56 14 10:=========*==== 58 10 8:=======*== 60 9 7:======*== 62 3 5:=== * 64 5 4:===*= 66 23:==* 68 2 3:==* 70 3 2:=*= 72 0 2: * 74 2 1:*= 76 1 1:* 78 2 1:*= 80 0 1:* 82 0 0: 84 0 0: 86 1 0:= 88 0 0: 90 0 0: 92 0 0: 94 0 0: 96 0 0: 98 0 0: 100 0 0: 102 0 0: 104 0 0: 106 0 0: 108 0 0: 110 0 0: 112 0 0: 114 0 0: 116 0 0: 118 0 0: >120 0 0: 12000 residues in 200 sequences (shuffled) MLE statistics: Lambda= 0.1709; K=0.1009 Kolmogorov-Smirnov statistic: 0.0457 (N=24) at 44 Smith-Waterman (3.5Sept 2006) function [/usr/molbio/share/fasta3/pam250.mat matrix (17:-8)], open/ext: -12/-2

Podem observar que cadascuna de les seqüències conté 60 aminoàcids, i que amb les opcions triades anteriorment aconseguim una Lambda de 0.1709 i una K de 0.1009. També podem observar que no ens dóna la puntuació d’Smith-Waterman.

Per tal d’obtenir la puntuació abans esmentada, haurem d’utilitzar unaltre programa.. com per exemple el PRSS. El trobem directament al següent enllaç: http://fasta.bioch.virginia.edu/fasta_www2/fasta_www.cgi?rm=shuffle&pgm=rss Com es pot veure a la següent imatge, utilitzem les mateixes opcions que amb el programa PRSS3, per tal que ens doni uns resultats similars.

Així que, la sortida de resultats del programa PRSS és:
# /seqprg/bin/ssearch35_t -p -q -w 80 -m6 -Z 10000 -A -H -k 200 -f -12 -g -2 -s P250 @ TMP.q2 SSEARCH searches a sequence data bank version 35.04 Sept. 22, 2009 Please cite: T. F. Smith and M. S. Waterman, (1981) J. Mol. Biol. 147:195-197; W.R. Pearson (1991) Genomics 11:635-650 Query: @ 1>>>QUERY - 60 aa Library: TMP.q2

60 residues in

1 sequences

60 residues in 1 sequences Statistics: (shuffled [200]) MLE statistics: Lambda=...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • LA SIGNIFICACION
  • Significacion
  • Significación
  • La significacion
  • Significacion
  • La significación
  • 3.1 Concepto De Hipótesis, Estadística y Pruebas De Significación.
  • Ensayo: Uso De La Hipotesis Nula Y La Significacion Estadistica

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS