SE Generaciones
✔
Indice Q3
Porcentaje de residuos correctamente
“adivinados” por el método
Q3
N predicted
100
N observed
Se tienen en cuenta las:
–
-helix
–
-sheet
–
-turn y el resto de las formas
✗
Q3 < 66% = Malo
Predicción de Estructuras Secundarias
Chou - Fasman
1974
✔
Primera generación:
- La información de la predicción
proviene de los residuos deuna
secuencia vista en forma aislada
- Usando la base “PDB” (*), decir
que tan propenso es un
determinado amino ácido de
adoptar cierto tipo de estructura
secundaria
●
PDB = The Protein Data Bank (http://www.rcsb.org/pdb)
✗
Q3 = 53% - 61%
Predicción de Estructuras Secundarias
Chou - Fasman
1974
✔
Segunda generación:
- Concepto de Ventana (ej: 7
letras)
GOR(*)
1987
●
APAFSVSPAS
- Setoma en cuenta la vecindad
del amino ácido en la predicción
de la forma que adoptará la
estructura secundaria.
✗
●
GOR: J.Garnier, D.Osguthorpe and B.Robson
Q3 = 63%
Predicción de Estructuras Secundarias
Chou - Fasman
1974
GOR
1987
✔
Tercera generación:
- Métodos “Adaptativos”
- Conceptos de Redes
Neuronales
PHD (*)
1993
PHD: Rost & Sander, 1993
✗
Q3 = 72.2%
Predicción de EstructurasSecundarias
Chou – Fasman (1974): Asignación estática de valores a cada aa
Asignar a los residuos los valores probabilísticos,
basado en el análisis estadístico de un conjunto de
proteínas cuya estructura secundaria es conocida.
●
P(-helix)
●
P(-sheet)
●
P(-turn)
●
Predicción de Estructuras Secundarias
Chou – Fasman (1974):
Name
Alanine
Arginine
Aspartic Acid
Asparagine
Cysteine
GlutamicAcid
Glutamine
Glycine
Histidine
Isoleucine
Leucine
Lysine
Methionine
Phenylalanine
Proline
Serine
Threonine
Tryptophan
Tyrosine
Valine
Abbrv
A
R
D
N
C
E
Q
G
H
I
L
K
M
F
P
S
T
W
Y
V
P(a)
142
98
101
67
70
151
111
57
100
108
121
114
145
113
57
77
83
108
69
106
P(b)
83
93
54
89
119
37
110
75
87
160
130
74
105
138
55
75
119
137
147
170
Tabla de valores para cada AA
P(turn)
66
95
146
156
119
74
98156
95
47
59
101
60
60
152
143
96
96
114
50
f(i)
0.06
0.07
0.147
0.161
0.149
0.056
0.074
0.102
0.14
0.043
0.061
0.055
0.068
0.059
0.102
0.12
0.086
0.077
0.082
0.062
f(i+1)
0.076
0.106
0.11
0.083
0.05
0.06
0.098
0.085
0.047
0.034
0.025
0.115
0.082
0.041
0.301
0.139
0.108
0.013
0.065
0.048
f(i+2)
0.035
0.099
0.179
0.191
0.117
0.077
0.037
0.19
0.093
0.013
0.036
0.072
0.014
0.065
0.034
0.125
0.0650.064
0.114
0.028
f(i+3)
0.058
0.085
0.081
0.091
0.128
0.064
0.098
0.152
0.054
0.056
0.07
0.095
0.055
0.065
0.068
0.106
0.079
0.167
0.125
0.053
Predicción de Estructuras Secundarias
Chou – Fasman (1974): Reglas para -helix.
1.
2.
3.
4.
Identificar cuando una región de 6 amino ácidos tiene 4 que
son P()>100. (Posible núcleo de -helix)
Extenderse por la secuencia de amino ácidos en ambasdirecciones, hasta que encontremos 4 amino ácidos que
tienen como promedio P()<100 .(Posible final de -helix)
Si tenemos un segmento de mas de 5 amino ácidos y la
suma de los P()>P(). Marcamos la región como -helix.
Repetimos para toda la secuencia
Predicción de Estructuras Secundarias
Chou – Fasman (1974): Reglas para -sheet.
1.
2.
3.
Identificar cuando una región de 5 amino ácidos tiene 3 queson P()>100. (Posible -sheet)
Extenderse por la secuencia de amino ácidos en ambas
direcciones, hasta que encontremos 4 amino ácidos que en
promedio tienen P()<100. (Posible fin de -sheet)
Si tenemos un segmento de mas de 5 amino ácidos y la
suma de los P()>P(). Marcamos la región como -sheet.
Predicción de Estructuras Secundarias
Chou – Fasman (1974): Reglas para los overlaps.
1.
2.
3.Si las regiones de alfa y las betas se superponen: Calcular la
suma de los P() y de los P() para esa región
Si P() > P() entonces se predice una -helix
Si P() < P() entonces se predice una -sheet
Predicción de Estructuras Secundarias
Chou – Fasman (1974): Reglas para los -turn.
1.
2.
La probabilidad de que una región de 4 amino ácidos
(aa[1..4]) sea -turn esta calculada como una...
Regístrate para leer el documento completo.