Ciencia y Tecnologia
En esta parte del práctico, se utilizará el programa Blast2Seq para realizar algunos alineamientos de a pares de secuencias de forma de mostrar algunos aspectos del funcionamiento del algoritmo BLAST aplicado a ejemplos sencillos.
1-Abra el navegador y vaya a la página web de BLAST en el servidor de NCBI (http://www.ncbi.nlm.nih.gov/blast).2-Localice la opción para alinear dos secuencias (Blast2Seq) e ingrese a la misma.
3-Observe con atención el formulario que se presenta para realizar el alineamiento. Identifique las diferentes opciones en relación a lo visto en la clase teórica.
4-Copie la siguiente secuencia en ambas cajas de texto:
>test seq 1
TTGGGGGTTGACCGACATCGTATGGGACTCTCTCTCTCTCTCTATCGGGTCATACCCCAA-
A
Haga click en elbotón "Align".
5-Interprete los resultados estudiando la salida presentada.
Observe el score obtenido y el valor esperado. ¿Es un resultado significativo?
¿Cuál es la relación entre el raw score (entre paréntesis) y el score en bits?
¿Cómo es posible que la identidad reportada del alineamiento no es 100% siendo que alineó una secuencia contra sí misma? (pista: que significan las N en elalineamiento?)
En primera instancia al utilizar los parámetros que el algoritmo da por default el alineamiento me resulto sin similaridad significantiva, sin darme valores de score ni imagen alguna de alineamiento (Ver ilustración I). Existen dos razones por las cuales pudo haberme dado este resultado: la primera es que las dos secuencias (que es la misma) soncortas y de baja complejidad (es decir, pueden dar falsos positivos) por tanto los valores esperados (E value, número de hits que se espera observar por azar) resultaron por arriba del umbral predeterminado que generalmente es de 10, la solución sería aumentar el umbral del valor E en los parámetros del algoritmo; la segunda razón que pudo afectar el alineamiento es que uno de los parámetros que elalgoritmo de BLAST da por de default es el filtro de regiones de baja complejidad, es decir, estas regiones no se les permite iniciar alineamientos, por ello dado que nuestra secuencia problema es de baja complejidad el filtro puede prevenir todos los accesos (hits) a la base de datos, la solución es quitar cualquier filtro en los parámetros del algoritmo antes hacer BLAST.
Ahora bien, el “Programa–algoritmo-“que la página da por default es el “megablast”, si en lugar de cambiarle los parámetros de valor Esperado y el filtro, cambiamos la opción del algoritmo por el de secuencias algo similares “blastn”, podemos obtener un BLAST con una identidad de 100% y un score de 111 bits (122). Sin embargo, en este caso seguiremos utilizando el megablast.
6-Vuelva al formulario de alineamientoy deseleccione la opción "Filter".
Realice el alineamiento otra vez.
¿Qué diferencias se observan ahora? ¿Por qué ocurren?
Ahora si el programa me brinda un alineamiento significativo con una identidad al 100% (61/61) de las dos secuencias, me brinda una matriz grafica de puntos donde se observa una sola líneadiagonal central ininterrumpida lo que significa que ambas secuencias son idénticas. El valor raw score (puntuación directa –bruta o cruda-) es de 61 dada a los matches encontrados entre las secuencias, en este caso es igual a la longitud de ambas secuencias porque fue la misma, este valor sólo, tiene poco significado sin un conocimiento detallado del sistema de puntuación utilizado por elprograma (parámetros K y lambda), es como citar una distancia sin especificar los metros, por ello para calcular la significancia del alineamiento se utiliza la puntuación en bits que no es más que la esencia estadística del sistema de puntuación empleado, entonces el valor del score es de 113 bits. No se introdujo ningún hueco y el valor E fue 2-31.
Estos resultados ocurren debido a que al quitar...
Regístrate para leer el documento completo.