Identificacion de orf

Solo disponible en BuenasTareas
  • Páginas : 6 (1377 palabras )
  • Descarga(s) : 0
  • Publicado : 11 de febrero de 2012
Leer documento completo
Vista previa del texto
UNIVERSIDAD AUTONOMA DE NUEVO LEON FACULTAD DE CIENCIAS BIOLOGICAS DEPARTAMENTO DE MICOLOGIA Laboratorio de Genómica Estructural y Comparativa
PRÁCTICA NO. 2 IDENTIFICACIÓN DE ORFINTRODUCCIÓN

Como saber si una región localizada en una secuencia es efectivamente un gen? El caso de los procariotas es sencillo, ya que la secuencia de sus genes no contiene intrones y además poseen ciertascaracterísticas que permiten identificarlos, algunas de ellas son: Codifican para proteínas que regularmente han sido encontradas previamente en otros microorganismos, el marco de lectura abierto en cuestión cuenta con un número alto de GC y frecuencia elevada de codones específicos, la secuencia codificante es precedida por un sitio de unión a ribosoma típico (secuencia Shine-Delgarno) y por unpromotor típico. Sin embargo, para la mayoría de los eucariotas unicelulares la organización de los genes es tan compleja que la identificación y caracterización génica es un problema bastante complicado. Además los genes eucariotas están separados por largas regiones intergénicas, y contienen numerosos intrones, algunos de ellos muy largos. Obviamente las regiones codificantes solo representan unpequeño porcentaje del gen. Aún así las posiciones de los exones pueden ser determinados obteniendo experimentalmente la secuencia de cDNA. De cualquier forma muchos de los genes humanos poseen patrones de expresión con formas alternativas e idealmente la predicción correcta de los genes debería identificar todas estas formas….. esto complica enormemente la tarea. Para fines prácticos lo único que sedebe identificar con cierta seguridad son los exones codificantes, ya que estos permitirán determinar la secuencia proteica. La determinación correcta de las uniones de los exones recae en la identificación de los sitios de splicing, lo cual se facilita por el hecho de que la mayoría de estos sitios se sitúan en secuencias consenso que incluyen dos dinucleótidos cercanos invariables al final decada intrón, un par GT en el extremo 5´ y un par de AG en el extremo 3´. Existen señales de splicing no canónicas y raras en algunas variantes, pero son la excepción. Por ejemplo, en el sitio de splicing 5´ algunas veces se encuentra el par GC en lugar de GT. El segundo tipo de excepción para el consenso de sitio de

splicing son los intrones AT-AC que tienen la secuencia altamente conservada(A,G)TATCCT(C,T) en su extremo 5´. Existen aún más excepciones a la regla que continuan complicando esta tarea. Aun las mejores herramientas de bioinformatica predicen correctamente sólo el 40% de los genes. Los errores más comunes ocurren en genes que poseen intrones largos, que pueden ser consideradas como secuencias intragenicas, lo cual da lugar a una fisión incorrecta del gen. Por otro ladoestán los genes con regiones intergénicas cortas, las cuales pueden ser consideradas como intrones. De cualquier manera los programas de predicción de genes muestran cierta eficiencia en la prediccion de regiones codificantes, y que aun dejando pasar por alto un pequeño exon la mayoría de éstos si estan identificados correctamente. Los programas más populares para la edición de genes eucariotasson el NetGene2 (http://www.cbs.dtu.dk/services/NetGene2/), que fue hecho para editar genes de humano, pero que resulta eficiente para los genes de C. elegans y A. thaliana y el GeneSplicer (http://cbcb.umd.edu/software/GeneSplicer/). Este sistema ya ha sido entrenado y utilizado con éxito para la edición de genes en P. falciparum, A. thaliana, humano, Drosophila y arroz. Tenemos que tener siempreen cuenta que la frecuencia y secuencia de intrones varía de organismo en organismo y que hasta ahora no se ha podido eliminar el uso del criterio del investigador para el analisis de los resultados obtenidos por bioinformática.

OBJETIVOS: Identificar marcos de lectura abiertos en secuencias no anotadas. Traducir in silico posibles Marcos de Lectura Abiertos contenidos en secuencias de DNA...
tracking img