Bioinformatica, genomica
INTRODUCCION
La genómica es el campo de la ciencia que analiza y compara el genoma de los organismos o una gran cantidad de genes de manera simultánea, puede que comparar secuencias genómicas de datos de forma individual no sea muy productivo por lo tanto lo mejor es aplicar genómica comparativa; esta consiste en comparar secuenciasgenómicas de distintas especies dando como resultado como por ejemplo patrones de relaciones evolutivas.
Una herramienta interesante para el estudio de la genómica y la comparación de secuencias genéticas corresponde a los algoritmos genéticos; lamentablemente el desarrollo de algoritmos para la anotación genómica ha sido relativamente lento ya que se limita al conocimiento humano y susinvestigaciones.
El método más eficaz para comprender el contenido genómico es comparar varios genomas de diferentes distancias filogenéticas como se dijo con anterioridad. La codificación de las regiones de un gran conjunto de genes comunes se pueden identificar mediante la comparación de secuencias genómicas que están alejadas filogenéticamente. Además, la comparación de las secuencias genómicas dedistintas regiones no codificantes que muestran algún grado de conservación puede arrojar información importante relacionada con la regulación de la expresión génica, la organización estructural del genoma y posiblemente, otras funciones aun desconocidas(1).
Uno de los principales programas utilizados para generar estas comparaciones de secuencias es el BLAST. Dicho programa consiste enalineación de secuencias para obtener una alineación correcta con pocos gaps y lagunas, sin embargo se ha estado desarrollando un programa a base de algoritmos el cual mejora la calidad general de las alineaciones de secuencias denominado GenAlignRefine (2).
DESARROLLO DEL TEMA
Uno de los puntos más importantes en el estudio de la genómica comprende a las bases de datos de los componentes dedichos genes, su expresión y los mecanismos que regulan dichas expresiones. Por ejemplo
Bases de datos de nucleótidos: Como lo son el Genbank, NCBI, TIGR, Ensembl. Genbank es la base de datos principal de nucleótidos el cual mantiene un registro general sobre las secuencias de nucleotidos que se han introducido a él.
Bases de datos de proteínas La principal base de dato de proteínas correspondea SWISS-PROT, el cual corresponde a una biblioteca de datos entregados y verificados por curadores de información. Existe otra base de datos TrEMBL la cual es una base de datos automáticamente anotada, no se verifica la información por curadores.
Bases de datos de Vías Metabólicas Algunas bases de datos sobre vías metabólicas son: KEGG, BRENDA, IUBMB, ECOCYC. KEGG (Kyoto Encyclopedia of Genesand Genomes) incluye una gran cantidad de vías metabólicas y es la mas importante a nivel mundial, BRENDA es un sistema de información enzimático, IUBMB es el sitio oficial de la Unión de Bioquímica y Biología Molecular y ECOCYC es la enciclopedia de genes y el metabolismo de E.Coli.
Una aplicación importante para comparar secuencias es el uso del programa BLAST (Basic Local Alignment SearchTool) la cual contiene 2 versiones principales que son BLASTP y TBLASTN. BLASTP compara la secuencia de una proteína con una base de datos de proteínas y TBLASTN comparar la secuencia de una proteína con una base de datos de nucleótidos.
Por ejemplo, si uno quiere encontrar algo acerca de la función de alguna proteína en particular se utiliza BLASTP para comparar con otras proteínas en las basesde datos, sin embargo para descubrir nuevos genes que codifican alguna proteína (o enzima) se debe usar TBLASTN ya que permite comparar la proteína con secuencias de ADN traducidas en todas sus posibles fuentes de información.
Esta herramienta es útil en casos de alineamientos simples, pero si se trata de alineamientos múltiples lo mejor es utilizar CLUSTALW, el cual nos da una mejor...
Regístrate para leer el documento completo.