El núcleo
Los principales esfuerzos de investigación en estos campos incluyen el alineamiento de secuencias, la predicción de genes, montaje del genoma, alineamiento estructural de proteínas,predicción de estructura de proteínas, predicción de la expresión génica, interacciones proteína-proteína, y modelado de la evolución
Bioinformática es la investigación, desarrollo o aplicación de herramientas computacionales y aproximaciones para la expansión del uso de datos biológicos, médicos, conductuales o de salud, incluyendo aquellas herramientas que sirvan para adquirir, almacenar,organizar, analizar o visualizar tales datos.
Biología computacional sería el desarrollo y aplicación de métodos teóricos y de análisis de datos, modelado matemático y técnicas de simulación computacional al estudio de sistemas biológicos, conductuales y sociales.
Análisis de secuencias
Desde que el fago Φ-X174 fue secuenciado en 1977 (secuencia provisional: un año más tarde se publicaría lasecuencia completa definitiva),33 las secuencias de ADN de cientos de organismos han sido decodificadas y guardadas en bases de datos. Esos datos son analizados para determinar los genes que codifican para ciertas proteínas, así como también secuencias reguladoras. Una comparación de genes en una especie o entre especies puede mostrar similitudes entre funciones de proteínas, o relaciones entreespecies (uso de filogenética molecular para construir árboles filogenéticos).96
Con la creciente cantidad de datos, desde hace mucho se ha vuelto poco práctico analizar secuencias de ADN manualmente. Hoy se usan programas de computadora para estudiar el genoma de miles de organismos, conteniendo miles de millones de nucleótidos. Estos programas pueden compensar mutaciones (con basesintercambiadas, borradas o insertadas) en la secuencia de ADN, para identificar secuencias que están relacionadas, pero que no son idénticas.39 Una variante de este alineamiento de secuencias se usa en el proceso de secuenciación.
La secuenciación conocida como "shotgun" (o por perdigonada: fue usada, por ejemplo, por el Instituto de Investigación Genómica -The Institute for Genomic Research, TIGR, hoy J.Craig Venter Institute- para secuenciar el primer genoma de bacteria, el Haemophilus influenzae)62 no da una lista secuencial de nucleótidos, pero en cambio nos ofrece las secuencias de miles de pequeños fragmentos de ADN (cada uno de aproximadamente 600 a 800 nucleótidos de largo). Las terminaciones de estos fragmentos se superponen y, cuando son alineados de la manera correcta, constituyen elgenoma completo del organismo en cuestión.97
El secuenciamiento shotgun proporciona datos de secuencia rápidamente, pero la tarea de ensamblar los fragmentos puede ser bastante complicada para genomas muy grandes. En el caso del Proyecto Genoma Humano, llevó varios meses de tiempo de procesador (en una estación DEC Alpha de alrededor del 2000) para ensamblar los fragmentos. El shotgun sequencinges el método de elección para todos los genomas secuenciados hoy en día y los algoritmos de ensamblado genómico son un área crítica de la investigación en bioinformática.
Otro aspecto de la bioinformática en análisis de secuencias es la búsqueda automática de genes y secuencias reguladoras dentro de un genoma.98 No todos los nucleótidos dentro de un genoma son genes. Dentro del genoma deorganismos más avanzados, grandes partes del ADN no sirven a ningún propósito obvio. Este ADN, conocido como "ADN basura", puede, sin embargo, contener elementos funcionales todavía no reconocidos.99 La bioinformática sirve para estrechar la brecha entre los proyectos de genoma y proteoma (por ejemplo, en el uso de secuencias de ADN para identificación de proteínas).
Anotación de genomas
Artículo...
Regístrate para leer el documento completo.