Bioinformatica
Erika Susana Quintero S a *, Kelly Marcela Herrera H a, Jhon Alejandro Ávila R a.
a Universidad de Caldas, Facultad de Ciencias Exactas y Naturales, Programa de Licenciatura en Biología y Química.
* susy.153@hotmail.com
Resumen
La bioinformática es una herramientautilizada para la recolección, análisis e interpretación de la información biológica a nivel molecular[1]. En el presente documento se realizó una serie de estudios computacionales para obtener información acerca de una secuencia de ADNc con 1751 pb. A partir del programa ORF Finder del NCBI ("National Center for Biotechnology Information") se obtuvo la secuencia de aminoácidos que codifica dichoADNc; la información obtenida en formato FASTA (>nombre de la secuencia y en el renglón siguiente la secuencia) se introdujo en el programa BLAST, donde se realizó uan búsqueda en base de datos Swisprot y se encontró que la proteína pertenece a la superfamilia de las Lipocalinas y su función está directamente relacionada con el transporte de Retinol. Por último se realizó un alineamientomúltiple en el programa CLUSTALW con las primeras 20 secuencias encontradas en BLAST como secuencias homólogas; se encontró que la proteína analizada guarda mayor identidad con la proteína con nombre se secuencia RET4_PANTR.
Palabras clave: ADNc, BLAST, CLUSTALW, lipocalinas, proteínas homólogas, transportadora de retinol.
Introducción
La bioinformática es la aplicación de tecnología decomputadores a la gestión y análisis de datos biológicos para solucionar problemas, analizar datos, o simular sistemas o mecanismos, todos ellos de índole biológica, y usualmente (pero no de forma exclusiva) en el nivel molecular[2]. Una constante en proyectos de bioinformática y biología computacional es el uso de herramientas matemáticas para extraer información útil de datos producidos por técnicasbiológicas de alta productividad, como la secuenciación del genoma. En particular, el montaje o ensamblado de secuencias genómicas de alta calidad desde fragmentos obtenidos tras la secuenciación del ADN a gran escala es un área de alto interés[3]. [Otros objetivos incluyen el estudio de la regulación genética para interpretar perfiles de expresión génica utilizando datos de chips de ADN oespectrometría de masas[4]. [
Para obtener información acerca de la proteína obtenida en el análisis se utilizó una secuencia de ADNc; un ADNc es un ADN de cadena sencilla y se sintetiza a partir de una hebra simple de ARNm maduro. Se suele utilizar para la clonación de genes propios de células eucariotas en células procariotas debido a que, dada la naturaleza de su síntesis, carece de intrones[5].
Lasmoléculas de ADNc se obtienen mediante la enzima transcriptasa inversa a partir de las moléculas de ARNm de la célula. La transcriptasa inversa procede de retrovirus y usa como molde una cadena sencilla de ARN para dar lugar a una cadena sencilla de ADNc. La transcriptasa inversa emplea ARNm maduro como molde y por tanto el ADNc no contiene los intrones que poseen los genes eucariotas. Así lasecuencias de ADNc corresponden únicamente secuencias codificadoras de proteínas[6].
Las proteínas, además de formar parte de la estructura básica de los tejidos (músculos, tendones, piel, uñas, etc.), desempeñan funciones metabólicas y reguladoras como la asimilación de nutrientes, transporte de oxígeno y grasas en la sangre, inactivación de materiales tóxicos o peligrosos; también son loselementos que definen la identidad de cada ser vivo, ya que son la base de la estructura del código genético (ADN) y de los sistemas de reconocimiento de organismos extraños en el sistema inmunitario[7]; se han convertido en el centro de numerosos estudios y por su diversidad tanto estructural como funcional, ha sido necesaria la creación de diferentes bases de datos que alberguen la información...
Regístrate para leer el documento completo.