biotecnologia

Páginas: 8 (1814 palabras) Publicado: 9 de octubre de 2013
Para empezar a conocer nuestras secuencias:

1) Cuantas secuencias hay en el archivo de salida de esa secuenciacion: uade_seq1.fasta?
Se realizo

$ grep -c ">" uade_seq1.fasta
Devolvio 552
$ grep -c "orf" uade_seq1.fasta
Devolvio 550
$ grep -c "gi" uade_seq1.fasta
Devolvio 2

2) Que tipo de secuencias son? Proteínas o nucleótidos...

Nucleotidos, se uso el comando head en elarchivo.

3) Miren los “headers” de las secuencias fasta, que les dice esa informacion? Que es un ORF? Explicar.

Son secuencias ORFs. ORF significa “open reading frame” (marco de lectura abierto), es parte de un reading frame que no contiene el codon de stop (de terminacion) (los ORFs estan definidos entre dos codones stop). En el head tambien esta la informacion de la longitud de lasecuencia.

4) Conociendo el proyecto, un colaborador te facilita 3 archivos “multifasta” de proteinas para ser usados como base de datos: i) uade_seq1_db2.faa (secuencias proteicas de bacterias que se creen relacionadas), ii) un archivo “multifasta” con secuencias proteicas generales de todos los seres vivos, “nr DB”: uade_seq_nr_db.faa, y iii) por ultimo un archivo de un genoma bacteriano relacionado:bact_genome.fna. Contar cuantas secuencias hay en cada archivo.

Se realizo
$ grep -c “>” filename
en cada archivo
En uade_seq1_db2.faa → 3776 secuencias de aminoacidos
En uade_seq_nr_db.faa → 4076 secuencias de aminoacidos
En bact_genome.fna → 2 secuencias de nucleotidos

5) Formaten esas secuencias para que blast pueda usarlas como Base de Datos???? Que comando usaron?
Se les dioformato con
$ formatdb -o T -p T -i uade_seq1_db2.faa
$ formatdb -o T -p T -i uade_seq_nr_db.faa
$ formatdb -o T -p F -i bact_genome.fna

6) Mencionar differencias entre blastn, blastx, y blastp. Para que sirven? Fijense cuales son las salidas posibles de blast!!! muy importante, Que opcion te permite definir esto? Que opcion se usa para tener una salida en formato tabla? Pista: Utilizarblastn -h (o blastall)

blastn: compara una secuencia de nucleotidos contra una secuencia de la base de datos.
blastx: Este programa usa como entrada una secuencia de nucléotidos. Traduce la secuencia en sus seis posibles marcos de lectura (tres marcos de lecturas por hebra) y compara estas secuencias traducidas contra una base de datos de proteínas. Se usa cuando se tiene sospecha de que lasecuencia de entrada codifica para una proteína pero no se sabe exactamente cuál es su producto.
Blastp: Es el otro tipo de BLAST más usado. Es un BLAST "con huecos" (o gaps) que compara una secuencia de aminoácidos contra una base de datos del mismo tipo. Usualmente usa la matriz de sustitución BLOSUM o PAM para realizar los alineamientos, aunque puede usar una matriz definida por el usuario.Las posibles salidas del blast son con el argumento -m “numero” la opcion 8 devuelve una tabla. La opcion 9 devuelve la tabla con comentarios.

7) Como puedo aproximar que tipo de secuencias tengo en mi archivo uade_seq1.fasta? Son secuencias que son de bacterias o no? Osea que puedo hacer para saber si se tratan de secuencias de una bacteria o no? Blastn o sino tblastn a la base de genomabacteria, daran mismo resultado? Prueben los dos. Utilizando blastn: Que les da? Que evalue usaron? De esa salida, Cuantos ORFs tienen “hsps”? Pista:grep, sort, cut, sort -u.

Como tenemos a disposicion las secuencias de genomas y proteinas que provienen de bacterias, se realizo un blast de mi query contra la base de datos de bacterias con un expectation value bajo.
$ blastall -p blastx -duade_seq1_db2.faa -i uade_seq1.fasta -m 9 -e 0.0001 -o blastxdb2
$ blastall -p blastn -d bact_genome.fna -i uade_seq1.fasta -m 9 -e 0.0001 -o blastnbactgenome
Se busco los resultados unicos de la lista con el siguiente comando
$ grep -e "^orf" -e “^gi” blastnbactgenome | cut -f 1 | uniq | wc -l
este devolvio 192 resultados, luego
$ grep -e "^orf" -e “^gi” uade_seq1_db2.faa | cut -f 1 | uniq | wc...
Leer documento completo

Regístrate para leer el documento completo.

Estos documentos también te pueden resultar útiles

  • Biotecnologia
  • Biotecnologia
  • Biotecnologia
  • Biotecnologia
  • Biotecnologia
  • Biotecnologia
  • Biotecnologia
  • Biotecnologia

Conviértase en miembro formal de Buenas Tareas

INSCRÍBETE - ES GRATIS