1 ¿ Qué es la bioinformática ? Dr. Omar Orellana 2013 ¿Qué podemos resolver mediante Bioinformática ? : • Identificar genes específicos en un genoma, identificar todos los genes y todas las proteínas de un organismo. • Inferir la forma de una proteína (estructura terciaria) y su función a partir de una secuencia de aminoácidos. • Determinar los sitios en la estructura de una proteína donde se pueden unir ligandos. • Determinar las interacciones entre los genes y proteínas que pertenecen a un sistema biológico. Para estos propósitos, la búsqueda de SIMILITUDES entre secuencias o estructuras conocidas es el criterio principal. Procedimientos que se utilizan en bioinformática • Búsquedas por similitud • Alineamiento de estructuras primarias (secuencias) • Construcción de árboles filogenéticos • Predicción de estructura secundaria (RNA y proteínas) • Alineamiento de estructuras terciarias • Predicción de estructuras terciarias (RNA y proteínas) • Clasificación de dominios y estructuras (familias) • Predicción de función de proteínas • Agrupamiento de datos de expresión (microarrays, geles 2-D) • Reconstrucción metabólica • Simulación de procesos celulares
20
Embed
¿ Qué es la bioinformática · • Predicción de estructura secundaria (RNA y proteínas) • Alineamiento de estructuras terciarias • Predicción de estructuras terciarias (RNA
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
1
¿ Qué es la bioinformática ?
Dr. Omar Orellana
2013
¿Qué podemos resolver mediante Bioinformática ? :
• Identificar genes específicos en un genoma, identificar todos los genes ytodas las proteínas de un organismo.
• Inferir la forma de una proteína (estructura terciaria) y su función a partirde una secuencia de aminoácidos.
• Determinar los sitios en la estructura de una proteína donde se pueden unirligandos.
• Determinar las interacciones entre los genes y proteínas que pertenecen aun sistema biológico.
Para estos propósitos, la búsqueda de SIMILITUDES entre secuencias o estructuras conocidas es el criterio principal.
Procedimientos que se utilizan en bioinformática
• Búsquedas por similitud
• Alineamiento de estructuras primarias (secuencias)
• Construcción de árboles filogenéticos
• Predicción de estructura secundaria (RNA y proteínas)
• Alineamiento de estructuras terciarias
• Predicción de estructuras terciarias (RNA y proteínas)
• Clasificación de dominios y estructuras (familias)
• Predicción de función de proteínas
• Agrupamiento de datos de expresión (microarrays, geles 2-D)
• Reconstrucción metabólica
• Simulación de procesos celulares
2
(Técnica 1)
Secuenciamento del DNA:
método con dideoxinucleótidos
(Técnica 1)
Secuenciamento del DNA:
método con dideoxinucleótidos
Secuenciamento del DNA:
“pirosecuenciamiento”
(Técnica 1)
3
Secuenciamento del DNA:
“pirosecuenciamiento”
(Técnica 1)
Genoma de Haemophilus influenzae
4
Genomas secuenciados
5
Bases de datos de secuencias de ácidos nucleicos
EMBL
http://www.ebi.ac.uk/embl/
GeneBank
http://www.ncbi.nlm.nih.gov/
DDBJ
Expressed sequence tag (EST)
http://www.ncbi.nlm.nih.gov/dbEST/
KEGG
http://www.genome.jp/kegg/
Bases de datos de proteínas:
Primarias (secuencias)PIR (Protein Information Resource)
• ARNold encuentra terminadores rho independientes en secuencias deácidos nucleicos. La búsqueda usa dos programas complementarios Erpin yRNAmotif.
• En el programa Erpin, a partir de un set de entrenamiento de 1200secuencias terminadoras de Bacillus subtilis y Escherichia coli, seconstruye un perfil de puntuación y en base a este perfil se busca en lassecuencias entregadas por el usuario.
• RNAmotif usa un algoritmo que reconoce terminadores de E. coli queademás puede ser aplicado para búsqueda de terminadores de cualquierespecie. Se basa en la descripción de una hélice de 4-18 pb, un espaciadorde 0 a 2 nt y una región rica en T. A las búsquedas de RNAmotif se lesasigna un valor de puntuación dependiendo del contenido de T y laestabilidad del stem-loop.
• Se calcula la energía libre de la estructura stem-loop terminadora usandoRNAfold. Este valor de energía libre se usa como valor de confianza parala predicción de terminadores.
Predicción de la estructura secundaria de la Predicción de la estructura secundaria de la Gliceraldehído 3 fosfato deshidrogenasaGliceraldehído 3 fosfato deshidrogenasa