Bases De Datos En Biología Computacional Cristian S. Rocha 28 de Mayo del 2002
Mar 19, 2016
Bases De Datos En Biología Computacional
Cristian S. Rocha28 de Mayo del 2002
¿Qué Es Una Base De Datos?- Objetivos:
- Almacenar datos organizados de alguna manera para su eventual consulta.
- Operaciones básicas:- Ingresar.- Eliminar.- Consultar.
- Propiedades:- Finita.- Organización restringida desde la creación.- Consultas limitadas a la información almacenada.
Ventajas
• Fácil acceso a la información.• Fuerza la organización de los datos.• Automatización de operaciones.
Datos Biológicos
• Bibliografía.• Nucleótidos.• Proteínas.• Genoma.• Estructuras.• Alineamientos.• Organismos.• Genes.
• Expresión.• Dominios.• Mapas.• Mutaciones.• Repeticiones.• Anatomía.• ???
Características
• Alta complejidad.• Gran cantidad y variabilidad de la
información.• Interpretaciones múltiples.• Consultas impredecibles.
Inserción
• Supone consulta a futuro.• Supone alguna relación con la BD.• Formato restringido.
Eliminación
• Nunca se volverá a consultar.• No se pierde relaciones de interés.• Mantiene consistencia de la BD.
Consulta
• Formulario o lenguaje de consulta.• Exacta o inexacta.• Presentación.• Tiempo de respuesta.
Tipos
• Analíticas.• Operacionales.
Bases de datos analíticas
• Optimizada para consultas.• Los datos están confirmados.• La información no esta actualizada
continuamente.
Bases de datos operacionales
• Optimizadas para la inserción de datos.• Los datos provienen de un proceso
automático o repetitivo, pueden traer error.• Es información actualizada.
• Planas.• Jerárquicas.• Redes.• Relaciónales.• Orientada a objetos.• Base de objetos.• Especializadas.
Modelos
Organización
• Centralizada.• Distribuida.• Mixta.
Motores De Base De Datos
• Soporte para el diseño y operación de la base de datos.– Diseño: definición de la base de datos y sus
propiedades.– Operación: manejo de la base de datos. Manejo
de los datos.
Estado Del Arte
NCBI
EMBL
DDBJ
Tipo: Operacional.Modelo: Relacional.Organización: Centralizada.
Tipo: Analítica.Modelo: Mixtas.
Organización: Distribuida.
Transparencia E Integración
• Transparencia.– El usuario no debe conocer la implementación
de la base de datos.– Para el usuario debe existir una única base de
datos.• Integración.
– Las herramientas deben interactuar con las consultas de manera transparente.
Limitaciones
• Nadie conoce cual es la mejor implementación.
• Definición de un estándar.• Problemas políticos.
MySQL
Base De Datos Local
BDBioPerl
Internet
SQLGUI HTML
HTMLXML
FASTAEtc..
Motores De Base de Datos
• Relaciónales (SQL).– Postgres, mysql, oracle.
• Jerárquicas.– Acedb.
• Especializadas.– Blast.
Ventajas & Limitaciones
• Las consultas están limitadas a la información requerida.
• Las modificaciones solo afectan a la base de datos local.
• No se puede operar directamente sobre la información de la base de datos.
• Las consultas son 100% especializadas.• No existe una única solución.
Bioperl (www.bioperl.org)
• Extensión del lenguaje de programación perl para:– Manejo de secuencias genómicas.– Manejo de diferentes formatos de información.– Intercomunicación de motores de bases de
datos especializadas.
Acedb (www.acedb.org)
• Base datos orientada a objetos con organización jerárquica.
• Especializada para genómas.• Integra herramientas de visualización.• Apis a java, perl y C.
Blast (NCBI)
• Motor de base de datos de secuencias de genómicas.
• Archivos planos.• La inteligencia esta concentrada en los
índices.
Roles (1/2)
• Usuarios.– Consultar.– Ingresar datos.
• Analista.– Relevar la información a almacenar.– Diseñar un modelo consistente al problema
planteado.
Roles (2/2)
• Administrador del sistema.– Mantener el sistema funcionando.
• Administrador de la base de datos.– Mantener el motor de base de datos estable.
• Curador.– Clasificar, publicar y chequear la validez de los
datos.
Herramientas de Diseño
• Diagramas Entidad Relación.• UML.
Conclusiones
• No existe una única solución para almacenar datos biológicos.
• Es necesario aprender lenguajes de programación y de consulta.
• Mantener una base de datos biológica necesita mantenimiento constante o la responsabilidad de los usuarios.