Top Banner
ANÁLISIS DE MICROARRAY
38

ANÁLISIS DE MICROARRAY - UMHsici.umh.es/teaching/doctorate/Functional_Genomics_and... · 2009-02-16 · - Microarray o DNA Chips Definición de Microarray: Conjunto ordenado de moléculas

Jul 18, 2020

Download

Documents

dariahiddleston
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: ANÁLISIS DE MICROARRAY - UMHsici.umh.es/teaching/doctorate/Functional_Genomics_and... · 2009-02-16 · - Microarray o DNA Chips Definición de Microarray: Conjunto ordenado de moléculas

ANÁLISIS DEMICROARRAY

Page 2: ANÁLISIS DE MICROARRAY - UMHsici.umh.es/teaching/doctorate/Functional_Genomics_and... · 2009-02-16 · - Microarray o DNA Chips Definición de Microarray: Conjunto ordenado de moléculas

Introducción

Revoluciones tecnológicas

-70’s Clonaje molecular y secuenciación de DNA

- Secuenciación automática GENÓMICA

- 90’s Reacción en cadena de la polimerasa (PCR)

- Microarray o DNA Chips

Definición de Microarray:Conjunto ordenado de moléculas de DNA de secuencia conocida (cientos a cientos de miles) que se localiza en un lugar preciso de un sustrato, y cuyas características no cambian

Page 3: ANÁLISIS DE MICROARRAY - UMHsici.umh.es/teaching/doctorate/Functional_Genomics_and... · 2009-02-16 · - Microarray o DNA Chips Definición de Microarray: Conjunto ordenado de moléculas

Posibilidades DNA Arrays

1. Identificación de dianas terapéuticas (proteínas que interaccionan con los fármacos)

2. Chips más densos y con mejores diseños para albergar un genoma completo

3. Microarrays de tejidos (estudio de un solo gen en miles de muestras de tejidos)

4. Experimentos más rápidos y baratos

5. Centrar la atención, además de en la expresión génica (más usado), en la copia de genes y en las proteínas

Page 4: ANÁLISIS DE MICROARRAY - UMHsici.umh.es/teaching/doctorate/Functional_Genomics_and... · 2009-02-16 · - Microarray o DNA Chips Definición de Microarray: Conjunto ordenado de moléculas

Formatos array más usados

cDNA microarray

- Localización exacta del cDNA en un soporte sólido

- Obtención del cDNA a partir de mRNA de células control o de

muestra (células enfermas)

- Marcaje fluorescente del cDNA (verde control y rojo muestra)

- Hibridación competitiva de los cDNA marcados contra el array

- Detección de la emisión fluorescente

- Cuantificación de la expresión génica

Affymetrix

- Marcaje de la sonda mediante procesos fotolitográficos

Page 5: ANÁLISIS DE MICROARRAY - UMHsici.umh.es/teaching/doctorate/Functional_Genomics_and... · 2009-02-16 · - Microarray o DNA Chips Definición de Microarray: Conjunto ordenado de moléculas

Diagrama general microarray

Page 6: ANÁLISIS DE MICROARRAY - UMHsici.umh.es/teaching/doctorate/Functional_Genomics_and... · 2009-02-16 · - Microarray o DNA Chips Definición de Microarray: Conjunto ordenado de moléculas

Parámetros a considerar

Page 7: ANÁLISIS DE MICROARRAY - UMHsici.umh.es/teaching/doctorate/Functional_Genomics_and... · 2009-02-16 · - Microarray o DNA Chips Definición de Microarray: Conjunto ordenado de moléculas

Adquisición de datosSe obtienen 2 imágenes:

Imagen roja

Imagen verde

Se realizan tres tareas:

Cuadriculación: asignación de coordenadas

Segmentación: clasificación de los pixels como señal o fondo

Cálculo de intensidad: de fluorescencia del fondo y de la señal

Adicionalmente:

Estimar la calidad de las medidas

Restar el fondo: se resta la fluorescencia de alrededor de la

mancha (hibridación no específica)

Mezcla de imágenes computacional

Quant Array

GenePix

Array Pro

Array Vision

Page 8: ANÁLISIS DE MICROARRAY - UMHsici.umh.es/teaching/doctorate/Functional_Genomics_and... · 2009-02-16 · - Microarray o DNA Chips Definición de Microarray: Conjunto ordenado de moléculas

DNA Array completo

Page 9: ANÁLISIS DE MICROARRAY - UMHsici.umh.es/teaching/doctorate/Functional_Genomics_and... · 2009-02-16 · - Microarray o DNA Chips Definición de Microarray: Conjunto ordenado de moléculas

Sector

Page 10: ANÁLISIS DE MICROARRAY - UMHsici.umh.es/teaching/doctorate/Functional_Genomics_and... · 2009-02-16 · - Microarray o DNA Chips Definición de Microarray: Conjunto ordenado de moléculas

Punto aislado

Page 11: ANÁLISIS DE MICROARRAY - UMHsici.umh.es/teaching/doctorate/Functional_Genomics_and... · 2009-02-16 · - Microarray o DNA Chips Definición de Microarray: Conjunto ordenado de moléculas

NormalizaciónProblemas en la intensidad de fluorescencia

- Eficiencia de marcaje

- Eficiencia de detección

- Concentración inicial de mRNA

- Manipulación de las muestras

FILTRADOEliminar los genes que no cambian la expresión durante el

experimento

NORMALIZACIÓN

FILTRADO+

NORMALIZACIÓN

Simplificación de lacomplejidad de los datos

Page 12: ANÁLISIS DE MICROARRAY - UMHsici.umh.es/teaching/doctorate/Functional_Genomics_and... · 2009-02-16 · - Microarray o DNA Chips Definición de Microarray: Conjunto ordenado de moléculas

Normalización de datos

Page 13: ANÁLISIS DE MICROARRAY - UMHsici.umh.es/teaching/doctorate/Functional_Genomics_and... · 2009-02-16 · - Microarray o DNA Chips Definición de Microarray: Conjunto ordenado de moléculas

Almacenamiento de datosPermite la comparación entre diferentes experimentos de distintos laboratorios

Esfuerzos de estandarización internacional:

- Definición estándar de conjuntomínimo de datos (MIAME)

- Desarrollo de una base de datosrelacional (ArrayExpress)

- Formato de datos intercambiable(MAGE-ML, formato XML)

- Desarrollo de ontología para microarrays

Matriz de expresión génica

Page 14: ANÁLISIS DE MICROARRAY - UMHsici.umh.es/teaching/doctorate/Functional_Genomics_and... · 2009-02-16 · - Microarray o DNA Chips Definición de Microarray: Conjunto ordenado de moléculas

Abordando cuestiones biológicasMetodológicamente se distinguen dos situaciones:

1. Comparación de dos condiciones(muestra frente a referencia)

2. Comparación de varias condiciones(curso temporal, dosis-respuesta,pacientes, tejidos, etc.)

SENCILLO

COMPLEJO

Condiciones

Genes

Filas:Perfiles de expresión génica

Columnas:Condiciones

Page 15: ANÁLISIS DE MICROARRAY - UMHsici.umh.es/teaching/doctorate/Functional_Genomics_and... · 2009-02-16 · - Microarray o DNA Chips Definición de Microarray: Conjunto ordenado de moléculas

Comparación de dos condicionesSituación más sencilla: comparación entre dos muestras independientes

(ej: células normales frente a células tumorales)

Criterios de simplificación:

- Filtrar genes que tengan solo 2 ó 3 veces cambios en laexpresión génica(problemas: cambio pequeños pero significativos, o

grandes cambios no significativos??)- A veces el umbral se elige en función del tipo de ensayo, condiciones, etc

- Técnicas estadísticas estándar (t-test)Produce valor p: probabilidad de que una diferencia observada

se deba al azar. Si p es pequeño, la compa-ración es significativa

Page 16: ANÁLISIS DE MICROARRAY - UMHsici.umh.es/teaching/doctorate/Functional_Genomics_and... · 2009-02-16 · - Microarray o DNA Chips Definición de Microarray: Conjunto ordenado de moléculas

Comparación de condiciones múltiplesPara comparar y clasificar condiciones (columnas) o perfiles de expresión génica (filas) se necesita realizar varios pasos:

- Agrupamiento o Clustering

- Estudio de las series temporales o de dosis respuesta

- Determinación de las redes de interacción génica

Dificultad del agrupamiento o CLUSTERING

- Si se clasifican condiciones: fácil, pocas columnas (<100)

- Si se clasifican patrones de expresión génica: complejo, muchas columnas (>10000)

Page 17: ANÁLISIS DE MICROARRAY - UMHsici.umh.es/teaching/doctorate/Functional_Genomics_and... · 2009-02-16 · - Microarray o DNA Chips Definición de Microarray: Conjunto ordenado de moléculas

DistanciasLa comparación de genes con expresión similar (filas) o la comparación de condiciones con similar expresión (columnas), se hace con una “función de distancia”:

Euclideo:

v1 (e11, e12, e13,…e1n)

v2 (e21, e22, e23,…e2n)

Coeficiente de correlación de Pearson:

Valor -1= correlación negativa

Valor +1= correlación positiva

i

ii eed 2,2,12,1 )(

Page 18: ANÁLISIS DE MICROARRAY - UMHsici.umh.es/teaching/doctorate/Functional_Genomics_and... · 2009-02-16 · - Microarray o DNA Chips Definición de Microarray: Conjunto ordenado de moléculas

Agrupamientos sin supervisión- Técnicas que producen un ordenamiento de datos basado en una función de distancia.

- No usan información externa para construir los grupos

- Existen dos tipos de métodos:

Jerárquicos

No jerárquicos

Page 19: ANÁLISIS DE MICROARRAY - UMHsici.umh.es/teaching/doctorate/Functional_Genomics_and... · 2009-02-16 · - Microarray o DNA Chips Definición de Microarray: Conjunto ordenado de moléculas

Tipos de agrupamientosJerárquicos: (más usados)

- No predetermina el número de grupos- Detectan relaciones de orden superior entre grupos de perfiles- Producen una representación de árbol binario (dendograma)- Son de dos tipos:

-Aglomerativos: cada gen es un cluster que se van agrupando en clusters cada vez mas grandes

- Divisivos: Hay un cluster con todos los genes, que se van rompiendo en otros mas pequeños

No Jerárquicos:

- Agrupa los perfiles de expresión en un número definido de grupos, pero no asume ninguna relación entre los clusters

PCA, SVD No jerárquicoK-promedio, quality clusters No jerárquicoAverage linkage JerárquicoSOM No jerárquico Redes neuronalesSOTA Jerárquico Redes neuronales

Métodos de clustering más usados

Page 20: ANÁLISIS DE MICROARRAY - UMHsici.umh.es/teaching/doctorate/Functional_Genomics_and... · 2009-02-16 · - Microarray o DNA Chips Definición de Microarray: Conjunto ordenado de moléculas

Agrupamiento jerárquicoDENDOGRAMA

Page 21: ANÁLISIS DE MICROARRAY - UMHsici.umh.es/teaching/doctorate/Functional_Genomics_and... · 2009-02-16 · - Microarray o DNA Chips Definición de Microarray: Conjunto ordenado de moléculas

Redes NeuralesSimilitud entre una neurona biológica y una red neural

Ambos reciben entrada de información por diversos lugares, y la señal avanza por la neurona y sale por el otro extremo, habitualmente modulada. En el sistema biológico la señal es inicialmente química, recibida vía sinapsis, y puede ser convertida en un pulso eléctrico (potencial de acción). Sin embargo, la señal final que viaja a través del axón receptor es dependiente de la suma de la entrada de las sinapsis. Hay por tanto un valor crítico (umbral) que se debe exceder para que el axón dispare la señal. Una vez disparado, lo puede hacer varias veces por segundo. Este tipo de disparo se simula en la red neural

Page 22: ANÁLISIS DE MICROARRAY - UMHsici.umh.es/teaching/doctorate/Functional_Genomics_and... · 2009-02-16 · - Microarray o DNA Chips Definición de Microarray: Conjunto ordenado de moléculas

Métodos de redes neuronalesSe pueden aplicar a gran cantidad de datos, muy ruidosos, mal definidos y con distribuciones estadísticas no paramétricas

SOM: (problemas)

- Necesita un número de clusters predefinido

- Agrupamientos no proporcionales con datos heterogéneos

SOTA: (ventajas)

- Agrupamientos proporcionales con datos heterogéneos

- Independencia de perfiles muy repetidos

Los clusters originados se chequean con técnicas de muestreo como:

* Bootstrap

* Test de permutación

Page 23: ANÁLISIS DE MICROARRAY - UMHsici.umh.es/teaching/doctorate/Functional_Genomics_and... · 2009-02-16 · - Microarray o DNA Chips Definición de Microarray: Conjunto ordenado de moléculas

Agrupamiento con supervisiónPara la mayoría de los problemas biológicos existe ya algún tipo de información disponible, que se puede usar para generar los clusters y clasificar nuevos datos

Son algoritmos de “aprendizaje”, capaces de leer patrones específicos previamente establecidos y compararlos con los datos nuevos y decidir si se ajustan al patrón

Tipos:

* SVM

* Perceptrons

Page 24: ANÁLISIS DE MICROARRAY - UMHsici.umh.es/teaching/doctorate/Functional_Genomics_and... · 2009-02-16 · - Microarray o DNA Chips Definición de Microarray: Conjunto ordenado de moléculas

SVM (algoritmo aprendizaje)

- Solo maneja dos capas a la vez

La línea de discriminación se llama a menudo hiperplano es simplemente un clasificador. Cualquier cosa en cada lado es clasificada con una decisión binaria (sí o no).

En un caso mas complejo, la línea no sería del tipo y=mx+c, sino de tipo polinomial. El problema puede venir para encontrar la clase de clasificador.

Page 25: ANÁLISIS DE MICROARRAY - UMHsici.umh.es/teaching/doctorate/Functional_Genomics_and... · 2009-02-16 · - Microarray o DNA Chips Definición de Microarray: Conjunto ordenado de moléculas

Perceptrons (aprendizaje)- Puede manejar varias capas a la vez

- Los nodos de entrada de información x, y, z se cambian por W y se introducen en el nodo 4 (el nodo de salida). En muchas arquitecturas neurales cada entrada se suma para dar el valor del nodo de salida. W puede tener valores diferentes para cada conexión

Page 26: ANÁLISIS DE MICROARRAY - UMHsici.umh.es/teaching/doctorate/Functional_Genomics_and... · 2009-02-16 · - Microarray o DNA Chips Definición de Microarray: Conjunto ordenado de moléculas

Redes génicasSe pretende crear un modelo de interacciones entre genes a partir de los perfiles de expresión génica

Redes Booleanas:

- Necesitan muchos puntos experimentales (2N para N genes) (!!!)

- Necesidad de introducir restricciones (conocimiento del sistema)

(el número de puntos requeridos disminuye)

Sistemas de ecuaciones diferenciales

Teoría electrónica de circuitos

Page 27: ANÁLISIS DE MICROARRAY - UMHsici.umh.es/teaching/doctorate/Functional_Genomics_and... · 2009-02-16 · - Microarray o DNA Chips Definición de Microarray: Conjunto ordenado de moléculas

CONCLUSIONES• El objetivo último es convertir los datos en información y esta en conocimiento

• Los métodos comentados son solo una pequeña parte de los que existen actualmente

• Estos métodos representan la primera generación de herramientas de análisis. En la actualidad están evolucionando a gran ritmo.

• Se están haciendo grandes esfuerzos para conseguir la máxima automatización posible

• Se persigue la resolución de problemas como la detección del nombre de las proteínas, interacción de proteínas, bases de datos de conocimiento y herramientas de búsqueda de texto.

Page 28: ANÁLISIS DE MICROARRAY - UMHsici.umh.es/teaching/doctorate/Functional_Genomics_and... · 2009-02-16 · - Microarray o DNA Chips Definición de Microarray: Conjunto ordenado de moléculas
Page 29: ANÁLISIS DE MICROARRAY - UMHsici.umh.es/teaching/doctorate/Functional_Genomics_and... · 2009-02-16 · - Microarray o DNA Chips Definición de Microarray: Conjunto ordenado de moléculas

Normalización LowessFigure 1. Subtracting a Lowess curve (left red line) from the data to linearise (normalise) it. Picture adapted from Lorenz Wernisch's (Birkbeck Univ.) website.

Figure 2. 2D normalisation works by fitting a Lowess (Loess) surface to the arrays to correct for uneven hybridisation. Distribution of log2(R/G) values across the array correct for error by fitting a 2D Lowess (Loess) surface and correct by subtraction. The contours denote subtraction levels. Picture adapted from Lorenz Wernisch's (Birkbeck Univ.) website.

Page 30: ANÁLISIS DE MICROARRAY - UMHsici.umh.es/teaching/doctorate/Functional_Genomics_and... · 2009-02-16 · - Microarray o DNA Chips Definición de Microarray: Conjunto ordenado de moléculas

El Algoritmo SOM1. Initialise the topology of the map. This may

mean initialising the weight vectors to randomised values.

2.Decide on appropriate g and r values (and neighbourhood criterion) The learning or gain rate (g) and The neighbourhood size (r)

3. For each input node: Find the shortest distance to any output

node. Modify the winner node's weight

according to the current state of g. Modify the neighbouring node's weights

according to the current state of r. Go to the next unvisited input node. If

there are no unvisited input nodes left then go back to the very first one and go to Step 4.

4.When a previously visited node has been reached, incrementally decrease g and r

Page 31: ANÁLISIS DE MICROARRAY - UMHsici.umh.es/teaching/doctorate/Functional_Genomics_and... · 2009-02-16 · - Microarray o DNA Chips Definición de Microarray: Conjunto ordenado de moléculas

PCA – SVD – Promedio-K

PCA

SVD

K-promedio

Page 32: ANÁLISIS DE MICROARRAY - UMHsici.umh.es/teaching/doctorate/Functional_Genomics_and... · 2009-02-16 · - Microarray o DNA Chips Definición de Microarray: Conjunto ordenado de moléculas

The dyes enable the amount of sample bound to a spot to be measured by the level of fluorescence emitted when it is excited by a laser. If the RNA from the sample in condition 1 is in abundance, the spot will be green, if the RNA from the sample in condition 2 is in abundance, it will be red. If both are equal, the spot will be yellow, while if neither are present it will not fluoresce and appear black. Thus, from the fluorescence intensities and colours for each spot, the relative expression levels of the genes in both samples can be estimated.

Page 33: ANÁLISIS DE MICROARRAY - UMHsici.umh.es/teaching/doctorate/Functional_Genomics_and... · 2009-02-16 · - Microarray o DNA Chips Definición de Microarray: Conjunto ordenado de moléculas

Microarrays are already producing massive amounts o靐 data. These data, like genome sequence data, can help us to gain insights into underlying biological processes only if they are carefully recorded and stored in databases, where they can be queried, compared and analysed by different computer software programs. The EBI is currently establishing a public repository for microarray gene expression data ArrayExpress, analogous to EMBL-bank for DNA sequence data. In many respects gene expression databases are inherently more complex than sequence databases (this does not mean that developing, maintaining and curating the sequence databases are any less challenging).

ArrayExpress

Page 34: ANÁLISIS DE MICROARRAY - UMHsici.umh.es/teaching/doctorate/Functional_Genomics_and... · 2009-02-16 · - Microarray o DNA Chips Definición de Microarray: Conjunto ordenado de moléculas

Conceptually, a gene expression database can be regarded as consisting of three parts – the gene expression data matrix, gene annotation and sample annotation, see picture below.

gene expression database

Page 35: ANÁLISIS DE MICROARRAY - UMHsici.umh.es/teaching/doctorate/Functional_Genomics_and... · 2009-02-16 · - Microarray o DNA Chips Definición de Microarray: Conjunto ordenado de moléculas

ArrayExpress is storing all this information, the details of which is called Minimum Information About a Microarray Experiment (MIAME) defined by the Microarray Gene Expression Database (MGED) consortium. MGED is a grass roots movement that was founded at a meeting at the EBI in 1999, is supported by most of the important players in the microarray community, and has evolved far beyond the EBI.

Another repository for gene expression data GEO is being developed at NCBI in the US. DDBJ in Japan also have plans. All three groups face similar problems and are involved in MGED to some degree. A common data exchange format MAGE-ML is being developed in collaboration between MGED (with active participation of the EBI) and some major microarray companies.

Page 36: ANÁLISIS DE MICROARRAY - UMHsici.umh.es/teaching/doctorate/Functional_Genomics_and... · 2009-02-16 · - Microarray o DNA Chips Definición de Microarray: Conjunto ordenado de moléculas

Capturing and storage of microarray data is not an end in itself. The amounts of data from even a single microarray experiment are so large, that software tools have to be used to make any sense out of it. Clustering and class prediction are typical methods currently used in gene expression data analysis (see Microarray Data Analysis). One of the popular gene expression data analysis tools is Expression Profiler , developed at the EBI. The Microarray Informatics Team at the EBI is actively working in many microarray data analysis areas using this and other tools.

An example of such research is an approach to reverse engineering of gene regulatory networks, which is based on the hypothesis that genes that have similar expression profiles (i.e., similar rows in the gene expression matrix) should also have similar regulation mechanisms as there must be a reason why their expression is similar under a variety of conditions. Therefore, if we cluster the genes by similarities in their expression profiles and take sets of promoter sequences from genes in such clusters, some of these sets of sequences may contain a ‘signal’ as a specific sequence pattern such as a particular substring, which is relevant to regulation of these genes (Vilo et al. 2000).

GENE EXPRESSION DATA ANALYSIS AND EXPRESSION PROFILER

Page 37: ANÁLISIS DE MICROARRAY - UMHsici.umh.es/teaching/doctorate/Functional_Genomics_and... · 2009-02-16 · - Microarray o DNA Chips Definición de Microarray: Conjunto ordenado de moléculas

MICROARRAYS AND GENE EXPRESSION DATABASES

Microarrays exploit the preferential binding of complementary single-stranded nucleic acid sequences. A microarray is typically a glass slide, on to which DNA molecules are attached at fixed locations (spots). There may be tens of thousands of spots on an array, each containing a huge number of identical DNA molecules (or fragments of identical molecules), of lengths from twenty to hundreds of nucleotides.

For gene expression studies, each of these molecules ideally should identify one gene or one exon in the genome, however, in practice this is not always so simple and may not even be generally possible due to families of similar genes in a genome. Microarrays that contain all of the approximate 6000 genes of the yeast genome have been available since 1997. The spots are either printed on the microarrays by a robot, or synthesised by photo-lithography (similarly as in computer chip productions) or by ink-jet printing

Page 38: ANÁLISIS DE MICROARRAY - UMHsici.umh.es/teaching/doctorate/Functional_Genomics_and... · 2009-02-16 · - Microarray o DNA Chips Definición de Microarray: Conjunto ordenado de moléculas

There are different ways how microarrays can be used to measure the gene expression levels. One of the most popular micorarray applications allows the comparison of gene expression levels in two different samples, e.g., the same cell type in a healthy and diseased state (see picture below).

The total mRNA from the cells in two different conditions is extracted and labelled with two different fluorescent labels: for example a green dye for cells at condition 1 and a red dye for cells at condition 2 (to be more accurate, the labelling is typically done by synthesising single stranded DNAs that are complementary to the extracted mRNA by a enzyme called reverse transcriptase). Both extracts are washed over the microarray. Labelled gene products from the extracts hybridise to their complementary

Usos de los microarray