LEZIONE 4 Anno Accademico 2010/11 BIOTECNOLOGIE FARMACOLOGICHE CORSO DI LAUREA SPECIALISTICA IN BIOTECNOLOGIE DEL FARMACO
LEZIONE 4Anno Accademico 2010/11
BIOTECNOLOGIE FARMACOLOGICHECORSO DI LAUREA SPECIALISTICA IN BIOTECNOLOGIE DEL FARMACO
Le sfide per il futuro del progetto genoma umano
• comprendere le componenti strutturali e funzionali del genoma
• capire come le reti di geni e proteine contribuiscono alla definizione del fenotipo
• comprendere cosa determina le variazione nella trasmissione dei caratteri genetici
• identificare le varianti genetiche che contribuiscono al mantenimento dello stato di salute
• determinare strategie per identificare il rischio di malattia• stabilire strategie per l’identificazione del contributo del
genoma nella determinazione delle patologie e delle risposte alla terapia
• utilizzare le conoscenze genetiche per lo sviluppo di farmaci innovativi
I farmaci attualmente sul mercato agiscono su circa 500 prodotti genici
Considerando che il genoma umano contiene circa 20-30.000 geni che codificano per proteine, il potenziale per lo sviluppo di nuovi farmaci è evidente
GENOMATICA FUNZIONALE
Studio di funzione genica
LA RICERCA DELLA FUNZIONE DEI GENI
La tradizione:
ricerca di di mutazioni per identificare perdite o acquisizione di funzioni
I metodi della genetica all’incontrario:
Generare nuovi organismi geneticamente modificati per studiare perdita o acquisizione di funzioni
Metodologie innovative:
Studio comparativo di popolazioni di prodotti genici
La tradizione:
ricerca e analisi di mutazioni e polimorfismi (es RFLP; SNP) del genoma stesso
Siti polimorfici
• 99.99 % della sequenza del DNA di due individui e’ identica
• la maggioranza delle differenze (0.01%) coinvolgono singole sostituzioni
Polimorfismi al taglio con enzimi di restrizione (RFLP)
Single nucleotide polymorphysm (SNP)
Polimorfismi al taglio con enzimi di restrizione (RFLP)
Allele 1 Allele 2*
Polimorfismi al taglio con enzimi di restrizione (RFLP)
associazione RLFP-patologia
Famiglia Patol.
sani
variab nella popol.
The Lod (log of odds) score is used to calculate the probability of a pedigree arising randomly or by genetic linkage. The test was developed by Newton and Morton
In practice, linkage is declared if the LOD score is equal to or greater than 3 (i.e. the likelihood of observing the result if the two loci are not linked is less than 1 in 1000). On the other hand, linkage can be completely excluded if the LOD score is strictly below -2.
LOD = log Probability of birth sequence with a given linkage value
Probability of birth sequence with no linkage
Studio di funzione genica Localizzazione posizionale di geni/malattia
Studio di linkage familiare con polimorfismi
Inheritance pattern – dominant autosomal Entirely penetrant and fatal Frequency - about 1/10,000 live births Late onset - age 35 to 45 Because of late onset, many have children before symptoms appear
Families with a history of Huntington's disease :Indiana University maintains a National Research Roster for Huntington's Patients Large family with a history of Huntington's disease discovered living on shore of lake Maracaibo in Venezuela
For both families with a history of Huntington's disease: Blood samples taken from each member Permanent cell lines established Each family member analyzed by a neurologist for disease symptoms Paternity verified
Huntington, la malattia ideale per position cloning
1981 - Gusella's group started with a group of anonymous probes that uncovered RFLPs - very few available.
the 12th probe they tried -called G8 - indicated linkage. Disease associated with the A haplotype in the American family and the C haplotype in the Venezuelan family.
LOD Scores 1983 - G8 (also called D4S10) mapped approximately 4 cM from the HD locus. It took 10 more years to clone the gene.
1986-87 DNA markers were used and D4S10 was localized by in situ hybridization and somatic cell genetics to chromosome region 4p16.3; Further linkage studies for isolating HDIdentification of Putative Coding Sequences Exon Trapping; Use trapped exons to identify candidate genes from cDNAs; Four transcripts were analyzed; IT15 - Huntingtin
Gusella JF, Wexler NS, Conneally PM, Naylor SL, Anderson MSA, Tanzi RE, Walkins PC, et al (1983) A polymorphic DNA marker genetically linked to Huntington's disease. Nature 306:234-238
Huntingtin DNA, protein and uses thereof US Patent Issued on November 11, 1997 Inventor(s): Marcy E. MacDonald; Christine M. Ambrose; Mabel P. Duyao; James F. GusellaAssignee: The General Hospital CorporationApplication: No. 246982 filed on 1994-05-20
Metodi di identificazione di SNP
Siti polimorfici per singola sostituzione di base (SNP)
•di base
Nel genoma umano ci sono 200.000 SNP
all’interno di sequenze codificanti, alcuni di questi possono essere
marcatori di patologia
http://www.ncbi.nlm.nih.gov/About/primer/snps.html
polimorfismo a singolo nucleotide
Gli SNP sono la causa di circa il 90% della variabilità genetica umana ed in genere si trova uno SNP ogni 100-300 pb. 2/3 SNP vedono sostituita la C con T.
Siti polimorfici per singola sostituzione di base (SNP)
Individuo 1
Individuo 2
Perchè una variazione possa essere considerata un SNP deve essere presente in almeno l’1% della popolazione
IBRIDAZIONE ALLELE-SPECIFICA
REAZIONE DI ELONGAZIONE DI PRIMER FISSATO SU SUPPORTO SOLIDO
Michiel J. T. van Eijk*, et al. NAR 2004
AT CGTAGC
TA5’GC
3’
TG5’
AC 3’
DNA is denatured and mixed with oligonudeotides and ligase. The ligase joins pairs of oligonudeotides annealed head to tail if they are correctly base-paired at the junction. Radioactively labeled
oligonudeotides (*) are immobilized and detected by autoradiography only if ligated to biotinylated oligonucleotides (B)
that can be bound to streptavidin on a solid support.LANDEGREN, et al. Science 1998
BANCHE DATI E IDENTIFICAZIONE DI SNP
dbSNP sono presenti (“annotati”) in diverse banche dati quali: PubMed,
genome project sequences, GenBank records,
the Entrez Gene database, and the dbSTS database of sequence tagged sites.
Metodologie innovative:
Studio comparativo di popolazioni di prodotti genici
• genomatica comparativa
• generazione di arrays per lo studio comparato di espressione genica
analisi basata sulla omologia di geni codificanti proteine a funzione nota
Genomatica comparativa:
Ortologo e paralogo
• Ortologhi – geni omologi con la stessa funzione in organismi diversi
• Paraloghi – geni all’interno dello stessoorganismo derivanti da duplicazione genica
Geni ortologhi o paraloghi
ARRAY
MACROARRAY
MICROARRAY
DNA microarray (o gene/genome chip, DNA chip, o gene array) è una collezione di depositi puntiformi di DNA, ciascun punto
rapresentante un singolo gene immobilizzati su un supporto (vetro,
plastica o silicone) mediante legami di tipo irreversibile.
Esempio di microarray con 40.000 oligo immobilizzati su supporto solido e ibridati con cDNA
APPLICAZIONI DI ARRAY:
• SNP detection arrays – per identificare polimorfismi di singoli nucleotidi nel genoma di diverse popolazioni
• ibridazione genomica comparativa (Array CGH) – per identificare riarragiamenti coinvolgenti un numero significtativo di basi
• mRNA or gene expression profiling – per studiare i livelli di espressione di migliaia di geni simultaneamente
• Chromatin immunoprecipitation (chIP) studies – per determinare il legame di specifche proteine in porzioni specifiche del DNA (ChIP-on-chip technology)
mRNA or gene expression profiling
Clustered Image Maps
Drugs x CellsGenes x Cells
Genes x Drugs
Database Microarray Experiment Sets Sample Profiles
Genomics and bioinformatics group NCI and NIH
Studio di proteine che interagiscono con DNA
ChIP-on-chip (o ChIP-chip) è una tecnica che combina la immunoprecipitazione di cromatina (chromatin immunoprecipitation)
"ChIP” con la tecnologia del micro array (“chip").
Chip-on-chip analysis per lo studio delle interazioni DNA proteine
read-outNormalizzazione dei dati
e analisi esplorativa dei dati
“estrazione delle informazioni”Sito DNA
arricchimento proteina di interesse