This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
ANALYSE DE LA FONCTION D’UN GENE .................................................................................................................. 6 STRATEGIE BASEES SUR L’HYBRIDATION D’ARN ............................................................................................................... 6
L’interférence d’ARN (RNAi) ......................................................................................................................................... 6 LE KNOCK-OUT OU L’INVALIDATION D’UN GENE PAR RECOMBINAISON HOMOLOGUE ...................................................... 10
La recombinaison homologue : un mécanisme à l’origine de la technologie de Knock-out ........................................ 10 Les souris KO ............................................................................................................................................................... 11 Les cellules ES ............................................................................................................................................................. 11 Fabrication de souris transgéniques ............................................................................................................................ 12 L’interruption d’un exon : knock-out de gène .............................................................................................................. 12 Création de mutation ponctuelle .................................................................................................................................. 13 Le système Cre/Lox ...................................................................................................................................................... 14 Exemple d’application ................................................................................................................................................. 15 Mutation propre ........................................................................................................................................................... 15 Large délétion ou translocation ................................................................................................................................... 15 Les possibilités d’induction de la cre recombinase ...................................................................................................... 16 Le système tet-on .......................................................................................................................................................... 16
DETECTION DES MUTATIONS / POLYMORPHISMES ........................................................................................... 17 I) DETECTION DES MUTATIONS ......................................................................................................................................... 17
Méthodes basées sur la séquence ................................................................................................................................. 17 Méthodes basées sur l’hybridation .............................................................................................................................. 19 Méthodes basées sur la PCR ........................................................................................................................................ 24 Ligation ........................................................................................................................................................................ 26 RFLP ............................................................................................................................................................................ 27 Méthodes basées sur la conformation de l’ADN .......................................................................................................... 28 Hétéroduplex sensibilité à une coupure ....................................................................................................................... 29
II ) ANALYSE DU POLYMORPHISME ................................................................................................................................... 32 Protéines ...................................................................................................................................................................... 32 Analyse des fragments de restriction ........................................................................................................................... 32 Génotypage et cartographie génétique ........................................................................................................................ 34 Les micro et minisatellites ............................................................................................................................................ 35 MAAP (Multiple Arbitrary Amplification profiling) .................................................................................................... 37
III) DETECTION D'UNE SEQUENCE ..................................................................................................................................... 38 EXPRESSION DES PROTEINES RECOMBINANTES .............................................................................................. 39
INTRODUCTION ................................................................................................................................................................. 39 RAPPELS SUR LA TRADUCTION .......................................................................................................................................... 39
Les événements de la traduction .................................................................................................................................. 39 Régulation de la traduction .......................................................................................................................................... 44 Compartimentalisation et modifications post-traductionelles ..................................................................................... 48
EXPRESSION TRANSITOIRE A PARTIR D'UN ARNM OU D'UN ARN IN VITRO (CRNA) ......................................................... 50 Obtention d'un cRNA. ................................................................................................................................................... 50 Traduction en milieu cellulaire. L’ovocyte de Xénope ................................................................................................. 54
EXPRESSION EN SYSTEME PROCARYOTE ........................................................................................................................... 55 I) Escherichia coli ........................................................................................................................................................ 55 II) Autres bactéries utilisées en production de protéines ............................................................................................. 66
EXPRESSION EN SYSTEME EUCARYOTE : LES CHAMPIGNONS ............................................................................................. 70 les levures ..................................................................................................................................................................... 70 Les champignons filamenteux ...................................................................................................................................... 76
24/10/2011 3
Dictyostelium discoideum ............................................................................................................................................ 76 LES CELLULES VEGETALES ............................................................................................................................................... 78 LES CELLULES D'INSECTES ................................................................................................................................................ 80
a) Baculovirus. ............................................................................................................................................................. 80 b) Cellules d’insecte ayant intégré le gène d’intérêt dans leur génome ....................................................................... 85
LES CELLULES DE VERTEBRES ........................................................................................................................................... 87 1) L'ovocyte de Xénope ................................................................................................................................................ 87 2) Cellules de mammifère ............................................................................................................................................. 87
EXPRESSION DANS DES EUCARYOTES UNICELLULAIRES .................................................................................................. 103 LES CAUSES D'ECHECS DE LA PRODUCTION DE PROTEINES. ............................................................................................. 104
1) Il n’y a pas ou peu de protéine ............................................................................................................................... 104 2) La protéine est produite mais est toxique .............................................................................................................. 108 3) La protéine est surexprimée mais est mal repliée .................................................................................................. 110 4) La protéine est produite mais est protéolysée ........................................................................................................ 112 5) Les maturations post-traductionelles ne sont pas correctes .................................................................................. 113 6) La protéine est produite mais on ne sait pas la détecter ........................................................................................ 115 7) La protéine est produite mais on ne sait pas la purifier ........................................................................................ 116 8) La protéine est produite mais il existe aussi des protéines proches produites par la cellule, des endogènes ....... 117 9) Problème particulier lié à l'utilisation de la protéine chez l'homme ..................................................................... 117
TAG, PROTEASES ET ACIDES AMINES MODIFIES ............................................................................................. 118 LES TAG ........................................................................................................................................................................ 118 LES PROTEASES ............................................................................................................................................................... 124 INTEIN ............................................................................................................................................................................. 125 LES ACIDES AMINES MODIFIES ........................................................................................................................................ 127
PURIFICATION DES PROTEINES RECOMBINANTES .......................................................................................... 129 DETERMINATION DE LA CONCENTRATION EN PROTEINE .................................................................................................. 129
La spectrophotométrie UV ......................................................................................................................................... 129 La fluorimétrie ........................................................................................................................................................... 129 Les méthodes colorimétriques .................................................................................................................................... 130
SOLUBILISATION DES PROTEINES .................................................................................................................................... 131 Extraction des protéines cellulaires ........................................................................................................................... 131 Solubilisation et renaturation des corps d’inclusion .................................................................................................. 133
LA CONCENTRATION DES PROTEINES .............................................................................................................................. 136 LES DIFFERENTES METHODES DE SEPARATION DES PROTEINES ....................................................................................... 137
La chromatographie ................................................................................................................................................... 137 L’électrophorèse ........................................................................................................................................................ 138 Séparation selon la taille ........................................................................................................................................... 139 Séparation selon la charge ......................................................................................................................................... 140 Séparation selon la taille et la charge........................................................................................................................ 141 Séparation selon l’hydrophobicité ............................................................................................................................. 141 Séparation selon l’affinité .......................................................................................................................................... 142 Séparation par des colorants ..................................................................................................................................... 144
EVALUATION DE LA PURETE ........................................................................................................................................... 144 CARACTERISATION DES PROTEINES ................................................................................................................................. 145 STABILISATION DES PROTEINES ...................................................................................................................................... 147
Stabilisation des protéines par l’utilisation d’additifs. .............................................................................................. 148 Stabilisation des protéines par mutagenèse dirigée ................................................................................................... 149
ANALYSE DES INTERACTIONS ENTRE MACROMOLECULES ........................................................................ 153 INTERACTIONS ACIDES NUCLEIQUE-PROTEINE ................................................................................................................ 153
Criblage de banque d’expression : ......................................................................................Erreur ! Signet non défini. Simple Hybride .....................................................................................................................Erreur ! Signet non défini. Triple hybride .......................................................................................................................Erreur ! Signet non défini. South-Western ......................................................................................................................Erreur ! Signet non défini.
24/10/2011 4
SELEX ..................................................................................................................................Erreur ! Signet non défini. Immunoprécipitation de chromatine ....................................................................................Erreur ! Signet non défini. Electrophoretic Mobility Shift Assay (EMSA) - gel retard ...................................................Erreur ! Signet non défini. Footprint – empreinte sur l’ADN .........................................................................................Erreur ! Signet non défini. BIAcore ................................................................................................................................Erreur ! Signet non défini.
INTERACTIONS PROTEINE - PROTEINE .............................................................................................................................. 183 Introduction ................................................................................................................................................................ 183 Démarche expérimentale permettant de mettre en œuvre puis de caractériser une interaction protéine – protéine .............................................................................................................................................Erreur ! Signet non défini. Méthodes permettant s’assurer que la protéine appartient à un complexe et de déterminer la taille de ce complexe .............................................................................................................................................Erreur ! Signet non défini. Méthodes permettant d’isoler un complexe protéique .........................................................Erreur ! Signet non défini. Cross-linking (association par des agents pontants .............................................................Erreur ! Signet non défini. Identification des protéines du complexe .............................................................................Erreur ! Signet non défini. Vérification de l’interaction in vivo .....................................................................................Erreur ! Signet non défini. Méthodes permettant d’identifier un partenaire protéique tout en isolant son ADNc .........Erreur ! Signet non défini.
INDEX ............................................................................................................................................................................... 222
24/10/2011 5
24/10/2011 6
Conservartion de l’interférence chez les eucaryotes
Analyse de la fonction d’un gène
Plusieurs approches peuvent être envisagées pour aborder la fonction d’un gène. Les
techniques de biologie moléculaire et de biochimie permettant par exemple de localiser l’expression
d’un gène ou son produit (Northern, western, hybridation in situ, immunofluorescence …), de
déterminer la structure de la protéine (RMN, cristallographie …) ou de trouver des partenaires
protéiques (double hybride, immunoprécipitation …) donnent des informations importantes sur la
fonction d’un gène. D’autres stratégies basées sur des modifications de l’expression d’un gène ou sur
une modification de l’activité de la protéine permettent d’approfondir cette étude.
Un gène dans une cellule ou un organisme peut être soit surexprimé soit supprimé et, dans ce
dernier cas, on regroupe les stratégies sous le nom d’interruption de gène. L’analyse (difficile
certaines fois) du phénotype qu’engendrent ces modifications devrait permettre d’accéder à la (ou
les) fonction(s) du gène.
Stratégie basées sur l’hybridation d’ARN
L’interférence d’ARN (RNAi)
Le phénomène d’interférence d’ARN (RNAi) découvert par Fire et al. (1998) chez le nématode
Caenorhabditis elegans désigne l’inhibition
génique post-transcriptionnelle induite par de
l’ARN double brins (ARNdb). C’est à dire
que la présence dans une cellule d’un ARN
db conduit dans certaines conditions à la
dégradation spécifique de l’ARN messager
de séquence identique (à l’un des brins). Ce
mécanisme, qui semble être un moyen de
résistance vis-à-vis de virus et des
transposons chez les eucaryotes (hormis la levure), est à la base d’une stratégie actuellement
largement utilisé pour cibler la dégradation d’un ARNm dont on cherche la fonction. De par sa
24/10/2011 7
Complexe enzymatique Dicer
siRNA
Clivage de l ’ARNdb
Ciblage de l ’ARNm
Complexe RISCBrin antisens du siRNA
Clivage de l ’ARNm
ARNm dégradé
Poly(A)
grande spécificité d’action et sa relativement bonne efficacité d’inhibition la stratégie de RNAi a
supplanté l’utilisation d’ARN antisens.
Le RNAi est un processus en 2 étapes qui commence à être caractérisé. Dans la première
étape les longues molécules d’ARNdb sont clivées par la protéine Dicer (une nucléase de la famille
des RNases-III) en petits fragments d’ARNdb de 21 à 25
nucléotides de long : les siRNA (small interfering
RNAs). Dans la seconde étape, les siRNA sont
incorporés dans un complexe ribonucléasique, le
complexe RISC (RNA-induced silencing complex), qui
va guider les siRNA sur l’ARNm de séquence
homologue. Le brin antisens des siRNA s’apparie à
l’ARNm cible ce qui provoque son clivage (par Dicer)
au milieu de la zone d’appariement, et donc
l’impossibilité de traduire la protéine.
Amplification des siRNA
Chez C. elegans, il n’y a besoin d’une très faible quantité de siRNA pour oberver une
inhibition de la traduction d’un gène. Par exemple, on peut inhiber un gène du nématode en le
nourissant avec des bactéries qui expriment des RNAdb, et 2 molécules d’ARNdb suffisent à éteindre
un gène fortement exprimé tel que unc-22 gène codant pour une protéine musculaire. Cette puissance
d’action est retrouvée chez les plantes et le champignon Neurospora mais pas chez la drosophile ni
les cellules de mammifères. Ce faible besoin en siRNA pour observer un effet, rend leur action
transmissible à la descendance, les siRNA se retrouve dans les cellules germinales.
Pour isoler la protéine responsable de
l’amplification des siRNA, une approche génétique a
été faite chez Neurospora par une une analyse de
mutants déficients. Ceci a permis d’identifier un
gène codant pour une enzyme responsable du
phénomène d’amplification observé. Il s’agit d’une
RNA polymérase RNA dépendante (RdRP) présente
chez les plantes et chez le nématode mais absente
ARNdb
Dicer
Clivage de la cible
RISCComplexe siRNA actif
siRNA secondaire
Synthèse d ’ARNpar une RdRP
24/10/2011 8
U5’3’U(N19)
3’ U 5’U (N’19)
chez la drosophile ou les vertébrés. Cette enzyme est capable de synthétiser un ARN complémentaire
à partir d’un ARN matrice et d’une amorce provenant d’un siRNA. Ceci entraîne la production
d’ARNdb qui sera à son tour clivé par l’enzyme dicer pour donner des siRNA secondaires qui eux
même pouront servir d’amorce à une nouvelle polymérisation d’ARNdb. Ce système d’amplification
rends l’utilisation d’ARNdb très efficace pour inhiber un gène chez C. elegans.
Les longs ARNdb sont aussi couramment utilisés aussi chez la drosophile ou dans les cellules
de drosophile en culture (cellule S2). Cependant, chez les mammifères, l’utilisation de longs ARNdb
entraîne des effets non spécifiques tels que l’activation de la production d’interferon avec l’induction
d’une protéine kinase ARN dépendante (PKR) conduisant à la dégradation non spécifique de tous les
ARNm, puis à l’apoptose des cellules. Pour remédier à ce problème, le groupe de T. Tuschl en 1999,
a montré que l’on pouvait l’utiliser directement des siRNA et non de longs ARNdb.
Pratiquement, les siRNA peuvent être obtenus de différentes manières :
- par synthèse chimique
- par clivage in vitro de long ARNdb (à l’aide de l’enzyme Dicer recombinante)
- par l’utilisation de vecteurs codant des ARN tige boucle
Synthèse de siRNA
Les siRNA peuvent s’acheter chez de nombreux fournisseurs ; il suffit de donner les
séquences sens et antisens. La figure montre la
structure d’un siRNA synthétique, composé de 21
nucléotides de longueur hybridant sur 19 nucléotides
avec 2 U sortant en 3’. Generallement on remplace les
2 U par 2 T ce qui permet une meilleure stabilité des siRNA pour un coup moindre.
Il a été montré de façon empirique que le choix de la séquence cible était très important pour
l’efficacité de l’inhibition. Le siRNA doit être choisi dans l’ORF (cadre ouvert de lecture)
préférentiellement au milieu de la séquence codante, 100 nucléotides après l’AUG et 100 avant le
stop. Actuellement il se développe des logiciels pour dessiner les siRNA à partir de la séquence d’un
ARNm.
Les paramètres à prendre en compte lors du choix d’un siRNA
- Pourcentage en GC
24/10/2011 9
- Recherche dans les banques de données afin de s’assurer de la spécificité d’inhibition
- Choix d’une méthode de transfection efficace en fonction du type cellulaire.
Clivage in vitro de longs ARNdb :
Une stratégie utilisée avec succès permet de synthétiser in vitro
des siRNA en ultilisant l’enzyme Dicer qui est produite par
génie génetique (protéine recombinante).
Principe : l’ADNc du gène à éteindre (ou uniquement son
ORF) est cloné dans un vecteur comprenant deux promoteurs
phagiques. Les ARN sens et antisens sont transcrits in vitro et
hybridés en solution. L’enzyme Dicer est rajoutée à l’ARN
puis le siRNA sont purifiés et transfectés.
L’avantage de cette approche est que l’on synthétise en
quelque sorte des siRNA correspondant à toute la séquence de
l’ARN.
24/10/2011 10
Insertion au hasard Recombinaison homologue
Le Knock-out ou l’invalidation d’un gène par recombinaison homologue
Le knock-out d’un gène (ou K.O.) signifie la perte physique de la séquence (ou d’une partie
de la séquence) de ce gène conduisant à l’absence de l’ARN messager et donc de la protéine. Le KO
est donc transmissible à la descendance. Attention cependant : chez les eucaryotes, le KO d’un gène
signifie que la séquence des deux allèles est affectée, la descendance respecte les lois de Mendel.
Le KO revient à réaliser de la mutagenèse dirigée (par délétion). Ceci est rendu possible par
l’existence d’un mécanisme fondamental d’échange de séquence d’ADN homologue au niveau
chromosomique : la recombinaison homologue.
La recombinaison homologue : un mécanisme à l’origine de la technologie de Knock-out
La recombinaison homologue est un échange de fragments d’ADN entre deux molécules
(d’ADN) au niveau des séquences nucléotidiques homologues. C’est ce qu’il se passe lors de
crossing over à la méiose entre les chromatides des paires de chromosomes. Le KO est basé sur de la
recombinaison homologue entre de l’ADN exogène et de l’ADN génomique. Ce mécanisme connu
depuis longtemps chez la levure a été mis en évidence en 1980 chez les mammifères par injection
directe d’ADN dans des cellules de mammifères.
Lorsque de l’ADN (plasmidique par exemple) est transfecté dans des cellules eukaryotes, il peut : - soit rester à l’état épisomique (transfection transitoire)
- soit s’intégrer dans le génome (transfection stable)
Dans ce dernier cas, l’ADN s’intègre au hasard (généralement en plusieurs copies inversées),
mais dans un nombre de cas rares, il peut
s’intégrer par recombinaison homologue (RH)
si une séquence identique existe dans le
génome.
Les facteurs qui favorisent la recombinaison homologue :
- La taille de la région homologue (de 4 à 9 kb, on multiplie par 20 la RH)
- Le fort pourcentage d’homologie
24/10/2011 11
- L’ADN sous forme linéaire (par rapport à circulaire)
- Le mode de transfection
Il semble en revanche que ni le nombre de copies présentes dans la cellule, ni la localisation
chromosomique du gène à invalider, n’influe sur la RH.
En tout état de cause, il est indispensable de sélectionner les événements de recombinaison.
Les différents types de sélection utilisés chez les eucaryotes supérieurs ( pour l’établissement de
lignées stables) reposent sur l’utilisation de gènes de résistance à des drogues telles que la néomycine
(ou G418), la bléomycine, l’hygromycine, la puromycine.
D’autres marqueurs de sélection sont également utilisés :
Le gène codant pour la DHFR (dihydrofolate réductase) résiste au méthotrexate.
Le gène HPRT : Hypoxantine phosphoribosyl transferase. Ce gène permet une double sélection,
positive et négative. Les cellules possédant ce gène poussent en milieu HAT (hypoxanthine,
aminoptérine, thymidine) mais sont sensible au 6-thioguanine, inversement l’absence de ce gène rend
les cellules sensibles au milieu HAT et résistantes à la 6-thioguanine.
Le gène HSV-TK : la thymidine kinase du virus herpès simplex. Cette enzyme est capable de
phosphoryler le gencyclovir qui devient ainsi toxique pour les cellules.
Les souris KO Nous venons de voir qu’il est possible de créer et sélectionner des cellules stables déficientes
pour un gène. Nous allons voir comment il est possible de créer à partir de ces cellules un organisme
entier KO. Ceci est devenu possible grâce à l’isolement de cellules souches embryonnaires de souris,
les cellules ES (embryonic stem cell)
Les cellules ES
Ce sont des cellules isolées à partir d’embryons de souris et possédant des propriétés
remarquables :
- Elles sont totipotentes, c’est-à-dire que ce sont des cellules indifférenciées possédant le potentiel de devenir n’importe quel type cellulaire
- Leur croissance est illimitée en culture
- Elles sont facilement transfectables (et sélectionnables)
- Il est possible de les réimplanter (après modification génétique) dans un blastocyste de
souris et elles pourront alors coloniser tous les types cellulaires (donc aussi la lignée germinale) et,
24/10/2011 12
ATG
ATG
Stop
Stop
HSV-TK
Néo RGanc R
Néo
Néo
1 2 3 4 5
2 3 3 4
Exons :
Vecteur
Chromosome
dans ce cas, donneront naissance à des souris chimères pouvant donner des descendants
hétérozygotes pour la modification génétique.
Fabrication de souris transgéniques
Une fois les cellules ES sélectionnées,
elles vont être injectées dans le blastocoele
(cavité) d’embryons au stade blastocyste prélevé
sur une femelle donneuse (dont la couleur du
pelage est plus claire que la femelle donneuse de
cellules ES). Quelques blastocystes ainsi
modifiés vont alors être réimplantés dans une
femelle receveuse. Les souriceaux dérivant des
blastocystes modifiés seront mosaïques :
certains tissus proviennent des cellules ES et
d’autres dérivent du blastocyste hôte. En
fonction de l’étendu du pelage foncé provenant
des cellules ES modifiées, on peut se rendre
compte de l’importance de la colonisation
tissulaire de ces cellules, l’espoir étant que les
cellules modifiées aient colonisé la lignée germinale. Seuls ces individus seront capables de
transmettre le gène invalidé à leur descendance. Le croisement de ces souris avec des souris sauvages
donnera 50% d’hétérozygotes (+/-) pour la mutation et 50% de souris sauvages (+/+) . Le croisement
des hétérozygotes entre eux permet d’obtenir 25% d’homozygotes possédant les deux allèles mutés (-
/-) : ce sont les souris KO pour le gène considéré.
Les différentes constructions utilisées
L’interruption d’un exon : knock-out de gène La figure ci-contre montre un exemple de construction simple aboutissant, après
recombinaison homologue, à la perte de
l’expression d’un gène. Le gène de
résistance à la néomycine a été introduit
dans la séquence de l’exon 3 d’un gène
24/10/2011 13
HSV-TK
ATG Stop
StopATG
Néo
Néo
Transcription - Epissage
StopATG
*
*
*
*
Néo RGanc R
ATG Stop
hprt
ATG StophprtHAT R6-TG S
*
ATG Stop*HAT S6-TG R
1er évènement de recombinaison
2ème évènement de recombinaison
quelconque. Le gène de la thymidine kinase du virus de l’herpes est introduit en aval de la séquence
du gène. Les événements de recombinaison homologue sont sélectionnés par la double sélection :
positive par le néomycine et négative par la thymidine kinase. Les cellules recombinées au niveau du
gène sont néomycine résistantes et gancyclovir résistantes, alors que les intégrations au hasard seront
néomycine résistantes et gancyclovir sensibles.
Création de mutation ponctuelle
Si maintenant le gène de résistance
à la néomycine se situe dans un intron et
que l’on a créé une mutation dans l’exon
3 du gène, la recombinaison homologue
de cette construction aboutira à
l’introduction de la mutation au niveau
du génome. La présence de la cassette
de résistance dans un intron n’empêche pas la traduction ni l’épissage, les modifications qu’entraîne
cette construction sont théoriquement dues uniquement à la mutation. Il à cependant été montré que
dans certains cas la présence d’une cassette de sélection dans un intron peut avoir un effet sur le
niveau de transcription du gène. Ce qui a conduit le chercheurs à imaginer des stratégies pour
éliminer le gène de sélection afin d’aboutir à des mutations « propres »
Mutation propre par double remplacement
Dans cette exemple on se base sur la
propriété du gène HPRT permettant une double
sélection (voir plus haut). Le premier événement
de recombinaison apporte gène hprt dans l’intron
(cellules HAT résistantes et 6-thioguanine
sensibles). La seconde RH amène la mutation et
élimine le gène hprt, les cellules deviennent
HATS et 6-TGR .
24/10/2011 14
Le Knock-in
Cette stratégie permet de créer un KO, et en même temps de remplacer le gène par un autre gène qui s’exprimera ainsi comme le gène interrompu. Si le nouveau gène est un gène rapporteur, type LacZ ou GFP, ceci permet de localiser l’expression du gène délété dans la souris au cours du développement ou chez l’adulte (ce qui n’est pas toujours facile autrement).
Cette stratégie peut aussi être utilisée pour montrer qu’un autre gène peut remplacer la fonction de
celui qui est interrompu. Par exemple, la cycline E peut sauver le phénotype du KO de la cycline D.
Les systèmes inductibles
Il se peut que des souris KO pour un gène ne soient jamais obtenues. C’est le cas lorsque la mutation est lethale embryonnaire ; les homozygotes mutants ne sont jamais mis au monde, ou bien l’expression du gène étudié est très large, donc le phénotype mutant très complexe. Dans ces cas, on va vouloir contrôler la mutation dans le temps et dans l’espace.
Le système Cre/Lox
La Cre est une recombinase (de la famille des intégrases) du bactériophage P1. C’est une protéine de 38 KDa qui catalyse la recombinaison entre deux site de reconnaissance, les sites LoxP. LoxP est une séquence d’ADN de 34 pb comprenant aux extrémités 13 nucléotides palindromiques (il est donc impossible de trouver cette séquence dans un gènome eucaryote). Les deux sites peuvent être très éloignés l’un de l’autre et être quand même recombinés par la Cre. Cette recombinase fonctionne dans les cellules eucaryotes génétiquement modifiées comportant deux sites loxP. En fonction de l’orientation des sites loxP, il peut se
produire une délétion ou une inversion. Il est à noter que ce
mécanisme est réversible.
Dans les exemples qui suivent la RH permet d’apporter les
24/10/2011 15
HSV-TKNéo
StopATG *
*
+ Cre
Néo
Néo
Puro
Hyg
ro
Hyg
Hyg Puro ro
Hyg ro
Néo R
Néo
Hygro R
+ Cre
sites loxP sans altérer le gène étudié. La cre recombinase permettra d’éliminer la région entre les
deux sites. L’induction de la cre entraîne l’induction de la déletion.
Exemple d’application La délétion d’exon Deux sites loxP sont insérés de part et d’autre d’un exon du gène à invalider. On dit que
l’exon est « floxé ». Cette construction peut être
utilisée pour remplacer le gène sauvage par
recombinaison homologue dans des cellules ES. On
vérifie que des souris transgéniques homozygotes
(pour l’exon floxé) sont parfaitement saines. Ces
souris peuvent alors être croisées avec des souris
transgéniques exprimant la Cre recombinase dans un
tissu particulier (le génome de ces souris contient le
gène Cre sous la dépendance d’un promoteur tissu spécifique).
Mutation propre Il a été montré que la présence d’un gène de résistance dans un intron, par exemple dans le cas
de mutations ponctuelles, pouvait influer sur la régulation de l’expression du gène (voir plus haut). Et
donc que le phénotype observé n’était pas seulement dû à la mutation. Dans ce cas, on peut utiliser le
système Cre/lox pour éliminer le gène de
résistance. Il suffit, dans la construction, de floxer
la cassette de résistance qui sera éliminée par la
cre.
Large délétion ou translocation
Certaines maladies génétiques sont dues à
de grandes délétions dans le génome (ou à
des translocations). Il est possible de créer
des souris porteuses de ce type de maladie
(afin par exemple d’analyser l’effet de
24/10/2011 16
Cre Cre
Cre
Cre
Cre Cre
P (ubiquitaire ou spécifique)
Cre-ind
Cre-ind
Séquence « floxée »
Injection de l’agonisteà un temps donné
Agoniste(tamoxifène, RU486)
Domaine de fixation au ligand(récepteur des stéroïdes)
InactiveActive
X
certaines thérapies). La figure montre une stratégie basée sur le système cre/lox qui à été utilisée avec
succès. Deux événements de recombinaison homologue sont nécessaires pour introduire les deux
sites lox P et deux parties de la cassette hygromycine. Le premier événement est sélectionné par la
cassette néomycine et le second par puromycine. La cre recombinase permet de rapprocher les deux
parties non fonctionnelles de l’hygromycine devenant ainsi fonctionnelle. Si les deux sites loxP sont
sur le même chromosome il s’en suit une large délétion (plusieurs centaines de Kb). Si ils sont sur
deux chromosomes différents cela conduit à une translocation.
Les possibilités d’induction de la cre recombinase
Un système très sophistiqué d’induction de la cre recombinase à été utilisé récemment (ref). Il
repose sur l’expression d’une protéine de fusion entre la cre et un récepteur tronqué aux
glucocorticoïdes. L’expression de cette
fusion peut être contrôlée par un
promoteur quelconque (ubiquitaire ou
tissu spécifique). La cre ainsi fusionnée
est inactive et ne devient active qu’en
présence d’un agoniste de
glucocorticoïde (et non pas de
glucorticoïdes endogènes) comme le
tamoxifène et le RU486. La figure
montre que le croisement de souris transgénique pour la cre inactive (commerciale) avec de souris
floxé pour un gène donné permet d’obtenir des souris contenant à la fois la cre inactive et un gène
floxé. L’injection de l’agoniste dans un tissu quelconque provoquera la délétion du gène (ou d’une
partie du gène) au moment et au lieu choisi.
Le système tet-on
24/10/2011 17
Détection des mutations / polymorphismes
I) Détection des mutations Les mutations ponctuelles affectent un seul nucléotide et sont souvent appelées SNP (single
nucléotide polymorphism). Elles peuvent être silencieuses, mais peuvent aussi causer des mutations
non-sens, modifier la séquence en acide aminé d’une protéine ou interférer avec l’épissage de l’ARN.
Ces modifications peuvent alors être responsables de maladies génétiques, ou modifier le phénotype
du porteur.
Méthodes basées sur la séquence
La méthode de séquencage de Sanger permet
d'identifier la mutation d'une manière sûre.
Toutefois cette méthode est lourde et génère plus
d’information qu’il n’en faut. Aussi elle n'est
souvent utilisée que pour la mise en évidence
pour la première fois d'une mutation.
Une fois la séquence connue ce n'est pas la peine de séquencer toutes les pistes. Ce n'est pas non plus
la peine de séquencer en aval de la mutation. On peut
utiliser la méthode de séquençage de Sanger en
utilisant uniquement trois desoxynucléotides et un
didesoxynucléotide et une amorce proche de la
mutation de telle sorte que la polymérisation soit plus
ou moins longue en fonction de la présence de la
mutation. Les produits de la réaction sont séparés sur
gel et la présence d'un produit permet de connaître la présence de la mutation.
Exemple de mise en évidence d’une mutation ponctuelle par séquençage
Cette méthode présente un avantage, si la mutation est présente dans une partie de la population de
départ, en quantifiant la présence des deux produits on peut estimer sa fréquence. Elle a par exemple
été utilisée pour estimer le taux d'édition de certains ARN messagers (Schiffer et Heinemann, 1999).
On peut aussi faire une extension d’amorce en utilisant uniquement le nucléotide à détecter. Dans de
cas le nucléotide sera marqué de façon à déterminer l’incorporation. On peut par exemple utiliser
uniquement un didesoxynuclétotide fluorescent et détecter l’incorporation par electrophorèse
capillaire. Dans ce cas on fait les deux réactions, avec l’extension sauvage et l’extension mutée, et on
fait migrer les produits de la réaction. Pour éviter la migration des nucléotides non incorporés on les
dégrade à l’aide d’une phosphatase alcaline.
La révélation peut aussi se faire à l’aide d’anticorps.
Différentes étapes :
- on amplifie la région de la mutation,
- on fixe l’amorce à un support,
- on hybride le produit de l’amplification avec l’amorce,
A G
Hybridation
A G
Polymérisation en présencede dTTP lié à un antigène reconnu par un anticoprs lié à une phosphatase alcalinede dCTP lié à un antigène reconnu un anticoprs lié à une péroxidase
AT
GC
a b
AT
GC
a bAP HRP
24/10/2011 19
- on polymérise en présence des deux oligonuclétides correspondant au type sauvage et au
type mutant,
- on lave pour éliminer les nucléotides non incorporés
- et on révèle le nucléotide incorporé à l’aide d’un anticorps associé à une activité
enzymatique.
Pour améliorer l’hybridation on peut détruire un des deux brins de l’amplification en le digérant par
une exonucléase, le brin à hybrider sera alors protégé en utilisant un oligonucléotide modifié non
sensible à l’exonucléase.
Cette méthode est commercialisée par Invitrogen. La méthode de séquence en utilisant le pyroséquençage peut être utilisée pour détecter des mutations
(Ahmadian et al., 2000). L’avantage de cette méthode est de faire passer le nucléotide « sauvage » et
« mutant » l’un après l’autre la hauteur relative des deux pics permet d’estimer la proportion de
mutants dans une population.
Méthodes basées sur l’hybridation
Southern
L'hybridation de deux chaînes d'ADN est due à l'appariement de bases complémentaires A-T et G-C.
Elle est donc diminuée lors de mésappariement. Le Tm d'un oligonucléotide de 10 à 20 bases sera
donc abaissé s'il y a un mésappariement.
24/10/2011 20
La méthode de Southern (1975) est particulièrement adaptée pour détecter les grandes altérations
telles que les insertions, les délétions ou les
réarrangements. Mais cette méthode peut aussi être
utilisée pour détecter les mutations ponctuelles si on
utilise un oligonucléotide comme sonde.
Il n’est pas toujours nécessaire de digérer l’ADN par
une enzyme de restriction et de séparer les fragments
par electrophorèse. On peut directement spotter
l’ADN à analyser sur une feuille de nitrocellulose
(« dot-blot »).
Dans certains cas si l'altération se retrouve dans
l'ARN, un northern peut être employé pour la
détecter.
Il existe plusieurs méthodes pour détecter l’hybridation. La plus ancienne est l’utilisation d’un
marquage radioactif. On utilise comme sonde un oligonucléotide marqué en 5' par une kinase et du
α-32P ATP. Comme contrôle, on peut utiliser une sonde plus grande dont l’hybridation n’est pas
sensible à la présence de la mutation (ADNc sur la figure) pour vérifier que la cible était bien en
quantité égale dans les différentes pistes.
L’hybridation peut se faire sur puce à ADN. Un premier spot contient un oligonucléotide sauvage et
un deuxième spot contient un oligonucléotide muté. L’ADN de la région à analyser est amplifié et
marqué avec un fluorophore. Il est hybridé avec les oligonucléotides fixés à la puce, s’il y a
hyburidation il y aura fluorescence, si la mutation diminue le Tm, il n’y aura pas de fluorescence.
Comme on peut disposer d’autant de spots qu’on le désire, on peut cribler en une seule fois la
présence de nombreuses mutations.
sondecDNAoligonucléotide
ADN
mutant témoin mutant témoin
Exemple de mise en évidence d’unemutation ponctuelle par Southern avecun oligonucléotide portant la mutation
24/10/2011 21
On peut suivre l’hybridation en FRET en utilisant deux oligonucléotides, chacun sera porteur d’un
fluorophore. Lorsque l’oligonucléotide n’est pas hybridé, on n’a pas de fluorescence, par contre
lorsqu’il est hybridé on obtient une fluorescence.
Si on augmente peu à peu la température, à faible
température, l’oligonucléotide se fixera d’une
manière non spécifique et on aura pas de
fluorescence. Lorsque la température atteindra le
Tm, on observera une fluorescence. Au dessus de
Tm on perdra la fluorescence. Comme la
présence d’une mutation modifie le Tm, les
courbes de fluorescence en fonction de la température permettent de détecter la présence d’une
mutation.
Hybridation partielle
Dans cette technique on va détecter le fait que
l’oligonucléotide soit ou ne soit pas
complètement hybridé lorsque l’hybridation est
totale ou lorsque l’hybridation présente un
mésappariement.
Le fragment portant la mutation est amplifiée
par PCR, puis on hybride deux oligonuléotides
qui portent à leurs extrémités des fluorophores
tels que le pyrène. Un pyrène est positionné en
3' d'un oligonucléotide et un autre en 5' de
l'autre oligonucléotide. Lorsque les deux
pyrènes sont proches l'un de l'autre, lorsque les
deux oligonucléotides s'hybrident parfaitement
on obtient une émission de fluorescence
(excitation à 350 nm et émission à 490 nm) par
O
O
O
PP
PP
cible
oligonucléotidesfluorescence
pas de fluorescence
fluoresceineémission dansle rouge
mutation
ADN
excitationémission
Principe
24/10/2011 22
contre lorsqu'il y a un mésappariement, dans le cas d'une mutation, les deux pyrènes ne sont plus
proches l'un de l'autre et on n'obtient pas de fluorescence (Paris et al., 1998).
Comme amélioration de la méthode on a l'utilisation de d'appareil PCR permettant de suivre
l'émission de la fluorescence au cours des amplifications successives.
Utilisation d’un anticorps
On peut suivre l’hybridation en utilisant un anticorps qui reconnaît l’ADN double brin (Viazov et al.,
1994) Cette méthode est souvent appelée « DNA enzyme immunoassay » (DEIA). Dans une
première étape, une région contenant la mutation à détecter est amplifiée par PCR. Ce produit
d’amplification est alors hybridé à un nucléotide spécifique fixé sur un support solide via un pont
streptavidine-biotine. S’il y a hybridation, elle est détectée par ELISA en utilisant un anticorps se
fixant sur l’ADN double brin.
DGGE = Denaturing Gradient Gel Electrophoresis Principe : Le Tm dépend de la séquence, de la température, de la
concentration en certaines molécules telles que l'urée ou la
formamide. La dénaturation est un phénomène coopératif. La
migration d'un fragment d'ADN change avec la dénaturation, un
ADN double brin partiellement ouvert migre moins vite qu'un
fragment double brin (Myers et coll. 1985)
Dans cette technique, on fait migrer un fragment d'ADN dans un
gel gradient allant de conditions natives ou l'ADN est sous
forme double brin à des conditions dénaturantes ou l'ADN est
sous forme simple brin (7M urée, 40% formamide). La
température est maintenue constante.
L'ADN est extrait puis digéré par une enzyme de restriction qui coupe souvent, tous les 200-400 pb.
Le produit de la digestion est chargé sur un gel gradient linéaire, il migre sous la forme de double
brin mais à un moment il atteint son Tm, est partiellement dénaturé et migre moins vite. Ainsi des
fragments de séquences différentes, même d'une seule base sur 100 pb migrent à des endroits
**
sauvage mutant
gel
sauvage mutant
**
sauvage mutant
gel
sauvage mutant
24/10/2011 23
différents. Pour détecter les bandes, L'ADN est transféré et hybridé avec une sonde spécifique d'une
région ou on analyse des fragments de PCR après les avoir marqués
Au lieu d’effectuer un Southern, on peut amplifier la région de la mutation par PCR, faire migrer les
deux produits de PCR dans un gel à concentration croissante d’un agent dénaturant.
Un des problèmes rencontrés avec cette technique : les fragments se séparent trop tôt dans le gel.
Pour remédier à de problème, on effectue la PCR avec des amorces riches en GC dans la région 5'
(non importante pour la réaction de PCR). Ces extrémités GC stabilisent le duplex et permettent une
meilleure séparation des homoduplex et des hétéroduplex. DHPLC: Denaturing high-performance liquid chromatography
Cette méthode est proche de la DGGE mais ici la détection des hétéroduplex se fait par HPLC en
utilisant une colonne de paire d’ions en phase reverse dans les condition partiellement dénaturantes
(Oefner et Underhill, 1995).
24/10/2011 24
Méthodes basées sur la PCR
Les altérations du génome peuvent être détectées par PCR en utilisant plusieurs amorces, ce qui
permet l'amplification simultanée de plusieurs régions (multiplex PCR). Cette méthode a été
employée pour la première fois par Chamberlain et coll. (1988) pour détecter les mutations de la
dystrophine responsable de la maladie de Duchenne.
PCR oligonucléotide allèle spécifique, PASA (PCR Amplification of Specific Alleles)
En PCR, la polymérase ne peut polymériser que si la dernière base en 3' est stabilisée par des liaisons
hydrogènes, si la dernière base est hybridée. La plupart des polymérases ont une activité 3'-
5'exonucléase, mais certaines d'entre elles comme l’ADN polymérase Taq en est dépourvue. En
prenant deux oligonucléotides, un spécifique de la mutation et un autre spécifique du témoin
(sauvage) on peut faire deux PCR à l'aide d'un troisième oligonucléotide situé en 3' (en aval) à
environ 1 kb. On aura amplification uniquement qu’avec un des deux couples (Sommer. 1992)
L'absence de bande ne signifie pas toujours l'absence d'hybridation en 3' mais peut résulter d'un
défaut lors de PCR, d'une erreur de manipulation. Un témoin peut être ajouté, c'est un oligonucléotide
qui hybride sur tous les allèles (connus) en amont de l'hybridation permettant de voir la mutation. On
obtient donc deux bandes, une bande haute permettant de voir si la polymérisation a bien eu lieu et
une bande basse permettant de voir la présence ou non de la mutation, suivant l'oligonucléotide qui a
été utilisé.
Les deux réactions de PCR (entre l'amorce amont et l'amorce aval et entre l'amorce discriminante et
l'amorce aval) entrent en compétition, et l'amplification la plus petite est favorisée, d'une part parce
matrice
amorce aval
amorces discriminantes
amorce amontou
24/10/2011 25
qu'elle est plus petite et d'autre part parce que le produit de la réaction la plus longue peut servir de
matrice à la réaction la plus petite et non inversement. Aussi si la réaction de PCR discriminante a
lieu, l'amplification témoin est faible.
Ce système a un deuxième avantage. En effet, dans de rares cas, l'amplification avec l'amorce
discriminante peut avoir lieu. Plus il y a de cycle de PCR, plus elle a de chance d'avoir lieu, cette
erreur est due à la probabilité qu'a la dernière base de l'oligonucléotide d'être bien positionnée en
l'absence d'hybridation. Le fait d'utiliser une amorce amont, permet d'utiliser dès les premiers cycles
les substrats (dNTP) et de fabriquer une grande quantité de matrice.
RR RS RS RR RS RR RS RR SS SS RR RR RS SS
R
S
C
Exemple de PASA permettant de distinguer des individus avec une mutation sur les deux allèles(RR) des individus sauvages (SS) et des hétérozygotes (RS)
24/10/2011 26
Ligation
Les ADN ligases catalysent l'estérification entre un nucléotide 5' phosphate et un nucléotide 3' OH. Il
faut toutefois que ces deux fonctions soient maintenues proches l'une de l'autre.
Pour détecter l'événement de mutation, on peut marquer un oligonucléotide. Une méthode pour
augmenter le signal consiste à répéter plusieurs fois l'expérience en faisant des cycles successifs de
dénaturation et de ligation. Dans ce dernier cas on utilisera de préférence une ligase thermostable
(dans ce cas l'amplification ne suit pas une progression exponentielle).
Ligation
Gel, conditionsdénaturantesautoradiographie
Hybridation
24/10/2011 27
RFLP
Dans certains cas la mutation recherchée coïncide avec un site de restriction, toutefois c'est assez
rare. Dans d'autre cas, la mutation est proche d'une autre mutation qui, elle, coïncide avec un site de
restriction. La coupure est alors détectée par Southern ou par coupure d'un fragment de PCR.
Sandwich: L'ADN cible est fixé sur une membrane de nitrocellulose puis hybridé avec une sonde.
Après formation du duplex il y a coupure avec une enzyme de restriction. S'il y a homoduplex
l'enzyme coupe et l'oligonucléotide est deshybridé, s'il n'y a pas coupure l'hétéroduplex reste sur la
membrane.
24/10/2011 28
Méthodes basées sur la conformation de l’ADN SSCP (Single Strand Conformation Polymorphism)
Cette méthode est basée sur l'influence de la séquence primaire sur la migration en gel natif de
fragment d'ADN simple brin (Orita et coll., 1989). En condition non dénaturante, les brins d'ADN
forment des structures secondaires en tiges/boucles qui sont uniquement dépendantes de la séquence
primaire, de plus il existe une structure tertiaire provenant de liaisons entre les sucres et les bases.
Donc une variation dans une séquence primaire s'accompagne d'une différence de conformation de
l’ADN simple brin correspondant.
Le fragment obtenu par PCR ou le génome entier est coupé par une enzyme de restriction. L'ADN
est dénaturé soit par la soude soit par la chaleur et déposé sur un gel d'acrylamide. L’ADN est ensuite
mis dans des conditions permettant la formation de structures secondaires en abaissant la
températurure ou en neutralisant le pH. La migration est détectée soit par coloration à l'argent
(produit de PCR) soit par Southern (ADN génomique), soit après marquage du produit PCR
(radioactif ou fluorescent).
Cette méthode permet de repérer des mutations dans une région, même si elles ne sont pas connues.
R
S
SS SS RS SS RS RS SS SS RR RS RR SS
Exemple de SSCP pour determiner le génotype des individus d’une population pour une
mutation conférant la résistance : homozygote sensible (SS), homozygote resistant (RR) et
hétérozygotes (RS).
24/10/2011 29
ddF (Dideoxyfingerprinting)
Cette méthode (Sakar et coll. 1992) est un hybride
entre la séquence selon la méthode de séquençage à
l'aide des dideoxynucléotides et la SSCP. Le fragment
d'ADN où se trouve la mutation est amplifiée puis une
réaction de séquence est faite en employant un seul
dideoxynucléotide et une amorce marquée en 5'. Le
produit de la réaction est dénaturée puis chargée sur un
gel d'acrylamide non dénaturant.
Hétéroduplex sensibilité à une coupure
Dans cette technique les deux fragments d'acide nucléique sont hybridés et on détecte les
mésappariements en les coupant avec des enzymes ou chimiquement.
Utilisation de la nucléase S1
Cette nucléase d'Aspergillus oryzae est spécifique de
l'ADN simple brin et ne digère pas l'ADN double brin. On
fait une sonde ADN simple brin marqué radioactivement
et on hybride avec les différentes populations. On fait
ensuite un gel en condition dénaturante pour voir la taille.
Une autre possibilité est d'amplifier la région portant la
mutation avec des oligonucléotides portants des
fluorophores. Les fragments amplifiés de l'ADN témoin et
de l'ADN testé sont réunis dans le même tube, dénaturés et
hybridés. La présence d'une mutation est ensuite mise en
évidence en incubant le produit de l'hybridation avec la
nucléase puis en faisant migrer les produits de la digestion sur un gel en conditions dénaturantes.
types1 1 2 1 3 3 3 3 4 3 4
exemple de ddF (Langemeier et coll., 1994)
ADN 1 ADN 2
PCR
dénaturation / hybridation
digestion par une nucléasedénaturation
24/10/2011 30
D'autres nucléases peuvent être employées, la nucléase P1 de Penicillium citrinum ou la mung bean
nucléase de Vigna radiata ou la nucléase CEL 1 du céleri. Les trois premières nucléases sont des
protéines à Zinc et sont principalement actives à pH 5. Cette action à pH acide pose quelques
problèmes pour les régions riches en AT en effet à ce pH on peut avoir une dénaturation partielle de
l'ADN. Dans ce cas on peut utiliser une nucléase de plante comme la nucléase CEL 1 du céleri qui
coupe l'ADN simple aux pH neutres (Oleykowski et coll. 1998)
Certaines nucléases comme la nucléase S1 digèrent très difficilement lorsque le mésappariement est
limité à une seule base, mais au-dessus de deux bases la vitesse de réaction augmente énormément.
Dans ce cas, la technique n'est donc valable pour détecter des délétions de petites tailles.
Utilisation des RNAse (Myers et coll., 1985)
Les RNAse A, T1 ou T2 coupent les ARN sous forme
simple brin et non lorsqu'ils sont hybridés. Lors d'une
hybridation entre deux clones de deux individus
différents, les mésappariements seront digérés et seuls
les régions hybridées resteront. La technique est donc
équivalente à la digestion par la nucléase S1 mais ici
Les protéines s'inactivent rapidement par dénaturation (perte de stucture tertiaire) par réaction
chimique (oxydation)ou par protéolyse (coupure des liaisons peptidiques).
Pour résoudre cela :
- on travaille à basse température,
- on élimine les catalyseurs permettant l'oxydation en ajoutant de l'EDTA qui complexe les
métaux qui sont nécessaires à l'oxydation et on peut ajouter un agent inhibiteur comme le ß
Mercaptoéthanol (s’il n’y a pas de ponts disulfures dans la protéine)
- on ajoute des inhibiteurs des protéases
- on ajoute des stabilisants comme le polyol.
- On travaille loin du pI de la protéine
Cas particulier des protéines thermostables : Les protéines thermostables comme par exemple la taq DNA polymérase sont stables à haute
température, au dessus de 80°C. Si on exprime une protéine thermostable dans un organisme
mésophyle comme E. coli, la protéine thermostable se trouve mélangée à des protéines
thermosensibles. Pour purifier la protéine thermostable il suffit de chauffer l’extrait à 80°C, les
protéines thermosensibles se dénaturent et précipitent. A la suite d’une centrifugation, on obtient la
protéine thermostable pure.
On peut utiliser cette technique pour purifier des petites protéines recombinantes en les fusionnant à
une protéine thermostable. Comme elles sont petites, la fusion n’affecte pas la stabilité thermique de
la protéine thermostable et la fusion peut se purifier en dénaturant les autres protéines.
24/10/2011 133
Solubilisation et renaturation des corps d’inclusion
Un cas particulier est la purification des corps d’inclusion lors de la production de protéine dans E.
coli. En effet dans certains cas, on observe l’accumulation de protéine dans des corps non solubles.
Ces agrégats sont visibles en morphologie, leur réfringence permet de les voir en microscopie de
contraste e phase. Ils ont été appelés corps d’inclusion.
Les protéines composant les corps d’inclusion sont généralement mal repliées et présentent un excès
de feuillet β. Ce sont généralement des intermédiaires de repliements qui se sont agrégés avant que le
repliement soit fini (Mitraki et King, 1989). Lorsqu’il y a des cystéines, des ponts disulfure non
correct se sont formés entre les chaînes peptidiques.
La technique de purification consiste alors à purifier ces corps d’inclusion par centrifugation ou par
filtration sur filtre de 0,45 µm. Les corps d’inclusions sont alors lavés en ajoutant de l’EDTA, des
détergents non dénaturants tels que le Triton X-100 ou le desoxycholate ou des détergents
dénaturants à faible concentration. Cette opération de lavage des corps d’inclusion a pour but
d’éliminer les protéines solubles, présentes dans le surnageant qui sont éliminées par centrifugation
ou filtration.
Les corps d’inclusion sont alors solubilisés en utilisant généralement soit l’urée soit le chlorure de
guanidinium, cette solubilisation correspond à leur dénaturation.
- On peut utiliser une concentration de dénaturant qui dénature que partiellement la protéine,
la renaturation sera souvent plus facile. Dans ce dernier cas, on recherche la concentration
minimale qui permet la solubilisation.
- Pour purifier la protéine d’intérêt on peut effectuer une solubilisation différentielle des
protéines. En effet, une première solubilisation à une faible concentration d’agent
dénaturant ne solubilisant pas la protéine recombinante permet d’éliminer les protéines non
désirées.
- Il faut le plus souvent ajouter un agent réducteur tel que le dithiotreitol (DTT) ou le β-
mercaptoethanol pour réduire les ponts disulfures non natifs ou éviter qu’ils ne se forment
lors de la solubilisation.
24/10/2011 134
- Dans certains cas on peut remplacer la solubilisation par l’urée ou les sels de guanidium
par une solubilisation à l’aide pH extrêmes. Ainsi des protéines de fusion de la maltose
binding protein peuvent être dissous à l’aide de 20% acide acétique (Reddy et al., 1998).
Cependant, les pH extrêmes peuvent entraîner des coupures de la protéine ou des
modifications chimiques des résidus. Les détergents comme le sodium dodecylsulfate
(SDS) ou le bromure de n-cetyl trimetylammonium (CTAB) peuvent parfois être utilisés à
faible concentration. L’avantage dans ce cas est que le plus souvent, la solubilisation ne
s’accompagne pas de dénaturation de la protéine et donc d’une perte de son activité. Les
ultrasons sont parfois efficaces pour solubiliser les corps d’inclusion, ici encore, la protéine
n’est pas dénaturée.
Le repliement de la protéine est ensuite effectué par élimination de l’agent dénaturant soit par
dialyse, par diafiltration soit en accrochant la protéine sur une colonne d’affinité. Ce repliement de la
protéine s’avère souvent difficile voir impossible.
Il y a plusieurs recettes pour réussir la renaturation.
- Il faut diluer la solution pour éviter les relations entre les protéines partiellement non
renaturées et donc exposant des surfaces hydrophobes.
- On ajoute généralement du glutathion pour échanger les oxydo-réductions à une
concentration avoisinant les 10 mM. Il est utilisé sous forme réduite (GSH) et oxydé (GS-
SG). Le glutathion a pour rôle de favoriser les échanges de ponts disulfures et ainsi d’éviter
la stabilisation de ponts disulfures mal placés.
- l’ajout de ligand (cofacteurs, métaux, hèmes, inhibiteurs…) dans certains cas favorise la
renaturation
- De nombreux additifs sont utilisés pour faciliter la renaturation sans toujours savoir leur
mode d’action. Ainsi la L-arginine (0,5-1 M) est souvent utilisée. Des détergents (SDS,
CTAB, Triton X-100) amèliorent parfois le repliement des protéines. On peut ajouter des
molécules qui vont favoriser le repliement tels que des molécules switterioniques portant
un groupement sulfobetaine comme groupement hydrophile et un groupement hydrophobe
(Chong et Chen, 20000). Des chaperones et des foldases sont parfois utilisées, elles sont
24/10/2011 135
dans ce cas utilisées sous forme insolubles, liées à des billes d’agarose pour pouvoir les
éliminer facilement à la fin de la renaturation.
24/10/2011 136
La concentration des protéines
Par précipitation :
Pour concentrer les protéines on utilise souvent la précipitation par augmentation de la force
ionique (salting out). Les protéines sont solubles dans l'eau car leurs surfaces hydrophiles présentent
des interactions avec les molécules d'eau. Le sel interagit avec l'eau, si la concentration en sels
augmente, on pompe l'eau de la solution et il y a moins d'eau disponible pour les protéines. Elles
forment des agrégats en interagissant par leur partie hydrophobe. Quand la taille de l'agrégat est
suffisante, il y a précipitation. Le sel le plus utilisé est le sulfate d’ammonium. A 70% de la
saturation, on précipite pour ainsi dire toutes les protéines (La saturation est la solubilité dans l'eau à
20°C. 100% correspond environ à une concentration de 4 moles/litre). D’une manière générale, les
protéines ne sont pas dénaturées par cette précipitation.
Comme toutes les protéines ne précipitent pas avec la même facilité, on peut faire des
précipitations avec différentes concentrations de sulfate d’ammonium. Toutefois comme cette
méthode délicate et peu résolutive n’est plus que rarement utilisée.
Pour quelques protéines, on peut utiliser des solvants organiques tels que l’acétone ou
l’éthanol. Mais l’utilisation de ces solvants organiques est limitée, en effet ils occasionnent souvent
une dénaturation irréversible de la protéine.
Par filtration :
Pour réduire le volume de la solution, la méthode la plus utilisée est l'ultrafiltration. On
soumet la solution protéique à l'action d'une filtration; la taille des pores du filtre doit être telle que
les protéines doivent être retenues. Il existe plusieurs systèmes, le plus simple utilise un boudin de
dialyse, la solution est à l’intérieur du boudin et à l’extérieur on place un polymère absorbant tel que
l’ « aquacide ». L’eau comme les petites molécules passent par les pores du boudin, les protéines
restent à l’intérieur.
On utilise souvent des filtres pour concentrer les protéines, pour les volumes importants, on
crée un courant sur le filtre pour éviter les colmatages, on parle alors d’ultrafiltration tangentielle.
24/10/2011 137
Les différentes méthodes de séparation des protéines
On peut utiliser deux grands types de méthodes pour séparer les protéines, la chromatographie et
l’électrophorèse. Certaines méthodes seront utilisées pour purifier alors que d’autres seront plutôt
utiliser pour vérifier la pureté de la solution.
La chromatographie
La chromatographie est une technique de séparation qui utilise une colonne contenant un support qui
possède plusieurs propriétés.
On distingue plusieurs étapes
1 Régénération et équilibrage de la colonne avec le tampon.
2 Charge de la solution protéique
3 Lavage avec le tampon. On utilise tout d’abord le tampon de charge et au besoin successivement
plusieurs tampons qui vont décrocher des protéines contaminantes.
Pinceserrée
pompe
membrane porée de 10 kDa
échantillon
Ajout de tampon
(pour la diafiltration)
Ultrafiltration tangentielle
24/10/2011 138
4 Elution : elle peut se faire en ajoutant directement le tampon d’élution, en faisant un gradient entre
le tampon de lavage et le tampon d’élution. Ce gradient peut être continu ou discret.
Types de matrice et de pression
Il existe différents types de supports : cellulose, sephadex.
Si on applique une pression élevée on augmente la résolution. On effectue alors une
Chromatographie Liquide Haute Performance (HPLC).
L’électrophorèse
La technique consiste à faire migrer les protéines dans un gel. Le gel le plus utilisé est un gel
d’acrylamide.
L'acrylamide est un monomère, en présence de
radicaux libres (en général persulfate d'ammonium
stabilisé par le TEMED), une réaction
en chaîne est initialisée et on obtient un
polymère.
Si la réaction est faite en présence de N.
N'méthylenebisacrylamide, on a
formation d'un réseau de mailles plus
ou moins serrées en fonction de la
concentration de l'acrylamide.
On obtient donc un gel dont les largeur des mailles dépend des concentrations en acrylamide et
bisacrylamide de départ.
CH2 CH
C O
NH2
C O
NH2
CHCH2 CH2 CH CH2 CH
C O
NH2
C O
NH2
+ persulfate d'ammonium+ temed
CH2 CH
C O
NHCH2NH
C OCHCH2
Bisacrylamide
24/10/2011 139
Séparation selon la taille
Dialyse
Son principe est de mettre la solution dans un boudin de dialyse qui lui-même se trouve dans un
tampon dépourvu de sels. Le boudin de dialyse est constitué d’une membrane qui laisse passer les
petites molécules. Les boudins les plus couramment utilisés laissent passer les molécules qui
présentent un poids moléculaire inférieur à 10 kDa, mais il existe des boudins avec d’autres seuils de
coupure, soit plus faibles (3 kDa) soit plus importants (30, 50 ou 100 kDa). Par un phénomène de
diffusion, les sels vont sortir du boudin jusqu'à atteindre l'équilibre entre la concentration dans le
boyau et la concentration dans le tampon. On effectue plutôt plusieurs dialyses successives qu’une
dialyse dans un grand volume.
Filtration sur gel
Le principe est de faire passer la solution de protéine dans un gel constitué de billes creuses, les
petites molécules passent par l’intérieur des billes et font donc un chemin plus long que les grosses
molécules qui ne passent pas par l’intérieur des billes.
Cette méthode est aussi utilisée comme dessalage pour éliminer les sels d’une solution ou pour
changer le tampon.
Ultrafiltration
La solution est filtrée sur une membrane ayant un seuil de coupure correspondant à des poids
moléculaires de 1 à 100 kDa. Le filtrat ne contient donc que des petites molécules et, si la solution ne
passant pas par la membrane est diluée plusieurs fois avec le tampon, elle ne contient que des
molécules de grande taille. Cette méthode est plutôt utilisée pour les grands volumes.
Ultracentrifugation
Les protéines sont séparées en fonction de leur vitesse de sédimentation dans un milieu visqueux,
généralement une solution concentrée de saccharose. Les protéines les plus grosses sédimentent plus
24/10/2011 140
vite que les molécules plus petites. L’ultracentrifugation ne permet de séparer que de petits
échantillons, c’est donc une méthode analytique.
Séparation selon la charge
On sépare les protéines selon leur charge. Les protéines sont des polyélectrolytes, ainsi, à un pH
donné, chacun des groupements ionisables sera dans un état d'ionisation donné (en fonction du pKa).
Le pI est le pH auquel la charge globale de la protéine est nulle. Si pH < pI, la molécule est positive.
Si pH › pI, la molécule est négative. Ainsi, selon la charge du support et sa propre charge, la protéine
va interagir ou pas avec le support.
On utilise la chromatographie d’échange d’ion.
Si on est à pH 7, les protéines dont le pI > 7 ne seront par retenues sur une échangeuse d’anion
mais seront retenues par une résine échangeuse de cation
Types de groupements échangeurs d’ions Echangeurs d’anions - Carboxy-méthyl (CM)
- Phosphate (P)
- Sulfoéthyl (SE)
- Sulfopropyl (SP)
CH2
COO-
O PO3H2- CH2
CH2
SO3-
CH2
CH2
SO3-CH2
Echanges de cations - Diéthyl-amino-éthyl (DEAE)
- Triéthyl-amino-éthyl (TEAE)
- Quaternary-amino-éthyl (DEAE)
N (C2H5)2(CH2)2
N+
(C2H5)3(CH2)2
N+
(C2H5)3(CH2)2
CH2. CH. CH3OH
24/10/2011 141
L’élution s’effectue généralement en augmentant la force ionique, à l’aide d’un gradient de sel. Elle
peut aussi se faire en faisant varier le pH de la solution, mais dans ce cas on passe souvent par un pH
dénaturant pour la protéine.
On peut utiliser l’électrofocalisation. Il s’agit d’une électrophorèse qui permet de focaliser les
protéines dans une région du gel qui correspond à leurs points isoélectriques. Pour avoir un gel avec
un gradient de pH, on ajoute des ampholines qui sont des polymères avec des groupements
ionisables. La protéine va migrer jusqu'au niveau de pH qui correspond à son pI.
Cette méthode est très utilisée car elle est très résolutive : elle sépare les isoenzymes qui sont très
proches en séquence d'acides aminés.
L’électrofocalisation ne permet pas de séparer une grande quantité de protéine. Cette méthode a été
adaptée à la chromatographie et a pris le nom de chromatofocalisation.
Séparation selon la taille et la charge
On utilise une électrophorèse sur gel de polyacrylamide en condition native. Etant donné que l'on
applique un courant électrique sur le gel, les protéines vont migrer en fonction de leur taille et de leur
charge. Le gel agit comme un tamis qui va plus retenir les grosses molécules que les petites.
La majorité des protéines est chargée négativement et vont donc migrer vers le pôle positif. Ces
gels sont appelés natifs car la protéine garde son activité.
Séparation selon l’hydrophobicité
Chromatographie: On utilise un support qui contient un greffage hydrophobe et qui peut donc
interagir avec les protéines hydrophobes. On connaît deux types de support :
- groupement aliphatique, la longueur des chaînes amine peut varier (C4->C10). Ex : le butyl
sepharose est un greffage en C4.
- noyau aromatique : phenyl sepharose.
24/10/2011 142
Ces supports retiennent les protéines par interaction hydrophobe. On charge la colonne en
présence de sel car il favorise les interactions hydrophobes ((NH4)2 SO4 à 1M). L'élution peut se
faire soit en diminuant la concentration en sels soit en ajoutant un détergent qui solubilise les
interactions hydrophobes.
Séparation de phase. Le triton X-114 est soluble dans l’eau à basse température (4°C) mais la
solubilité est fortement diminuée à plus haute température (35°C). Les protéines hydrophobes ayant
plus d’affinité pour le détergent que pour l’eau, on les retrouvera préférentiellement dans la phase
détergente. La méthode consiste donc à préparer une solution de TX-114 saturée en eau à haute
température, à ajouter l’échantillon, abaisser la température pour favoriser les contacts entre les
protéines et le TX-114. La solution est alors chauffée à 37°C, et centrifugé pour séparer les deux
phases.
Séparation selon l’affinité
Site actif
On fixe sur le support un ligand dont on sait qu'il a une forte interaction avec la protéine que l'on
cherche à purifier.
L'élution peut être non spécifique (augmentation de la force ionique) ou spécifique (élution avec le
ligand libre - il y a alors compétition et fixation de la protéine sur ce ligand libre; le ligand libre est
enfin éliminé par dialyse). L'avantage de cette dernière méthode est qu'elle ne fait pas appel aux
propriétés physico-chimiques qui peuvent être communes à plusieurs protéines mais à la spécificité :
en une seule étape, on a une meilleure purification qu'avec l'échange d'ions ou la chromatographie
hydrophobe. Il faut évidemment avoir une certaine connaissance de l'enzyme.
Exemple de chromatographie d’affinité avec des tag :
- Glutathion-S-transférase : l’élution se fait en rajoutant du glutathion dans le tampon
- Strep-tag : l’élution est obtenue en ajoutant de la desthiobiotine
Modification post traductionnelle.
24/10/2011 143
On peut trier des protéines glycosylées des protéines non glycosylées en utilisant une lectine fixée sur
une colonne. Une lectine est une protéine qui a une forte affinité pour les sucres. En utilisant une
lectine qui reconnaît un sucre composant les structures glycosylées des protéines, on peut accrocher
les protéines glycosylées sur la colonne et les éluer en utilisant le sucre dans la phase mobile.
Une des lectines les plus utilisée est la concanavaline A qui reconnaît le mannose.
Séquence primaire
Certaines séquences peuvent être
reconnues par des ligands. Par exemple,
les queues homopolymériques
d’histidine peuvent être purifiées avec
des colonnes de Nickel ou de Cobalt.
L’élution est obtenue avec une solution
contenant de l’imidazole ou avec une
solution d’EDTA. Cette méthode
proposée en 1975 par Porath et al., est
actuellement une la méthode de purification la plus populaire. Le cobalt est quelquefois préféré au
nickel, parce que la liaison est moins sensible au β-mercaptoethanol et parce que le cobalt forme
quatre liaisons avec les histidines au lieu de deux pour le Nickel ce qui rend l’affinité plus spécifique.
Structure tertiaire
On peut immobiliser un anticorps spécifique de la protéine à purifier sur une colonne en utilisant soit
la protéine A soit un ligand composé de sulfone thioeher (thiophilic resin). Lorsque l’on fait passer
un extrait sur cette colonne, les autres protéines ne seront pas retenues : cette technique est donc
spécifique. Cependant, l'interaction antigène/anticorps est tellement forte qu'il est ensuite difficile de
les séparer : les constantes de dissociation sont comprises entre 10-6 à 10-12. L'élution est donc
problématique. La seule manière de les dissocier serait de baisser fortement le pH (jusqu'à 2) mais à
ce pH là, l'enzyme peut être dénaturée.
A faible pH on dissocie la liaison Anticorps/protéine A si bien qu’on obtient les anticorps avec la
protéine désirée. Pour éviter cette coélution de l’anticorps, il faut fixer de manière covalente
l’anticorps sur la protéine A.
Protéine Nickel Matrice
24/10/2011 144
Séparation par des colorants
Elles ressemblent à une chromatographie d'affinité mais sont moins spécifiques.
Bleu de cybacron : on l’a tout d’abord utilisé comme chromatographie d’affinité pour purifier les
protéines ayant un site de reconnaissance du NAD. Comme de nombreuses protéines sont retenues
par le bleu de cybacron, on s’en est servi pour purifier un grand nombre de protéines. L'élution
s'effectue grâce à un gradient de sels.
Evaluation de la pureté
Si la protéine à purifier a une activité enzymatique, on peut la suivre dans les étapes de purification
grâce à cette activité, et quantifier le rendement de chaque étape en calculant l’activité spécifique,
activité observée/ concentration en protéine.
Mais ce n’est généralement pas possible, et on estime le plus souvent la pureté d’une protéine par un
gel dénaturant. On utilise les propriétés du sodium duodecyl sulfate (SDS), c’est un détergent
anionique qui dénature les protéines en se fixant sur les zones hydrophobes. Il se fixe en moyenne 1.4
g de SDS par gramme de protéine. Les protéines sont dénaturées. Etant donné que les protéines
deviennent toutes chargées positivement à cause de cette interaction, elles ne vont plus migrer en
fonction de leur quantité de charge mais seulement en fonction de leur taille.
Il existe deux types de gel :
- Le gel de séparation qui permet la séparation selon la masse moléculaire.
- Le gel de concentration qui a une teneur plus faible en polyacrylamide, ce qui va permettre
une migration plus rapide. On aura donc des bandes plus fines et donc une meilleure
résolution. Le gel de concentration est généralement coulé au-dessus du gel de séparation.
Avant d’être chargé sur le gel les protéines sont dénaturées en rajoutant du SDS à 1% avec du ß
Mercaptoéthanol (10mM pour couper les ponts disulfure), puis par chauffage 1 à 3 minutes à 100°C.
C'est le test de pureté le plus utilisé car il est fiable et simple.
24/10/2011 145
Comme plusieurs protéines peuvent migrer à la même place dans un gel SDS, on peut augmenter la
séparation en effectuant une électrophorèse bidimensionnelle. C'est une association des méthodes
d'électrofocalisation et d'électrophorèse en conditions dénaturantes. On réalise une première étape
d'électrofocalisation, puis, à 90°, une étape en gel SDS, ainsi, deux protéines qui ont le même pI vont
pouvoir être séparées selon leur poids moléculaire.
Pour colorer les protéines sur le gel, il faut les fixer sur le gel. Pour cela on les traite à l'acide
acétique. La coloration se fait ensuite par :
le bleu de Coomassie : seuil de détection : 1 à 10 µg;
le nitrate d'argent : seuil de détection : 10 à 100 ng.
Caractérisation des protéines Taille et masse : Il existe plusieurs méthodes pour estimer la taille ou la masse d’une protéine, ces deux notions sont souvent prises l’une pour l’autre puisqu’il existe une relation linéaire entre la masse moléculaire d’une protéine et sa taille, du moins pour les protéines globulaires. . - Electrophorèse en condition dénaturante : La solution contenant la protéine est chauffée en présence de SDS ce qui a pour effet de dénaturer la protéine et en présence de 2-mercaptoethanol pour réduire les ponts disulfures. On effectue ensuite un électrophorèse en présence de SDS, a coté de marqueurs, c’est à dire de protéines dont on connaît la masse. Cette méthode permet de séparer des peptides de 5 à 200 kDa. - Electrophorèse en grandient d’acrylamide en condition native. On prépare un gel d’acrylamide à concentration variable, par exemple de 4 à 40%.. dans un tampon éloigné du point isoélectrique de la protéine de façon à ce qu’elle soit chargée. En appliquant le courrant électrique, la protéine migre jusqu’à ce que la maille du gel soit petite. La migration est donc longue, de l’ordre de 16 heures et la protéine n’est pas dénaturée. Comme pour l’electrophorèse en condition dénaturante, des marqueurs sont déposés en parallèle pour avoir un calibration. Cette méthode permet de séparer des protéines de 50 kDa à 1000 kDa. - La centrifugation zonale utilise le fait qu’un protéine de gros poids moléculaire sédimente plus rapidement qu’une protéine de petit poids moléculaire. On dépose la solution de protéine sur solution de saccharose puis on centrifuge plusieurs heures a grande vitesse pour avoir une acceleration de l’ordre de 100 000 g. On récupère ensuite les fractions le long du tube de centrifugation. La migration correspond à une vitesse de sédimentation et est exprimé en Svedberg (S). La calibration
24/10/2011 146
est effectuée en ajoutant dans l’échantillon des protéines qui sont révélées par leurs activités enzymatiques. La centrifugation analytique est une amélioration de la centrifugation zonale en effet, la migration de la protéine dans le tube est suivie au cours de la centrifugation grâce à leur absorbtion à 280 nm. - La chromatographie d’exclusion (SEC, size exclusion chromatographie) utilise le fait qu’une protéine de grosse taille ne passe pas à travers les pores d’une bille, alors qu’une protéine de petite taille passe par les pores et est donc ralentie. Les grosses molécules passent les premières et les petites sont chromatographiées. Il existe plusieurs tailles de pores pour pouvoir analyser des protéines de 10 kDa à 1000 kDa. Selon la pression utilisée en tant que vecteur de migration, on parlera de chromatographie basse pression de FPLC ou d’HPLC. Plus la pression est importante, moins il y ade diffusion et plus la résolution est bonne. . - Diffusion de la lumière statique (Static light scattering, classical light scattering, total intensity scattering) : La lumière reçue par un objet est diffusé selon un angle qui dépend de sa taille. Pour cette technique, on envoie un faisceau lumineux sur un écahntillon et on mesure sa diffusion à plusieurs angles. - Diffusion de la lumière dynanique (Dynamic Light Scattering, DLS ; Correlation photon spectroscopy). Plus un objet est petit plus sa vitesse de diffusion est importante. Si on mesure la diffusion de la lumière au cours du temps on peut estimer la vitesse de diffusion d’un objet et ainsi estimer sa taille ou plus exactement son rayon hydrodyanique. - La microspcopie permet de « voir » des objers de tailles supérieurs à 10 nm. Pour les grosses protéines ou pour les complexes de protéines, on peut utiliser la microspcopie électronique ou la microscopie de champ proche (AFM, atomic force microspcopy) - La spectrométrie de masse permet d’estimer la masse de la protéine. Cette technique est utilisée pour des protéines jusqu’à 50 kDa. - La structure trimentionelle des protéines peut être résolue par diffraction des rayons X dans un cristal ou par RMN en solution. Cette structure, lorsquelle est entièrement résolue nous donne la taille et la masse de la protéine.
24/10/2011 147
Stabilisation des protéines
Trois raisons principales sont généralement mises en avant pour expliquer la dénaturation des
protéines :
1- La protéine perd son activité via un mécanisme monomoléculaire de dénaturation physique. Des
interactions non-covalentes qui la maintiennent sous sa forme native sont remplacées par les
liaisons non covalentes qui la maintiennent sous une forme dénaturée. Une chaîne polypeptidique
peut prendre de nombreuses conformations et une seule d’entre elle correspond à l’état natif.
Dans certains, la conformation native est la seule, la dénaturation est alors réversible, par contre
dans les autres cas, il existe plusieurs conformations possibles qui correspondent à des états
inactifs, la dénaturation est alors irréversible.
2- Cette mauvaise conformation expose des régions hydrophobes à la surface de la protéine. Les
régions hydrophobes de différentes molécules réagissent entre elles et forment des agrégats.
Environ la moitié des résidus présents dans une protéine ne sont pas polaires, ils sont soit enfouis
dans le cœur de la protéine ou alors ils forment à la surface de la protéine des régions qui jouent
un rôle dans les interactions avec les autres protéines, avec les lipides constituants les membranes
ou avec les polysaccharides. Cependant, le contact des résidus hydrophobes avec les molécules
d’eau est thermodinamiquement désavantageux et est préjudiciable pour la stabilité des protéines
in vitro.
3- De nombreux groupes fonctionnels sur les protéines sont réactifs et donc susceptibles
chimiquement modifiés. L’oxidation est la voie majeure de dénaturation des protéines lors de leur
stockage. Les sites d’oxidation potentiels dans les protéines sont les chaînes latérales des
méthionines, cystéines, histidines, tryptophane et tyrosines. De plus il peut y avoir hydrolyse des
liaisons peptidiques Asp-X, destruction des ponts disulfures, et désamidation (Ahern et klibanov,
1986).
24/10/2011 148
Stabilisation des protéines par l’utilisation d’additifs.
L’ajout de stabilisateurs dans les formulations de protéines est la méthode la plus commune pour
augmenter la demi-vie des protéines. Ces composés sont souvent choisis d’une manière empirique,
l’effet obtenu est variable et dépend des caractéristiques de chaque protéine.
- On peut augmenter la différence d’énergie libre entre l’état natif et l’état dénaturé. Pour
cela on utilise des osmolytes. Les osmolytes agiraient en augmentant plus le potentiel
chimique de la forme dénaturée que celui de la forme native, Ainsi les osmolytes
augmentent la différence d’énergie de Gibbs (ΔG) entre les formes natives et dénaturées
(Arakawa et al., 1990). Dans le diagramme
d’énergie, ΔG1 est la différence d’énergie entre
la forme native (Naq) et la forme dénaturée
(Uaq) en solution aqueuse et ΔG3 est la même
différence en présence d’osmolyte. Les
osmolytes augmentent plus le potentiel
chimique de la forme dénaturée (ΔG2) que celui
de la forme native ((ΔG4). Il y a trois grande classes d’osmolytes, i) les polyols tels que le
sucrose, ii) les methylamines telles que la sarcosine iii) certains acides aminés tels que la
proline. On utilise par exemple la L-arginine (Lin et al., 2001), la L-proline, la L-serine, la
glycine, l’acide gamma amino-butyrique, la bétaine. La trimethylamine N-oxide (TMAO)
est un osmolyte naturel qui compense l’effet délétère de l’urée qui est présent à la
concentration de 400 à 600 nM dans les cellules des élasmobranches (Baskakov et al.,
1998).
- On peut stabiliser la conformation des protéines par un mécanisme d’exclusion préférentiel
ou d’hydratation préférentielle due au réseau de liaisons hydrogènes dans la couche
d’hydratation de la protéine. Les molécules génèrent une cage autour de la protéine en
excluant la couche d’hydratation et ainsi en éliminant les molécules d’eau actives à
proximité de la protéine. On utilise des polymères comme la BSA (albumine), le Poly-L-
Histidine, le Poly-L-Arginine, le dextran, le Ficoll et polyethylene glycol. Des sucres tels
que le saccharose, le trehalose (dimère de glucose liés en alpha 1.1) ou le glucose (Krest et
Uaq
Naq
Nos
Uos
ΔG2
ΔG1
ΔG3
ΔG4
24/10/2011 149
al., 1999 ; Felix et al., 1999). Des composé naturel comme l’ectoine qu’on trouve souvent
dans les bactéries halophyles (Lippert et Galinski, 1992). Les sels peuvent être caractérisés
par leur pouvoir de structuration de l’eau, effet Hofmeister. Les sels kosmotropes qui
strucurent l’eau, stablisent les protéines en favorisant une structure plus compacte. Ainsi, le
chlorure de sodium, le phosphate de sodium, le borate de sodium ou le formate de sodium
ou Na2SO4 sont stabilisant du fait de leur pouvoir d’hydratation des protéines (Bowie et
Sauver, 1989 ; Weijers et Van’t Riet, 1992 ; Ahmad et al., 2001 ; Ebel et al. 1999). D’un
autre coté, les sels chaotropes tels que KSCN, CaCl2 ou MgCl2 augmentent la tension de
surface et ainsi déstabilisent la structure des protéines (Arakawa et Timasheff, 1982).
- On peut stabiliser les protéines en diminuant les modifications chimiques des résidus. Le
saccharose peut diminuer la vitesse d’oxydation des résidus méthionine. Si la méthionine
est impliquée dans le site actif, le saccharose protègera l’activité de la protéine (De Paz et
al., 2000). Le poly(ethyleneimine) (PEI) est un polycation qui est un des meilleur
protectant contre l’oxidation. L’EDTA est un agent chélateur qui protège contre l’oxidation
médiée par des traces d’ions métallique (Andersson et al., 2000). Le sorbitol inhibe
complètement la deamidation des résidus de la protéine.
Stabilisation des protéines par mutagenèse dirigée
Il existe plusieurs méthodes pour stabiliser une protéine en modification de sa structure primaire. Une
première méthode consiste à effectuer de la mutagène aléatoire puis à cribler les mutants les plus
stables (Morawski et al., 2001). Une deuxième méthode consiste à effectuer des mutagenèses
dirigées. Pour trouver les résidus à muter, deux informations peuvent être utilisées, les données
structurales et les données phylogénétiques. Dans ce deuxième cas, la comparaison des séquences de
plusieurs espèces peut être une source d’information pour la mutagenèse. Il est par exemple habituel
de comparer des protéines d’espèces mésophile et thermophiles, le problème est qu’elles diffèrent à
de nombreuses positions (Molk et al., 2001 ; Jiang et al., 2001, Perl et al., 2000).
Stabilisation des hélices α
Il existe plusieurs méthodes pour stabiliser les hélices alpha dans une protéine.
24/10/2011 150
Une solution consiste à ajouter une triade de résidus chargés Arg(+)-Glu(-)-Arg(+) espacés à des
intervalles i,i+4 ou i,i+3 dans la chaîne peptidique (Olson et al. 2001).
Une autre solution consiste à changer les glycine en alanine. Les résidus glycine sont les moins
fréquents dans les hélices α, juste après les prolines. Cette propriété a été remarquée par des études
statistiques comme par des études thermodynamiques. L’alanine stabilise l’α hélice de plus de 2
kcal/mol par rapport à la glycine et l’alanine a une forte préférence thermodynamique pour un
environnement hélicoïdal (O’Neil and DeGrado, 1990). Ainsi, la substitution de glycine en alanine
dans les hélices augmente la stabilité des protéines (Chakrabartty et al., 1991, 1995; Munoz et al.,
1994; Pace et al., 1998; Hecht et al., 1986; Ganter et al., 1990 ; Margarit et al., 1992, Blaber et al.,
1995 ; Predki et al., 1995).
On peut aussi ajouter un « cap » à l’extrémité N-terminale de la protéine le plus souvent en ajoutant
une serine à l’extrémité et un glutamate à la position 3 pour établir une liaison hydrogène.
Enfin, certains sites peuvent aider à calculer la stabilité d’une hélice α : http://www.embl-
Stabilisation par rigidification du squelette Pour fixer la structure tertiaire on peut ajouter des prolines dans les boucles. Stabilisation par création de ponts
- Ponts disulfures : on peut introduire des liaisons covalentes en créant des ponts disulfures.
Théoriquement, l’introduction d’un lien intramoléculaire décroît l’entropie de la protéine
dénaturée (Flory, 1956), déstabilisant ainsi l’état dénaturé et stabilisant thermodynamiquement la
protéine. De nombreuses protéines telles que le lysozyme (Johnson et al.,1978, Ueda et al., 1985 ;
Wetzel et al., 1988 ; Matsumura et al., 1989), des RNases (Lin et al., 1984, Futami et al. 2000), la
subtilisine (Pantoliano et al., 1987) ont été stabilisées en ajoutant des liaisons covalentes soit par
des moyens chimiques soit par des moyens génétiques. Cependant, l’introduction de liaison
covalentes peut aussi entraîner une inactivité de la protéine.
- Les ponts salins : l’importance des ponts salins a été suggéré par Perutz et Raitz en 1975. Les
protéines thermostables provenant d’organismes thermostables ont généralement plus de ponts
salins que leurs homologues provenant d’organismes mésophiles et de nombreuses expériences
24/10/2011 151
de mutagenèse dirigée ont montré leur importance dans la stabilité des protéines. La force d’un
pont salin est estimée à 3-5 kcal mol-1. Cependant le rôle stabilisant des interactions
electrostatiques est controversé et dépend fortement de la position de l’interaction. Les ponts à
l’intérieur de la protéine sont plus favorables que les ponts à l’extérieur (Dao-pin et al., 1991) et
les interactions ioniques à la surface de la protéine peuvent même avoir un effet déstabilisant.
- Les liaisons hydrogène stabilisent les protéines. Des mutations occasionnant une perte d’une
liaison hydrogène sont souvent trouvées dans les mutants thermosensibles produisant des
protéines à stabilité réduite (Grutter et al., 1987) et une étude récente (Pace et al., 2001) a montré
que le remplacement des tyrosines en phénylalanine déstabilise habituellement les protéines.
Ainsi, les liaisons hydrogène entre groupes polaires à l’intérieur des protéines sont plus
favorables que les interactions similaires avec l’eau dans les protéines dénaturées. La stabilité due
à une liaison hydrogène a été estimée à 1,3 kcal/mol et l’introduction de nouveaux ponts
hydrogène augmente la stabilité de la protéine (Peterson et al., 1999).
Stabilisation par mutagenèse des résidus exposés au solvant :
On peut remplacer les résidus Asp et Glu qui ont des liaisons hydrogènes exposées au solvant par des
résidus isostériques neutre, Asn or Gln (Irun et al., 2001).
L’exposition des chaînes latérales hydrophobes au solvant entraîne une variation d’énergie libre
défavorable en diminuant l’entropie du solvant. Certains résidus hydrophobes peuvent être moins
exposés au solvant dans l’état dénaturé que dans l’état natif. Pour ces résidus, il y a un effet
hydrophobe inverse qui s’oppose au repliement. Ainsi, des mutations qui remplacent des résidus
exposés au solvant par des résidus hydrophobes peuvent augmenter la stabilité de la protéine (Pakula
et Sauer, 1990).
Stabilisation par ajout de sites de glycosylation
La glycosylation est une des modifications post-traductionelles les plus importantes. Les chaînes de
sucre sont liées soit à l’azote d’une asparagine soit à l’oxygène d’une sérine ou d’une thréonine. La
N-glycosylation s’effectue à la séquence Asn-X-Ser or Asn-X-Thr (Kaplan et al., 1987). L’efficacité
de la glycosylation dépends de l’acide aminé à la position X, elle est impossible lorsqu’il y a une
24/10/2011 152
proline et relativement inefficace lorsque X est un tryptophane, un aspartate ou un glutamate (Shakin-
Eshleman et al., 1996). Cette modification est co-traductionelle et la structure de l’oligosaccharide
est modifiée durant la translocation de la protéine du réticulum endoplasmique vers la membrane. La
plupart des protéines sont glycosylées dés que la chaîne polypeptidique entre dans le réticulum
endoplasmique, cependant la glycosylation ne précède pas nécessairement le repliement.
La stabilisation peut être augmentée par addition de site de N-glycosylation (Khanna et al., 2001).
Cette méthode est valable uniquement pour les protéines qui sont produites en cellules eucaryotes. Il
semble que la glycosylation décroît la dénaturation irréversible et non la dénaturation réversible
(Tams et Welinder, 2001).
Stabilisation par mutagenèse des résidus internes
On peut stabiliser les protéines en re-empaquetant leur cœur hydrophobe. Cette stratégie a donné de
bons résultats pour des protéines qui avaient des défauts de repliement évidents (Finucane and
Woolfson,1999), des résidus chargé à l’intérieur (Waldburger et al., 1995) ou des cavités qui peuvent
être remplies par des acides aminés avec des résidus plus encombrants. Cette stratégie a été appelée
«cavity-filling strategy » (Baldwin et al., 1996 ; Ohmura et al., 2001).
Stabilisation par élimination des résidus réactifs
L’inactivation thermique des protéines provient de certains acides aminés : aspartate, asparagine et
cystéine. L’asparagine est sujet à une déamidation, elle peut être remplacé par des résidus qui ont des
propriétées proches (Gln, Ile ou Thr). La présence d’aspartate conduit à la coupure de la liaison
peptidique, il peut être remplacé par un glutamate.
24/10/2011 153
Analyse des interactions entre macromolécules
Interactions acides nucléique-protéine I - Techniques permettant de déterminer la (les) protéine(s) qui se fixe(nt) sur un acide
nucléique cible (ADN ou ARN) :
I – 1 : Criblage de banque d’expression :
Il s’agit d’utiliser la très classique technique de criblage d’une banque d’expression, le criblage se
faisant ici avec un oligonucléotide double brin marqué radioactivement. Les clones exprimant la
protéine interagissant avec cet ADN seront donc repérés après autoradiographie du filtre.
Une alternative à cette technique consiste à utiliser des phages lytiques de type lambda afin d’éviter
les étapes de lyse des bactéries.
I – 2 : Simple Hybride
Cette technique est dérivée de la technique du double hybride. Elle permet
d’identifier de nouvelles protéines interagissant avec un fragment d’ADN connu – et d’accéder
directement à leur ADNc
de vérifier une interaction entre une séquence d’ADN et une protéine
d’étudier les nucléotides et/ou acides aminés impliqués dans l’interaction.
Bien sûr, la stratégie expérimentale choisie variera légèrement en fonction de ce que l’on veut faire.
Comme pour le double hybride, on travaille chez la levure.
Banque d ’ADNc clonée dans un vecteur d’expression
Transformation chez E. coli
Etale sur boîte
Transfère sur filtre (nitrocellulose ou nylon)
Lyse les bactéries -> les protéines de chaque clone bactérien se fixent sur le filtre
Bloque (ADN double brin non spécifique)
Ajoute la sonde (ADN double brin marqué au 32P)
Repère les clones positifs
Récupère ces clones sur la boîte de pétri
Séquence l’ADNc de ces clones -> identification du partenaire
24/10/2011 154
Principe :
Si la protéine X se lie sur la séquence cis régulatrice E, il y aura activation de la transcription du gène
rapporteur. Si on fait pousser les levures ayant reçu ce vecteur sur un milieu en présence de X-gal, les
colonies obtenues seront bleues.
E : Elément cis régulateur - séquence ADN cible à tester X : protéine dont on teste l’interaction avec la séquence E
• soit une banque d ’ADNc • soit un ADNc d’une protéine connu
A : domaine protéique activateur transcriptionnel (par exemple celui de Gal4) Gène rapporteur - par exemple celui de la β galactosidase Afin d’améliorer le rendement de l’activation transcriptionnelle, la séquence cible E est répétée
plusieurs fois.
Tout comme dans les cas du double hybride, un double système de sélection (β galactosidase et un
gène d’auxotrophie) est en général utilisé.
Afin d’améliorer le rendement de l’activation transcriptionnelle, la séquence cible E est répétée
plusieurs fois.
Tout comme dans les cas du double hybride, un double système de sélection (β galactosidase et un
gène d’auxotrophie) est en général utilisé.
Particularité des ARNs
Triple hybride
R t
X A
E E E
Gène rapporteur
24/10/2011 155
Le système triple hybride permet la détection d’interactions ARN-protéine dans la levure en
utilisant un test phénotypique simple. Le principe est le même que celui du double hybride mais, ici,
un ARN adaptateur est utilisé en plus. Cet ARN est une molécule hybride qui présente :
une partie correspondant à un ARN connu interagissant avec une protéine connue (ex. ARN
MS2/protéine de l’enveloppe de MS2)
une partie correspondant à l’ARN à tester.
La protéine verte est, soit la protéine à tester pour son interaction avec l’ARN, soit la
transcription/traduction d’une banque d’ADNc.
L’ARN hybride est produit à partir de la transcription d’un plasmide qui présente l’ADN
correspondant sous la dépendance d’un promoteur inductible (Pmet25 par ex.).
D. SenGupta, B. Zhang, B. Kraemer, P. Prochart, S. Fields and M. Wickens. 1996. A three-hybrid
system for detecting RNA-protein interactions. Proc. Natl. Acad. Sci. 93, 8496-8501
24/10/2011 156
Méthode de Belasco (Jain et Belasco, 1996)
Le principe est semblable à celui du simple hybride mais les interactions se font chez E. coli (et non
chez la levure) et l’interaction se fait directement avec l’ARN (et non par l’intermédiaire de protéines
comme dans le cas du triple hybride).
La séquence d’ARN à tester est introduite (sous la forme d’un ADN double brin) en amont d’un site
de fixation du ribosome (RBS) lui-même en amont d’un gène β galactosidase. L’ensemble est porté
par un plasmide portant la résistance à l’ampicilline (plasmide reporter). Si l’interaction entre la
protéine à tester et notre ARN cible se fait, l’accès du ribosome au RBS sera empêché et il n’y aura
pas de traduction de la β galactosidase. Si, par contre, l’interaction ARN/protéine ne se fait pas, le
ribosome se fixera sur le RBS et la traduction de la β galactosidase pourra se faire. La présence de β
galactosidase sera vérifiée en présence de X gal.
transcription
traduction
β galactosidase
β galactosidase
ATG
AUG
RBS
RBS ARNm
Séquence à tester
β galactosidaseAUGRBS β galactosidaseAUGRBS
Il y a interactionentre la protéine à tester et l ’ARN
Il n ’y a pas interactionentre la protéine à tester et l ’ARN
ribosome
β galactosidase
X Gal X + Gal
ADN Promoteur
24/10/2011 157
Le plasmide rapporteur est donc cotransformé avec une banque d’ADNc clonée dans un vecteur
d’expression portant la résistance au choramphénicol. Les bactéries transformées sont alors
sélectionnées sur des boites en présence d’ampicilline, de chloramphénicol et de X gal. Si la
bactérie porte un plasmide d’expression avec un ADNc correspondant à une protéine qui fixe
notre séquence d’ARN, la bactérie sera blanche. Le cas échéant, la bactérie sera bleue. On
récupère donc les bactéries blanches, on extrait les plasmides qu’elles portent et on séquence
l’ADNc qu’elles contiennent. Il s’agit de l’ADNc d’une protéine interagissant avec notre ARN. N.B. Il faut utiliser des bactéries ΔLacZ, c’est à dire des bactéries délétées pour le gène codant
pour la β galactosidase.
Jain C. & Belasco G. (1996) A structural model for the HIV-1 Rev-RRE complex deduced from altered-specificity Rev variants isolated by a rapid Genetic Strategy. Cell, 87; 115-125 South-Western Cette méthode permet de caractériser des protéines se liant sur un ADN cible. On peut aussi par cette
méthode cartographier leurs sites de liaison (Lelong et al., 1989). Les protéines sont séparées sur un
gel dénaturant (gel SDS-PAGE ou gel 2D) puis renaturées en présence d’une faible concentration en
urée et transférées sur nitrocellulose par diffusion ou encore directement électrotransférée sur
nitrocellulose. Dans ce dernier cas elle se renaturent durant le transfert. L’ADN à tester est marqué
radioactivement à ses extrémités et incubé avec la membrane de nitrocellulose.
Les fragments d’ADN spécifiquement liés à la protéine testée peuvent être élués de chaque complexe
ADN-protéine, et analysés après amplification par PCR.
L’ADN peut être :
♦ un fragment de restriction
♦ un oligonucléotide (double ou simple brin
♦ un fragment PCR, …
Si au lieu de faire migrer de l’ADN sur le gel, on fait migrer des ARN, la méthode prend le nom de
North-Western (Kwon et al., 1993).
24/10/2011 158
II - Techniques permettant de déterminer la cible (ADN ou ARN) d’une protéine :
II – 1 : Technique du Selex
La technique de SELEX (Systematic Evolution of Ligand by Exponential Enrichment), encore
appelée méthode de sélection in vitro, est une technique qui permet le tri simultané d’un mélange
complexe (plus de 1015 molécules d’ARN ou d’ADN (simple ou double brin) pour une
caractéristique particulière (ici la liaison avec une protéine).
Nous ne présenterons ici que le SELEX réalisé sur des ADN cibles double brin.
Principe :
Tout d’abord, un mélange d’oligonucléotides est synthétisé. Ces oligonucléotides sont composés
d’une vingtaine de nucléotides aléatoires (25 dans l’exemple ci-dessous) encadrés par deux
séquences constantes à partir desquelles se feront les PCR. Au moins 1015 molécules doivent être
synthétisées pour avoir des chances d’avoir un pool suffisamment dégénéré.
La polymérase de Klenow (encore appelée grand fragment de l’ ADN polymerase I d’ E.
coli), est fréquemment utilisé à la place de cette dernière chaque fois que l’ on ne désire
24/10/2011 159
pas avoir l’ activité 5' -> 3' exonuclease de cette dernière. Il a été initialement été produit
par protéolyse à partir de l’ enzyme pleine taille. La protéase utilisée pour cela est la
subtilisine.
Aujourd’hui, ce fragment est exprimé directement dans la bactérie (E. Coli) à partir du gène tronqué
de l’ADN polymérase I
Parmi ce pool d’oligonucléotides dégénéré, la sélection des molécules interagissant avec la protéine à
tester se fait par chromatographie d’affinité, gel retard ou liaison sur filtre.
Chromatographie d’affinité ou techniques dérivées : la protéine cible est tagguée, biotinylée ou on
possède un anticorps dirigé contre cette protéine. On peut alors faire une chromatographie d’affinité,
un pull-down ou une Co-immunoprécipitation
Parce que le pool présente au départ une très faible proportion de molécules d’ADN capables
d’interagir avec la protéine appât, plusieurs cycles de sélection sont nécessaires. Une amplification
par PCR des fragments isolés est réalisée après chaque round de sélection.
Oligonucléotides utilisés dans notre exemple pour la PCR :
5’ TGGGCACTATTTATATCAAC
TTACAGCAACCACCGGG-5’
Plusieurs cycles successifs de sélection/amplification vont nous permettre d’augmenter de façon
exponentielle l’abondance dans le mélange des séquences fonctionnelles, jusqu’à avoir une majorité
de ce type de séquences. La stringence des tampons utilisés pour l’interaction augmente à chaque
cycle.
24/10/2011 160
Clonage et séquençage
Après chaque cycle de PCR, on vérifie par gel retard (EMSA) que l’on a bien augmenté l’affinité du
pool d’oligonucléotides pour notre protéine.
Enfin, on aligne (par bioinformatique les séquences obtenues -> séquence consensus)
II-2 : Immunoprécipitation de chromatine
A – Analyse par gel retard de l’interaction de la protéine X avec les ADN obtenus lors des premiers cycles de SELEX, B : alignement des séquences obtenues par bioinformatique, C : séquence consensus
A
Cycles SELEX 0 1 2 3 4 5
24/10/2011 161
Le « ChIP » (Chromatin ImmunoPrecipitation) consiste à purifier des complexes ADN-protéines,
formés in vivo et liés de façon covalente par du formaldéhyde.
Principe de la Technique :
Les protéines cellulaires sont liées de façon covalente à l'ADN par un traitement au formaldéhyde.
L'ADN est ensuite clivé en fragments d’environ 500 pb par sonication.
La protéine d'intérêt est immunoprécipitée, l'ADN sur lequel elle était liée récupéré et analysé (par
exemple par PCR comme sur le schéma ci-dessous.
Avantage :
- Cette technique est réalisée sur des cellules vivantes
Inconvénients :
- Cette technique nécessite de trouver les conditions idéales d'immunoprécipitation, de cross-
link mais aussi de fragmentation de l'ADN. Le choix des oligonucléotides utilisés pour la PCR est
également important.
- Il faut avoir un anticorps très spécifique et présentant une bonne affinité pour sa protéine cible
et que la protéine étudiée soit exprimée dans la cellule en quantité suffisamment importante. On peut
détourner ces derniers inconvénients en utilisant une protéine tagguée et surexprimée mais, dans ces
conditions là, on s’éloigne de l’ « in vivo ».
Méthode :
24/10/2011 162
Fixation au formaldéhyde, sonication et immunoprécipitation
Le formaldéhyde est une petite molécule de 2 Angström, c’est un agent de liaison qui va permettre de
produire un lien in vivo à la fois « acides nucléiques – protéines » et « protéines – protéines ».
Le formaldéhyde est un composé dipolaire très réactif dans lequel les atomes de carbones agissent
comme des centres nucléophiles. Les groupements « amines » et « imines » des acides aminés
(Lysines, Arginines et Histidines) et de l’ADN (Adénines et Cytosines) réagissent avec le
formaldéhyde pour former une base de Schiff. Cet intermédiaire peut alors réagir avec un second
groupe aminé et se condenser pour donner le complexe ADN-protéine final. Ces réactions se mettent
en place in vivo en quelques minutes après l’ajout de formaldéhyde sur les cellules vivantes. La
réaction est totalement réversible. Cette réaction est réalisée par protonation du groupe « imino » à
faible pH dans un milieu aqueux.
Un autre paramètre qui doit être considéré lors de la mise au point des conditions de fixation est le
fractionnement du matériel fixé. La sonication est une des possibilités (avec la digestion par les
endonucléases) pour solubiliser le matériel fixé, en particulier la chromatine.
Pour l’identification et la caractérisation in vivo des ADNs cibles d’une protéine donnée, après
immunoprécipitation de la chromatine « crosslinkée », l’ADN est purifié puis analysé par les
techniques conventionnelles telles que le southern blot, le séquençage, l’hybridation sur puces et
l’analyse par PCR. De telles analyses demandent l’élimination de toutes les protéines de la fraction
chromatine immunoprécipitée. Pour cela, le cross-link est réversé par chauffage en solution aqueuse
(65°C, au moins 4 heures) – on peut en plus traiter à la protéinase K pour éliminer les protéines puis
l’ADN est purifié par des méthodes standards (par exemple par une partition phénol/chloroforme/eau,
suivi d’une précipitation à l’éthanol).
2) Méthodes d’analyses
- Analyse par PCR :
Si on a une idée des régions chromosomiques sur lesquelles la protéine étudiée a pu se fixer, on peut
réaliser une analyse par PCR. Pour cela, on va dessiner des oligonucléotides qui s’hybrident de par et
d’autre de la séquence à tester (séquence sur laquelle on pense que s’est fixée la protéine étudiée)
puis on réalise une PCR à l’aide de ces amorces afin de tester la présence du fragment d’ADN
correspondant parmi les fragments précipités. Si la protéine était sur cette région de l’ADN, il y aura
amplification par PCR, sinon, on n’aura pas d’amplification.
24/10/2011 163
- Analyse par southern-blot
Les fragments d’ADN immunoprécipités sont marqués (éventuellement après LM-PCR) puis
hybridés par southern blot. Ce n’est bien sûr pas un génome total que l’on a fait migrer sur le blot
mais seulement différents fragments d’ADN que l’on veut tester.
- Hybridation sur « chip » - ChIP on chip ou ChIP to chip
Dans l’expérience appelée « ChIP to chip », tous les fragments d’ADN co-immunoprécipités avec la
protéine d’intérêt sont amplifiés. Ceci est réalisé en ajoutant par ligation des linkers classiques sur les
extrémités des fragments d’ADN réparés (LM PCR). Le matériel amplifié est alors hybridé à une
puce d’ADN (DNA microarray) portant les sondes appropriées – fragments d’ADN génomique ou
correspondant à des séquences promotrices. Ces expériences sont réalisées avec deux marquages, la
deuxième couleur correspondant à l’ADN total comme contrôle (Input). Chaque ADN enrichi par
l’immunoprecipitation est enregistré comme un site de liaison potentiel pour la protéine étudiée.
24/10/2011 164
Types de puces souvent utilisés :
• Les puces génomiques : portent l’ensemble du génome – plutôt utilisées pour des organismes
peu complexes (levure, drosophile).
Point fort : on crible l’ensemble du génome
Points faibles : la résolution est mauvaise (de l’ordre de 0.5 méga base), on ne peut voir que des
régions d’interaction et non des sites. Beaucoup de faux positifs.
• Les puces à promoteurs : Point fort : peu de faux positifs. Permet de déterminer l’identité du gène concerné
Points faibles : ne portent que les promoteurs proximaux, or, on sait que des séquences régulatrices
très importantes sont en dehors de ces régions. Ce type d’array n’existe que pour quelques
organismes modèles. - Clonage puis séquençage
24/10/2011 165
L’addition d’un linker permet l’amplification de la banque et le clonage des différents fragments
dans un vecteur d’expression. Clonage
Séquençage
Cette technique est sûrement la plus valable de toutes. Cependant elle est très lourde et onéreuse à
mettre en place. En effet, le nombre de clones à séquencer pour avoir une bonne idée de l’ensemble
des sites de fixation est très important (on estime le nombre de clones à séquencer à environ 100 000
pour l’analyse des sites d’interaction dans un génome humain).
SAGE appliquée au séquençage de fragments d’ADN génomiques
obtenus après immunoprécipitation de chromatine.
24/10/2011 166
Amélioration de la technique : les PET (Paired End Tags).
Ici, on veut séquencer les extrémités de chaque fragments obtenu par ChIP afin d’avoir une signature
parfaite de chaque fragment séquencé.
Les fragments d’ADN immunoprécipités sont clonés dans un plasmide contenant le site MmeI de
part et d’autre du site d’insertion.
24/10/2011 167
Ces plasmides sont alors digérés MmeI, digérés pour les rendre bord franc puis refermés par ligation.
On réalise enfin la concamérisation de ces fragments réalisée après les avoir isolés par digestion
BseRI.
Avantage de cette technique : on obtient alors, en séquençant juste quelques nucléotides des
extrémités de chaque fragment, une idée exacte de l’ensemble du fragment.
24/10/2011 168
Si on obtient plusieurs fragments correspondant à un site de fixation, on peut les aligner ce qui nous
permettra de préciser le site d’interaction.
Une alternative au ChIP : DamID
Les expériences d’immunoprécipitation de chromatine n’étant pas toujours réalisables (en particulier
si on n’a pas d’anticorps immunoprécipitant dirigés contre notre protéine, une alternative à cette
technique a été imaginée.
Cette technique consiste à fusionner la méthylase Dam d’E coli à la protéine X dont nous
recherchons les cibles. Ainsi, quand la protéine de fusion se liera à l’ADN (par l’intermédiaire de la
protéine X) la méthylase déposera sur l’ADN une marque (méthylation) de cette interaction.
Les méthylations seront ensuite repérées après digestion à l’enzyme DpnI (seuls les sites méthylés
par Dam seront digérés). Les fragments d’ADN génomique de petite taille (digérés par DpnI) seront
alors isolés et analysés (par séquençage, PCR, hybridation, chip, …etc.).
Dam
X
Me MeDam
X
Me MeDam
X
Me Me
24/10/2011 169
Afin d’être sûr que ces méthylation sont bien spécifique de l’interaction de la protéine X avec sa cible
ADN, une transfection de la méthylase Dam seule est réalisée en parallèle.
Le schéma ci-dessous nous montre un exemple d’expérience avec analyse des résultats par chip.
A gauche : cellules transfectées par un plasmide permettant de produire la protéine X fusionnée à la méthylase Dam.
A droite : cellules contrôle transfectées par un plasmide permettant l’expression de la méthylase Dam seule.
24/10/2011 170
Méthodes permettant d’étudier les interactions acide nucléique / protéine
Electrophoretic Mobility Shift Assay (EMSA) - gel retard
Principe de la Technique :
La technique du gel retard est basée sur le retard de migration dans un gel natif de polyacrylamide de
duplexes d'oligonucléotides de séquences courtes en présence de protéines (ou de complexes
protéiques) ayant la propriété de reconnaître spécifiquement la séquence d'intérêt. La variation de
migration des duplexes (ou sondes) complexés aux protéines par rapport aux duplexes libres est
suivie grâce au marquage radioactif au 32P des sondes nucléotidiques.
Le gel retard peut être réalisé à partir de protéines purifiées mais aussi à partir d’un extrait protéique
plus complexe (un extrait nucléaire par exemple).
La spécificité de reconnaissance des sondes marquées peut être testée par l'ajout en excès du même
duplexe non radioactif qui entrent en compétition avec la forme radioactive.
La présence de protéines spécifiques dans le complexe retardé peut être mise en évidence par l'ajout
d'anticorps spécifiques qui permettent un retard plus important sur le gel appelé " supershift ".
La même expérience peut-être réalisée avec de l’ARN.
* *
* ** *
ADN nu marqué en 5 ’
ADN complexé à une protéine
ADN complexé à deux protéines
Concentrations croissantes en protéine
24/10/2011 171
Footprint – empreinte sur l’ADN
Exonucléase A
L’exonucléase A est une enzyme qui a une activité 3’-5’ exonucléase, mais ne s’attaque qu’aux
extrémités proéminentes ou franches. Elle ne coupe ni l’ADN simple brin, ni les extrémités 3’
proéminentes.
Cette activité est utile pour déterminer les limites d’une interaction entre une protéine et un fragment
d’ADN.
Si on marque au 32P une seule des deux extrémités 5’ de notre fragment d’ADN, et si l’on traite celui-
ci à l’exonucléase III pendant qu’une protéine en protège une partie, l’exonucléase III ne pourra
digérer l’ADN que jusqu’à ce qu’elle entre en contact avec cette protéine qui l’empêche de
progresser dans la digestion. La même expérience sera réalisée avec le fragment d’ADN marqué sur
l’autre extrémité.
La taille de l’ADN protégé que l’on détermine sur un gel dénaturant haute résolution nous permettra
de déterminer où est localisée l’interaction ADN-protéine.
Un des avantages de l’empreinte à l’exonucléase III est que l’ADN non-protégé par une protéine est
entièrement dégradé; une interaction partielle ne génère pas de bruit de fond.
24/10/2011 172
Dnase I
Radicaux libres
Le principe de l’empreinte se prête à différents réactifs outre les nucléases. On peut par exemple
générer dans le milieu d’incubation des radicaux hydroxyl libres qui attaquent la chaîne de phosphate
de l’ADN et cassent un des brins de l’ADN.
La réaction pour générer ces radicaux est la suivante:
Fe2+(EDTA4-) + H2O2 -> Fe3+ (EDTA4-) + HO.
C’est le radical HO. qui attaque l’ADN. Il n’a pas de préférence quant à la séquence et tend à couper
partout. Une telle empreinte peut donner plus de bruit de fond qu’une empreinte à la DNAse parce
24/10/2011 173
que cette dernière, beaucoup plus massive, peut difficilement atteindre des sites situés sous la
protéine qui protège l’ADN, alors qu’une petite molécule comme HO. y arrive plus facilement.
D’autres radicaux existent pour ce type de réaction, comme par exemple le cuivre-phénanthroline.
Le permanganate de potassium (KMnO4) par exemple, est une molécule très réactive qui oxyde
préférentiellement les thymines d’ADN monocaténaire [Rubin et Schmid, 1980; Kahl et Paule,
2001]. Il peut ainsi détecter des portions de séquences d’ADN qui sont monocaténaires. Le KMnO4 a
été utilisé pour déterminer des distorsions dépendantes de la séquence [McCarthy et Rich, 1991], des
structures d’ADN en épingle à cheveux [Balagurumoorthy et Brahmachari, 1994] ou l’ADN de type
B et l’ADN à hélice triple [Jiang et coll, 1991].
Les autres
Presque toutes les techniques utilisées pour étudier les interactions ADN-protéines in vitro peuvent
aussi être utilisées in vivo. Il est juste un peu plus difficile de faire pénétrer les réactifs dans la cellule
et d’en récupérer l’ADN par la suite. Parmi les traitements disponibles pour effectuer des empreintes
in vivo, on trouve les empreintes :
(a) à la DNAse I (il faut alors perméabiliser les cellules pour permettre l’entrée de l’enzyme, et
s’assurer de ce qu’il y ait assez de Mg2+ présent dans le milieu);
(b) au diméthylsulfate ou DMS, qui pénètre spontanément dans les cellules et va causer une
méthylation des guanines non-protégées, une activité particulièrement efficace dans le sillon majeur
de l’ADN; les guanines méthylées peuvent alors être coupées par la piperidine;
(c) l’ UV footprinting, ou formation de dimères de pyrimidines par irradiation aux rayons ultraviolets
UVB (280-320nm) ou UVC (200-280nm). Ces dimères de pyrimidines peuvent être coupés par une
photolyase et la piperidine. Cette empreinte aux UV a l’avantage de ne pas toucher aux cellules du
tout, et permet donc d’étudier une cellule très près de son état naturel.
24/10/2011 174
La technique la plus populaire pour récupérer des fragments d’ADN après une réaction d’empreinte
in vivo est celle du LMPCR, ou ligation-mediated Polymerase chain reaction.
24/10/2011 175
LMPCR et footprint in vivo :
(1) Récupération de l'ADN génomique. Cet ADN contient des coupures simple-brin, là où la DNAse
I ou un autre agent comme le DMS, a endommagé la chaîne d'acides phosphoriques.
(2) Séparation des brins et annélisation de l'un d'eux avec une amorce 1 spécifique à une région qui
nous intéresse. L'autre brin pourra être étudié plus tard lors d'une autre expérience. Notez que les
fragments d'ADN dont nous disposons à cette étape sont de tailles différentes, parce que la coupure à
la DNAse I n'est que partielle.
(2) Extension de l'amorce 1.
(3) Ligation d'un adapteur double brin à l'extrémité franche. Comme l'autre extrémité n'est pas
franche, l'adapteur ne peut pas s'y attacher. Cet adapteur a une extrémité prohéminente, ce qui
l'empêche de se liguer plusieurs fois au bout de notre extrémité franche.
(5) PCR entre une deuxième amorce spécifique (l'amorce 2, à côté du site de l'amorce 1) et une
amorce (l'amorce 3) semblable à l'extrémité prohéminente de l'adapteur que nous avons ajouté à
24/10/2011 176
l'étape précédente. Le premier cycle de ce PCR ne fonctionne que dans un sens, c'est à dire à partir de
l’amorce 2, parce que l'amorce 3 n'a pas encore de séquence complémentaire. Cette séquence sera
synthétisée lors de ce premier cycle.
24/10/2011 177
BIAcore On mesure ici l’interaction entre deux partenaires moléculaires grâce à une machine mesurant
l’intensité d’un rayon de lumière. Cette machine est fabriquée par la compagnie Biacore, qui a
donnée son nom à l’appareil.
La SPR, ou résonance de plasmon, se produit quand un rayon lumineux est réfléchi sous certaines
conditions par un film conducteur à l’interface entre deux milieux d’indices de réfraction différents.
Dans le système Biacore (tm) ces milieux sont (1) la solution dans laquelle se trouvent les molécules
à analyser et (2) le verre d’une lame qui sert de senseur. Le film conducteur à l’interface des deux est
un très fin film d’or à la surface de la lame de verre.
La résonance de plasmon cause une réduction de l’intensité de la lumière réfléchie à un angle
spécifique de réflection. Cet angle varie avec l’indice de réfraction près de la surface du côté opposé
à la lumière réfléchie (c’est donc dire du côté de l’échantillon).
Dans le système Biacore (www.biacore.com) , la molécule appât est attachée à la feuille d’or, du côté
solution. Les molécules avec lesquelles elle peut interagir sont ajoutées en flot continu. Si l’une
d’entre elles interagit avec l’appât, la concentration locale en molécules augmentera dans la région
immédiate de l’appât, ce qui fera changer l’indice de réfraction local.
Le changement d’indice de réfraction aura pour effet de changer l’angle pour lequel la lumière
réfléchie perd un maximum d’énergie par résonance.
Le système détecte un changement et enregistre une interaction. La mesure du niveau d’interaction en
fonction du temps permet d’évaluer le taux d’association.
Une unité de résonance (RU) correspond à un changement de 0.0001° dans l’angle donnant une
intensité minimale de lumière réfléchie, ce qui pour la plupart des protéines correspond à un
changement de concentration de l’ordre de 1 pg/mm2 de surface sur la lame de verre. Le Biacore est
donc extrêmement sensible.
24/10/2011 178
Les puces en général…
ANNEXE :
Les puces à ADN (DNA microarray) permettent un criblage rapide et simultané d’un génome ADN.
Les puces à ADN consistent en un support solide (petite lame de verre comme celles utilisées en
microscopie traditionnelle ou membrane de nylon) sur lequel des milliers de fragment d’ADN sont
déposés de façon géométrique à l’aide d’une micropipette robotisée. Grâce à cette technique, chacun
des fragments d’ADN est représenté par un point sur le support (ou puce). Ils servent de sondes pour
fixer de façon très spécifique les fragments de gènes complémentaires (cibles), présents dans les
échantillons biologiques à tester : leur mise en contact permet de reconstituer la double hélice d’ADN
et ce phénomène (hybridation) peut être mis en évidence par des techniques optiques sous éclairage
fluorescent ou par détection de radioactivité; un système de « marquage » de l’échantillon au moyen
de traceurs fluorescents ou radioactifs ayant été réalisé préalablement. La quantification des signaux
obtenus et l’identification des fragments de gènes reconnus sont ensuite rendues possibles au moyen
d’un système d’acquisition d’image puis d’analyse des données faisant appel à des logiciels
informatiques spécialement conçus à cet effet. Les résultats obtenus sont ensuite validés sur le plan
statistique et interprétés dans un contexte biologique.
24/10/2011 179
Le potentiel de cette méthodologie est énorme, mais la masse de résultats qui résulte de ces
expériences est considérable et leur exploitation par le biais de programmes informatiques n’en est
encore qu’à ses débuts. De nombreux développements sont encore à faire au niveau des logiciels
d’analyse et de représentation afin d’extraire de ces données le maximum de sens sur le plan
biologique.
Le terme « puces à ADN » est un terme générique. Il existe actuellement 2 procédés majeurs de
fabrications de puces à ADN ce qui permet de distinguer différents types de puces : (1) les macro et
microarrays avec un dépôt direct de molécules d’ADN sur leur support (2) les puces à
oligonucléotides avec la synthèse in situ des sondes oligonucléotidiques sur une surface solide.
Les macroarrays ou filtres à haute densité :
Les dépôts (sondes) sont des clones d’ADNc ou des produits de PCR fixés à haute densité sur une
membrane de nylon (8 x 12 cm). Le marquage est le plus souvent radioactif et le criblage est réalisé
en excès de cible, on obtient ainsi une mesure de l’abondance relative de chacun des ARNm présent
24/10/2011 180
dans l’échantillon de départ. On parle de macroarrays jusqu’à une densité d’environ 25 fragments
ADN déposé par cm2.
filtres à haute densité ou macroarrays
Les microarrays :
Ils permettent la miniaturisation des dépôts d'ADN, ce qui permet de fixer plusieurs milliers
de sondes sur des surfaces égales ou inférieures à celle d’une lame de microscope standard. Elles sont
déposées à une densité de 1 000 sondes/cm2 par un robot sur des lames de verre au préalablement
traitées chimiquement, soit jusqu’à 12 000 sondes/lame.
Les sondes sont généralement des ADN double brin de longueur de 200 à 2000 bp amplifiés
par la technique de PCR mais récemment, des oligonucléotides longs (50-70 mers) ont également été
greffés sur la puce après leur synthèse.
Les cibles utilisées sont réalisées par transcription inverse, à partir d’ARN total ou messager
utilisant 2 fluorochromes différents (Cy3 et Cy5) ce qui permet d’hybrider simultanément 2 cibles sur
une même sonde. Les signaux d’hybridation sont analysés grâce à un lecteur capable de discriminer
les 2 fluorochromes et de générer deux images dont le niveau de gris représente l’intensité de la
24/10/2011 181
fluorescence lue. Si on remplace les niveaux de gris par des niveaux de couleur verte pour la
première image et rouge pour la seconde, on obtient en les superposant une image en fausses couleurs
composée de spots allant du vert au rouge en passant par le jaune.
Un excès du gène X dans l’échantillon marqué en rouge donnera un signal rouge ; un excès du
gène Y dans l’échantillon en vert donnera un signal vert ; une expression équivalente du gène Z dans
les deux échantillons donnera un signal jaune. On calcule ensuite le ratio des intensités de
fluorescence rouge/fluorescence verte pour chacun des spots ce qui permet de rechercher une
expression différentielle des gènes dans les 2 échantillons biologiques étudiés. Généralement, on fixe
la limite d’un ratio supérieur à 2 ou inférieur à 0,5 pour considérer qu’un gène est sur- ou sous-
exprimé dans une des cibles par rapport à l’autre.
On peut ensuite essayer de regrouper des gènes ayant le même profil d’expression sur
plusieurs expériences ayant un rapport biologique.
24/10/2011 182
Principe d'une hybridation sur microarrays
Les puces à oligonucléotides :
Elles dérivent à l’origine d’un projet de séquençage par hybridation. Les puces les plus couramment
utilisées sont les puces de la société Affimetrix. Dans ce cas, les sondes sont des oligonucléotides
synthétisés in situ par une technique de photolithographie. On peut synthétiser jusqu’à 300 000
oligonucléotides représentant 30 000 gènes sur une puce d’une surface d’environ 1 cm2. On hybride
une seule sonde par puce et l’intensité de fluorescence mesurée par un scanner permet une mesure de
l’abondance relative de chacun des ARNm présent dans l’échantillon biologique étudié.
24/10/2011 183
Interactions protéine - protéine
1. Avant propos
♦ Liaisons stables – liaisons transitoires
Deux protéines peuvent s’associer indépendamment de tout autre partenaire de deux manières
différentes :
Liaisons stables : toute association donnant naissance à un complexe que l’on peut isoler
(Attention, ne pas confondre avec liaison covalente ! une liaison peut-être stable sans être covalente).
Liaison transitoire : donnent des complexes trop peu stables pour que l’on puisse les isoler. Dans ce
cas là, l’isolement de ces complexes passera souvent par une étape préliminaire de cross-link
(pontage covalent réalisé par un traitement chimique ou physique).
La force de la liaison (affinité) est définie par des paramètres d’équilibre et en particulier par le Kd ou
constante de dissociation.
♦ Notion de Kd Kon Kon : constante de vitesse de formation du complexe A + B <====> AB Koff Koff : constante de vitesse de dissociation du complexe [A] x [B] AB
Kd = [A] [B] / [AB] = koff / kon = 1 / Ka (constante d’association)
Avec [A], [B], [AB] : respectivement concentration en A, B et AB
Quelques exemples de Kd :
streptavidine / biotine : 10-14 M Histone / ADN 10-11 M
Antigène / Anticorps : 10-8 à 10-10 M pour un bon anticorps, 10-6 M pour un anticorps plus faible
♦ Liens moléculaires
Les interactions protéine / protéine sont possibles grâce à la formation de liaisons non covalente. Ces liaisons sont de différente nature : • Liaisons ioniques - interactions qui relient deux atomes de charges opposées- la plus forte des
liaisons non covalentes
24/10/2011 184
• Liaisons hydrogène - se forment à chaque fois qu’un atome d’hydrogène lié à un atome
électronégatif est à proximité d’un autre atome électronégatif (en général oxygène et azote) -
L’énergie de liaison est moyenne
• Liaisons hydrophobes - se rencontrent lorsque deux molécules hydrophobes voisines se
rencontrent (par exemple deux acides aminés hydrophobes) - l’énergie de liaison est faible
• Forces de Van Der Waals – interactions électrostatiques entre deux atomes voisins. Doivent
être très proches car l’énergie de cette liaison est très faible.
2. Introduction
Les génomes de différentes espèces procaryotes mais aussi eucaryotes ayant été séquencés ces
dernières années, la majorité des efforts de la communauté scientifique se porte aujourd’hui sur
l'analyse du produit des gènes, les protéines. En effet, le nombre et la fonction biologique de la
plupart de ces molécules codées par les gènes ne sont pas encore connus. L’étude des protéines est
appelée la protéomique.
Comment accéder à la fonction (aux fonctions) d’une protéine X ?
Analyse in silico :, recherche de protéines présentant des
homologies de séquences, recherche de domaines connus (de
liaison à l’ADN par exemple), …
Etudes biochimiques : recherche d’une activité
enzymatique
Etudes de biologie cellulaire : cellules/compartiments
cellulaires dans lesquels la protéine est présente
Etudes de biologie structurale : recherche de domaines
structuraux de fonction connue
Etudes génétiques : inactivation du gène (KO, RNAi)
suivie d’étude du phénotype obtenu
Etudes biologie moléculaire : facteurs impliqués dans la régulation de ce gène ?
Comme les protéines fonctionnent le plus souvent (toujours ?) en réseaux, l'identification des
interactions entre protéines permet de mieux comprendre leur fonction (si la fonction du (des)
24/10/2011 185
partenaires de la protéine X est connue, cela nous donnera des informations sur sa propre fonction) et
permettra éventuellement de découvrir de nouvelles cibles thérapeutiques.
=> Etude de l’INTERACTOME
3 - Recherche de partenaires protéiques à partir d’une banque d’ADNc
Principe de ces techniques :
Les partenaires protéiques de la protéine d’intérêt (que nous appellerons la protéine appât) seront
recherchés à partir de banques d’ADNc. Ces ADNc seront transcrits puis traduits chez un hôte
particulier (la nature de l’hôte dépend de la technique choisie). L’interaction sera révélée par
différentes méthodologies décrites par la suite.
Intérêt de ces techniques :
une fois le partenaire identifié, on aura directement accès à son ADNc.
Simplicité de mise en œuvre
Inconvénients :
Les interactions binaires pourront essentiellement être étudiées
Les interactions sont réalisées avec des protéines hétérologues ou recombinantes (problème de
quantité relative des partenaires, de compartimentation de la cellule, de modifications post-
traductionnelles, …).
3.1 - Criblage en interaction sur colonies ou sur plages de lyses
Il s’agit d’utiliser dans un premier temps la très classique technique de criblage d’une banque d’expression, la seule différence repose sur le fait que le criblage ne fait pas par hybridation avec une sonde simple brin radioactive mais avec la protéine appât (que nous appellerons protéine X) au préalablement marquée. Les clones exprimant la protéine interagissant avec la protéine X seront donc repérés par sa visualisation (autoradiographie si la protéine X est marquée radioactivement). Les clones positifs, contenant l’ADNc des partenaires de la protéine X, seront identifiés par séquençage.
24/10/2011 186
Pour marquer la protéine appât, on peut la traduire in vitro en présence de méthionine 35S. On peut
aussi la biotinyler ou encore la produire chez E. coli en fusion avec une étiquette facilement
repérable. On peut enfin la repérer grâce à des anticorps.
La banque peut être réalisée dans un plasmide ou dans un phage (lamda par exemple). L’avantage du phage sur le plasmide est qu’il évite l’étape de lyse des bactéries. Avantages de cette technique : ceux déjà cités plus haut pour l’ensemble de ces techniques. Inconvénients de cette technique :
les interactions se faisant à partir de protéines fixées sur des filtres (nitrocellulose ou nylon),
l’efficacité de liaison entre la protéine X et ses partenaires est moins bonne.
Cette technique nécessite d’avoir la protéine X purifiée.
Si on veut tester un grand nombre de partenaires, il faudra cribler un grand nombre de boîtes.
3.2 - Phage display
Une alternative à cette technique consiste à faire du phage display, on peut alors faire un
enrichissement des phages positifs en milieu liquide, ce qui permet de tester un grand nombre de
clones sans augmenter la charge de travail.
Cette technique consiste à faire exprimer la protéine cible à la surface d’un bactériophage non lytique.
Ces phages seront utilisés pour infecter des bactéries E. coli.
Le bactériophage utilisé ici est le bactériophage filamenteux
M13. Pour faire exprimer nos protéines à tester en surface de
ce bactériophage, leur ADNc est cloné en fusion avec le gène
Criblage avec la protéine X marquée
24/10/2011 187
III qui code pour une protéine mineure de la capside qui est
exprimé à la surface du phage.
Le site de clonage se trouve en N terminal de la protéine du gène III afin que le motif protéique
variable soit tourné vers l’extérieur, donc accessible à une sélection. Entre la séquence codante du
gène III et les ADNc, on met une séquence « espaceur » afin que les protéines à tester puissent
adopter un repliement indépendant de celui de la protéine "III". Une banque d’ADNc est insérée dans
l’ADN du phage au niveau du site de clonage.
L’ADN phagique ainsi modifié est transformé dans des bactéries E. coli (avec en théorie un phage
donc une protéine recombinante par bactérie) puis les phages sont obtenus par infection avec le
bactériophage « helper » M13KO7. Ce bactériophage présente un génome modifié qui ne permet pas
sa réplication. Il permettra par contre la formation des bactériophages à partir des ADN phagiques
portant les ADNc. Les phages recombinants sont récupérés dans le surnageant de culture puis
sélectionnés par rapport à leur interaction avec la protéine pour laquelle on recherche des partenaires.
La sélection peut se faire de différentes façons en fonction des caractéristiques de la protéine pour
laquelle on recherche des partenaires (protéine appât) :
• Fixation directement sur un support activé
Les supports ou matrices utilisés pour la chromatographie d'affinité sont généralement des billes d'agarose ("Sepharose™", Pharmacia®). L'immobilisation du ligand sur la matrice nécessite qu'il soit préalablement activé, c'est-à-dire qu'il faut créer des sites réactionnels qui permettent d'établir des liaisons covalentes avec la protéine appât. • Colonne d’affinité
Si la protéine est étiquetée ou biotinylée, ou encore si on lui connait un ligand, on peut sélectionner
les phages positifs en réalisant une colonne d’affinité.
Les phages ainsi sélectionnés sont
utilisés pour réinfecter des souches
bactériennes, les surnageants sont
Particules virales exprimant des fragments d ’ADNc
Fixation surune protéine
cible
lavages
Élutions(augmente
conc. en NaCl par ex.)
Amplifications(infection d ’E. coli) 3 à 4 X
24/10/2011 188
récupérés et resélectionnés contre
la protéine. En répétant cette étape
de sélection plusieurs fois (en
augmentant la stringence de
l’interaction à chaque cycle), on
enrichit notre population en clones
produisant les protéines
recombinantes interagissant le
mieux avec l’appât. Ces candidats
sont alors isolés (par dilutions ou
sur boites – en effet, bien que le
phage ne soit pas
lytique, sa présence dans une bactérie diminue sa vitesse de division, on voit donc apparaître des
« pseudo » plages de lyse sur les tapis bactériens). L’ADNc du phage est alors séquencé, permettant
ainsi l’identification des les partenaires de la protéine X.
Avantages de cette technique : permet de cribler rapidement une grande quantité de clones. Inconvénients de cette technique : seules des interactions de forte affinité peuvent ainsi être étudiées (au moins 10-8M), nécessité d’avoir des quantités importante d’appât purifié.
3.3 - Double hybride ou « piège à interaction ».
Cette technique est basée sur la capacité des domaines de liaison à l’ADN (BD) et d’activation de la
transcription (AD) du facteur de transcription Gal4 à fonctionner de manière indépendante. Dans le
système du double hybride, ces deux domaines sont séparés et chacun est fusionné aux protéines
d’intérêt (X et Y). Ainsi, c’est l’interaction entre les deux protéines X et Y qui permettra de
reconstituer un facteur de transcription actif. Il y aura alors transcription de gènes rapporteurs.
Gène rapporteur : gène non présent dans la souche de levure utilisée et dont l’expression est
facilement repérable. Ex : lacZ : gène d’E. coli, non présent chez S. cerevisiae – facile à repérer
grâce à son activité enzymatique.
La séquence codant la protéine X (l’appât) sera fusionnée à la séquence codant pour le domaine de
liaison à l’ADN de Gal4 -> clonée dans un plasmide
La proie (protéine Y) correspondra soit à l’ADNc de la protéine dont on veut tester son interaction
avec la protéine X, soit une banque d’ADNc si aucune expérience préliminaire n’a encore été
24/10/2011 189
réalisée. Sa séquence sera fusionnée avec le domaine d’activation de la transcription de Gal4. ->
clonée dans un plasmide.
Le gène rapporteur, précédé du promoteur portant les sites de liaison de Gal 4 (répétés 6x), est
inséré dans le génome de la levure. Parmi les sites de liaison de Gal4, l’UAS de Gal1 est souvent
utilisé.
UAS : Upstream Activated Sequence
Les deux plasmides sont co-transformés dans la souche de levure appropriée présentant le gène
rapporteur sous la dépendance d’une UAS de Gal4 et déficiente pour les gènes d’auxotrophie utilisés
comme marqueurs de sélection.
Si le gène rapporteur est LacZ, les colonies positives seront capables de pousser sur milieu galactose
et, en présence de Xgal, les levures seront bleues.
Xgal : Le X-gal, ou 5-bromo-4-chloro-3-indolyl-beta-D-galactopyranoside est un
dérivé du galactose, lié à un noyau indole. Il peut être hydrolysé par la β-
galactosidase, produit du gène LacZ, en formant un composé bleu, ce qui permet de
détecter la présence de cette enzyme.
Le dosage de l’activité β galactosidase peut nous donner une idée de la force de l’interaction.
Les protéines X et Y n’interagissent pas.
Les protéines X et Y interagissent.
Xgal
ExpressionY X
Sites de liaison de Gal 4
Gène rapporteur Gal 4 BD
Gal 4 AD
ARN Pol II
Sites de liaison de Gal 4
X Gal 4 BD
Y Gal 4 AD
ARN Pol II Gène rapporteur
Pas d’expression
24/10/2011 190
Les levures utilisées pour ce double hybride seront donc : Gal4-, déficientes pour les gènes
d’auxotrophie utilisés, et porteront le gène rapporteur (sous la dépendance de Gal4) inséré dans
leur génome
Les limites de la méthode sont essentiellement le très grand nombre de clones artéfactuellement
Pour limiter le nombre de faux positifs, il est nécessaire, en préalable ou suite au criblage, d’effectuer de nombreux contrôles et d’utiliser comme « marqueur » d’interaction plusieurs gènes rapporteurs différents par la séquence de leur promoteur.
On utilisera, chaque fois que cela est possible, des contrôles positifs (deux protéines dont l’interaction a déjà été caractérisée) et des contrôles négatifs (des protéines dont on sait qu’elles ne présentent pas d’affinité l’une pour l’autre, transfection d’un plasmide vide avec l’autre plasmide recombinant). Faux positifs les plus fréquemment rencontrés :
Transactivateurs :
C’est la capacité de X ou Y à activer spontanément la transcription des gènes rapporteurs lorsqu’ils
sont fusionnés à BD ou AD.
1er cas : l’appât X est transactivateur, la transactivation peut être directe (a) ou se faire via une
interaction avec une protéine résidente de la levure (b)
Contrôles: expression indépendante de la protéine de fusion BD-X dans S. cerevisiae (témoin négatif)
2ème cas : la proie Y est transactivatrice. Ceci a lieu quand la protéine AD-Y est recrutée au
promoteur Gal de manière indépendante de la proie. Il y a 2 cas classiques :
1. liaison directe de Y au promoteur (a)
2. liaison à des protéines (b) de l’hôte complexées au promoteur (ex : TATA Binding Protéine)
(a) Y AD (b)
Leu2
Leu2
Leu 2
ZX
BD
X
BD
Y AD
(b)La protéine appât X lie une protéine de la levure capable d’activer la transcription
(a) la protéine appât a une activité transactivatrice
24/10/2011 191
Contrôles à effectuer : expression de AD-Y seul (témoin négatif)
Faux positifs dus à une affinité artéfactuelle des protéines proies et appât par les domaines
BD et AD
2 cas classiques :
1. La protéine proie reconnaît BD
2. La protéine appât reconnaît AD
Intervention d’une troisième protéine Z « adaptatrice » :
2 - Faux négatifs (incapacité à mettre en évidence par double hybride des interactions qu’on
sait exister in vivo).
La (les protéines) n’est (ne sont) pas produite(s) dans la levure
La protéine n’entre pas dans le noyau ⇒ Contrôle : Vérifier la présence et la localisation de nos
protéines de fusion dans les levures (par exemple en immunofluorescence)
Contrôle avec techniques d’étude des interactions protéine/protéine in vitro (ex : GST-pull-down, co-immunoprécipitation)
X
BD
Y AD
X
BD
Y
AD
Y AD Z X
BD
24/10/2011 192
Certaines modifications post-traductionnelles sont absentes
Protéines chimériques mal repliées
Les protéines ne sont pas dans leur environnement naturel ⇒ pas d’interaction possible dans un
environnement autre (pH, concentration saline, … non adéquat)
⇒ Contrôle : tester, chaque fois que c’est possible, une proie connue pour interagir avec l’appât
Conclusion
♦ La méthode du double hybride permet de montrer que 2 protéines sont capables d’interagir de
façon binaire lorsqu’elles coexistent dans le noyau de la levure. La technique n’est pas suffisante en
soi pour valider une interaction.
♦ Le résultat doit être validé par d’autres types d’expériences complémentaires (co-
immunoprécipitation, pull-down)
♦ Nécessité d’une validation biologique : les deux protéines coexistent-elles dans l’organisme ?
L’interaction peut-elle avoir une signification biologique ?
Références Brachmann and Boeke (1997) Current opinion in biotechnology 8: 561-568 Vidal M. and Legrain P. (1999) Nucleic Acids Research 27, n° 4, 919-929; Fashena et al. (2000) Gene 250, 1-14 Suter B, Kittanakom S, Stagljar I. (2008) Curr Opin Biotechnol. Aug;19(4):316-23.
3.4 – Complémentation (PCA Protein fragment Complementation Assay).
Cette méthode permet de tester les interactions protéine-protéine à l’intérieur des cellules vivantes,
quelles qu’elles soient. Elle permet soit d’étudier une interaction entre des protéines connues, soit
d’identifier, à partir d’une banque d’ADNc, le (les) partenaires d’une protéine. Dans la stratégie PCA,
une enzyme ou une protéine facilement détectable soit directement par sa présence (protéine
fluorescente) soit par son activité (par exemple avec la β galactosidase). Cette protéine est appelée
« reporteur ». Elle sera alors séparée en deux fragments et les deux fragments seront fusionnés avec
les protéines dont on veut tester l’interaction (protéines A et B dans le schéma ci dessous). L’activité
de la protéine reporteur est alors conditionnelle de l’interaction entre les deux partenaires. Les deux
fragments de la protéine reporteur ne doivent pas à être capables de s’associer indépendamment des
protéines A et B.
Avantages de la stratégie PCA :
24/10/2011 193
Les interactions moléculaires sont visualisées plus directement – et non au travers d’événements
secondaires comme une activation transcriptionnelle -> moins de faux positifs/négatifs.
Ces expériences peuvent être réalisées dans tous organismes et types cellulaires.
La localisation cellulaire peut-être choisie, y compris au niveau des membranes.
Inconvénients de la technique PCA:
peut manquer de sensibilité si les constantes d’affinité entre les protéines à tester sont faibles.
L’interaction entre les protéines A et B doit permettre le rapprochement dans l’espace des deux
parties du reporteur – pour pallier à ce problème, on utilise des espaceurs – séquences de quelques
acides aminés (souvent des glycines) qui permettent une grande flexibilité dans le positionnement des
deux parties des protéines de fusion. On peut aussi tester les fusions en N et C terminal des protéines
reporteurs.
Les protéines reporteurs utilisées peuvent être de différentes natures, l’une d’elles est présentée
ci-dessous.
luciférase (Osawa et al, 2001)
Certains êtres vivants tels que la luciole (firefly) émettent
spontanément de la lumière par un phénomène appelé
bioluminescence.
La luciférase de type Firefly est une protéine monomérique de
61kDa très utilisée en imagerie de bioluminescence. Cette
protéine catalyse l’oxydation de la luciférine selon les réactions
décrites dans la figure ci-contre: l’activation de la luciférine par
la luciférase en présence d’ATP permet la formation d’un
complexe instable qui émettra de la lumière lors de son retour à
un état fondamental.
Réaction d’oxydation de la luciférine par la luciférase Firefly
Ici, la luciférase sera séparée en deux parties : la partie N terminale (acide aminés 1 à 437)
et la partie C terminale (acides aminés 438 à 544).
Ces deux parties ne sont pas capables de s’associer.
24/10/2011 194
L’activité de la luciférase est détectée par la mesure de la bioluminescence émise en présence de
luciférine.
Ozawa T, Kaihara A, Sato M, Tachihara K, Umezawa Y. 2001 Anal Chem. 73(11):2516-21.
4 Recherche de partenaires protéiques à partir d’un extrait protéique : Co-
immunoprécipitation (co IP)
4 – 1 : Principe général : La co immunoprécipitation est une technique qui consiste à isoler un complexe protéique en utilisant un anticorps dirigé contre un des membres du complexe. Si on recherche les partenaires de la protéine X, on va donc utiliser un Ac antiX qui nous permettra de l’immunoprécipiter. Avec elle seront isolés ses partenaires protéiques. Ces protéines seront alors identifiées. L’anticorps utilisé sera de préférence un anticorps polyclonal, afin d’éviter que l’épitope reconnu par l’anticorps ne soit masqué dans le complexe. L’immunoprécipitation se fera alors en utilisant de la protéine A ou de la protéine G, couplée à des billes de sépharose, d’agarose ou des billes magnétiques. Le choix protéine A / protéine G dépend de l’anticorps que l’on va utiliser (ex. protéine A pour un IgG préparé chez la souris).
Les protéines A et G sont des protéines recombinantes d’origine microbienne qui présentent la capacité de fixer les molécules d’immunoglobuline de mammifère. Ces protéines sont couplées de façon covalente à des billes de sépharose. L’interaction entre ces protéines et les immunoglobulines n’est pas équivalente pour toutes les catégories d’anticorps : Antibody Protein A Protein G Human IgG S S W = interaction faible Goat IgG W S S = interaction forte Chicken IgG NB NB NB = pas d’interaction; — non testé Si les Ig dont nous disposons pour faire l’immunoprécipitation ne se fixent ni sur la protéine A, ni sur la protéine G, il est toujours possible de faire un « sandwich » : 4 – 2 : le matériel de départ :
Le matériel de départ correspond à un extrait protéique qui sera réalisé par une lyse des cellules,
suivie d’une sonication (pour casser l’ADN, ce qui permet de diminuer la viscosité de la solution)
puis d’une clarification par centrifugation (afin d’éliminer les débrits cellulaires). Si le nombre de
protéines ainsi isolées est trop important et si on connaît la localisation de la protéine appât dans la
Protéine A
Anticorps
Protéinecible
PartenaireBill
e de
séph
aros
e
24/10/2011 195
cellule, on peut simplifier le système en faisant du fractionnement cellulaire. Le même protocole
précédemment décrit sera alors appliqué après fractionnement.
4 – 3 : Méthodologie : Pratiquement, on va dans un premier temps réaliser l’interaction extrait protéique/protéineA ou G
fixée sur les billes. Cette étape va nous permettre d’éliminer toutes les protéines de l’extrait qui se
fixent sur les billes de façon non spécifique (clearing).
On va alors centrifuger et récupérer le surnageant. Puis on va ajouter l’anticorps dirigé contre notre protéine puis, enfin, un nouveau lot de billes protéine A/ G. On va à nouveau centrifuger (ou passer sur le portoir aimanté) et récupérer les billes que l’on va laver afin de se débarrasser de toutes les interactions non spécifiques.
Enfin, il faudra éluer les complexes des billes. Différentes techniques sont alors possibles en fonction du type d’analyse que l’on veut réaliser sur les co-immunoprécipitats (reprendre dans du tampon SDS/DTT et chauffer si on veut faire une séparation sur gel polyacrylamide dénaturant, élution par la force ionique si on ne veut pas récupérer notre protéine, élution par un peptide compétiteur, élution par choc acide, …) 4 – 4 : Identification des protéines du complexe : Une fois les complexes isolés, elles devront être identifiées. Cependant, une étape de séparation des
membres du complexe est généralement utilisée comme étape préliminaire.
Séparation des protéines
Gel 1D (dénaturant, de type SDS-PAGE)
C’est la façon la plus simple de procéder mais on peut être limité par la qualité de la résolution (bandes trop proches sur le gel pour pouvoir être séparées). Pour améliorer la résolution du gel, on peut jouer : Sur le % en acrylamide, éventuellement en gradient Sur le tampon de migration (tris tricine par exemple) Sur la taille du gel Une fois les protéines séparées, il faut les identifier. Identification des protéines
Western blot
Si on présume de la présence d’une protéine partenaire P déjà connue, on peut faire un western blot à l’aide d’un anticorps anti-P. Si les protéines ont été récupérées par co-immunoprécipitation, on peut, dans certains cas, rencontrer un autre problème : la protéine que l’on veut détecter migre à la même vitesse que les chaînes lourdes ou légères des anticorps qui nous ont servi à immunoprécipiter. Dans ce cas là, deux solutions sont possibles.
24/10/2011 196
Utiliser des anticorps secondaires qui détectent la forme native (avec les ponts disulfide) des
immunoglobulines, permettant ainsi de ne pas révéler les anticorps qui ont permis de réaliser
l’immunoprécipitation qui eux sont dénaturés (traités au SDS).
Une deuxième possibilité consiste à utiliser pour le western blot un anticorps réalisé dans une
espèce différente de celle qui a été utilisée pour fabriquer l’anticorps utilisé en immunoprécipitation.
Digestion trypsique / Spectroscopie de Masse Maldi-ToF
La première étape consiste à découper la/les bandes d’acrylamide qui contiennent des protéines. Pour cela, il faut colorer le gel. Le bleu de coomassie est le plus souvent utilisé pour cette étape. Une alternative à cela consiste à analyser l’ensemble du gel. Pour cela, la piste de migration sera découpée en bandes de tailles égales et chacune de ces bandes sera analysée. Les bandes découpées sont alors digérée à la trypsine (ou toute autre protéase spécifique). La masse précise de l’ensemble des peptides obtenus est alors déterminée par spectrométrie Maldi ToF (ou autre spectrophotomètre de masse présentant ce type d’ionisation). La comparaison avec des banques de données nous permet d’identifier la protéine recherchée. Si des ambiguïtés restent à lever, un séquençage par LC/MS/MS est possible, il nous permettra d’obtenir la séquence de 5 à 10 acides aminés. La digestion trypsique est alors toujours une digestion totale et la séparation des peptides est réalisée grâce à un système de chromatographie en phase liquide (LC) qui est couplé au Spectro de Masse (en tandem). Le premier étage de MS sert à sélectionner un ion, et le second analysera les ions issus de la fragmentation de celui-ci. La fragmentation se réalise par coupure au niveau des liaisons peptidiques principalement (et ce à partir des deux extrémités). Il est alors possible de déduire de l'ensemble des ions obtenus la séquence peptidique lue simultanément dans les deux sens. 4 – 5 : Avantages/inconvénients : Avantages de la co IP ::
Le complexe s’est formé in vivo avec de la protéine «endogène» .
L’affinité Ag/Ac est généralement très forte et spécifique.
Inconvénient de la coIP :
Il faut avoir un Ac immunoprécipitant c'est-à-dire un anticorps reconnaissant la protéine appât
au sein d’un complexe avec à la fois une forte affinité et une grande spécificité.
Un autre inconvénient est la quantité de protéine appât endogène dans les cellules. Si elle est
trop faible, la quantité de complexe isolée ne sera pas suffisante pour isoler les complexes.
Dans le cas de complexes de tailles très importantes, le/les épitope(s) peuvent être masqués,
on ne pourra pas alors utiliser cette méthode.
24/10/2011 197
Pour cette technique également, il faudra réaliser différents contrôles et en particulier extrait
+billes protéine A/G+Ac non spécifique.
4 – 6 : Alternatives à la Co Immunoprécipitation : - Chromatographie d’affinité, pull down.
Quand l’immunoprécipitation n’est pas possible (on n’a pas d’anticorps utilisable pour
l’immunoprécipitation ou la protéine appât est en concentration trop faible dans nos cellules pour
récupérer suffisamment de complexes pour leur analyse ultérieure), on utilisera des variantes à cette
techniques que sont les chromatographies d’affinité ou les « pull down » (chromatographies d’affinité
pour lesquelles la phase stationnaire n’est pas insérée dans une colonne mais est récupérée par
centrifugation.
Pour la purification d’un complexe protéique associé à une protéine X, on utilise un support solide constitué de billes d’agarose ou de sépharose sur lesquelles on a greffé un ligand présentant une forte affinité avec la protéine X.
Ces billes seront alors introduites dans une colonne. Ensuite on fait passer l’extrait de protéine contenant la protéine X. Après différents lavages, l’élution se fera le plus souvent à l’aide d’un compétiteur. Une autre possibilité est d’utiliser un gradient de force ionique. Dans ce dernier cas, sortiront les premières les protéines faiblement associées dans le complexe (souvent par des liaisons indirectes), puis celles plus fortement liées.
Si la protéine appât ne possède pas naturellement de ligand connu, on utilisera une protéine X taguée. C tag sera éloigné de notre protéine grâce à un espaceur qui permettra l’interaction quelque soit la taille et la géométrie du complexe. On a alors deux possibilités : soit on transfecte (transforme) nos cellules par un vecteur d’expression portant l’ADNc de la protéine appât fusionné avec une (ou plusieurs) étiquette(s), soit la protéine tagguée aura été au préalablement préparée. Dans ces cas là, c’est le ligand du tag qui sera fixé sur les billes. Si on a inséré un site reconnu par une protéase spécifique entre le tag et la protéine X, l’élution pourra se faire par digestion de ce site. L’inconvénient de ces deux variantes est qu’on ne travaille plus sur une protéine sauvage mais sur une protéine modifiée. La quantité de protéine appât est généralement plus importante que la protéine endogène ce qui peut engendrer des faux positifs.
♦ Pull down
Une variante de la chromatographie d’affinité est utilisée mais, au lieu de retenir les billes dans une colonne, on les sédimentera par centrifugation. Une autre variante consiste à utiliser des billes magnétiques. La récupération se fera alors par l’intermédiaire d’un aimant. Ex. GST pull down, billes magnétiques, complexe formé in vitro.
Support solide
Protéinecible
PartenaireTag
24/10/2011 198
GST : glutathione Sulfo Transférase – fusionné avec la protéine X – entre les deux, un site de digestion à la thrombine.
Si on ne veut pas marquer la protéine Y, on peut la détecter par western.
La même technique est utilisée pour aller « pêcher » des partenaires de la protéine X dans un
extrait protéique complexe.
! Penser aux témoins : billes + extraits, billes + GST + extraits car des interactions non spécifiques de
ce type peuvent être obtenues et ce, indépendamment de la protéine X.
Autres systèmes utilisés : steptavidine/biotine, Ni/6xHis, maltose/MBP, …
Avantage de cette technique : simple et rapide
Inconvénients :
Dans le cas des GST-pull-down, la taille importante de la GST peut entrainer un
encombrement stérique qui peut gêner la fixation de certains membres du complexe. On peut dans ce
cas là essayer de mettre le tag en C-terminal si il était en N (ou vice-versa). On peut aussi mettre un
« espaceur » entre le tag et notre protéine. Enfin, on peut aussi essayer avec un autre tag plus petit
(flag, 6xHis, …)
Souvent des « faux positifs », valider la validité de ces interactions par une autre technique, si
possible « in vivo ».
Quelle que soit la technique utilisée, les interactions doivent ensuite être vérifiées in vitro et même de préférence in vivo afin de
S’assurer de la validité de l’interaction
Vérifier si cette interaction est directe ou indirecte.
Autoradiographie Coloration coomassie
Protéine X, fusionnée à la GST Bille de glutathione sépharose Protéine Y, radioactive Protéines compétiteurs
Fixation et lavage
SDS-PAGE
On veut tester la liaison de la protéine
X avec la protéine Y. Pour cela, on va
:
1 - fusionner la protéine X avec la
GST et marquer la protéine Y.
2 - fixer la protéine X sur des billes de
glutathione sépharose
3 - ajouter la protéine Y en présence
24/10/2011 199
5 Etude/vérification des interactions protéine/protéine.
5.1 -> Vérification par une des techniques précédemment citées
Pour tester l’interaction entre une protéine X et une protéine Y ou vérifier la validité d’un partenaire
identifié par l’une des techniques précédemment citées, toutes les techniques permettant de
rechercher des partenaires protéiques peuvent être utilisées. Cependant, dans le cas de la vérification
d’une interaction, il faudra changer de type d’expérience mais aussi inverser la nature de l’appât et de
la proie (ex. : si la protéine Y a été identifiée comme partenaire de la protéine X en utilisant cette
dernière comme appât, la vérification se fera en prenant la protéine Y comme appât).
Pour vérifier si l’interaction est directe, on fera un pull down à partir des deux partenaires purifiés.
5.2 -> Vérification de l’interaction in vivo
♦ Colocalisation par immunofluorescence
Rappels sur l’immunofluorescence : L'immunofluorescence est une technique qui permet la
détection et la localisation d'une ou plusieurs protéines grâce à l'utilisation d'anticorps spécifiques. La
réalisation d'un marquage passe par différentes étapes : (i) prétraitement (fixation et perméabilisation)
du tissu ou des cellules, (ii) ajout de l'anticorps primaire puis lavages, (iii) ajout de l'anticorps
secondaire spécifique de l’anticorps primaire couplé à un fluorochrome puis lavages, (iv) révélation
du signal fluorescent à l'aide d'un microscope de fluorescence ou par microscopie confocale.
L'immunofluorescence est utilisée sur les
cellules en culture (on parlera alors
d'immunocytochimie) ou sur des coupes de
tissus (immunohistochimie).
I ii iii iv
Utilisation de l’immunofluorescence pour faire de la colocalisation de protéines :
L’immunofluorescence sera réalisée de la même façon que décrite précédemment mais on met les
deux anticorps primaires dirigés contre les deux protéines dont on veut tester la colocalisation puis les
deux anticorps secondaires dirigés contre les deux anticorps primaires et portant des fluorochromes
différents. Il est impératif que les deux anticorps primaires soient de types différents afin que l’on
puisse différencier les deux signaux et que les deux fluorophores aient des spectres d’émission
24/10/2011 200
suffisamment éloignés. L’acquisition des deux signaux se fait indépendamment puis on superpose les
deux images pour voir s’il y a colocalisation.
Dans l’exemple montré ci-contre, la première protéine est détectée avec
un anticorps préparé dans la chèvre et la deuxième avec un anticorps
préparé dans la souris. L’anticorps secondaire permettant de révéler la
première protéine est un anticorps anti anticorps de chèvre couplé à la
Cy3 (fluorescence rouge) et l’anticorps secondaire permettant de révéler
la deuxième protéine est un anticorps anti anticorps de souris couplé au
FITC (fluorescence verte). La superposition des deux images montre un
signal jaune, ce qui nous permet de valider l’hypothèse d’une
colocalisation de ces deux protéines.
Avantages de cette technique : la visualisation de la colocalisation se fait in vivo sur des protéines
endogènes.
Inconvénients :
Il faut avoir des anticorps spécifiques des deux protéines à tester, les anticorps doivent pouvoir
être différenciés (organismes à partir desquels ils ont été préparés différents ou isotypes différents
IgG pour un et IgM pour l’autre par exemple).
La concentration de chacune des protéines doit être suffisamment importante pour pouvoir
être révélée par cette technique qui n’est pas très sensible.
Parfois, on fait de l’immunofluorescence directe. Dans ce cas particulier c’est l’anticorps primaire qui
porte le fluorochrome, la révélation se fait alors sans passer par la troisième étape. Ceci permet d’une
part de diminuer le bruit de fond dû à des interactions non spécifiques des divers anticorps utilisés et
d’autre part permet de faire de la colocalisation alors que les deux anticorps dont nous disposons sont
du même type (IgG de type 1 de souris par exemple).
♦ Protéines de fusion
Dans le cas où des anticorps ne sont pas disponibles ou si la quantité de protéine à tester est
insuffisante pour la détection en immunofluorescence, une alternative est l’utilisation de protéine de
fusion entre la protéine d’intérêt et des protéines naturellement fluorescentes comme la GFP (Green
Fluorescent Protein) ou un de ses mutants (BFP – Blue Fluorescent Protein, CFP - Cyan Fluorescent
Protein ou encore YFP – Yellow Fluorescent Protein). Le gène de la GFP a été initialement identifié
24/10/2011 201
chez la méduse Aequorea Victoria. Les autres protéines (BFP, CFP, YFP, …) ont été produites par
biotechnologie (mutagénèse de la séquence sauvage).
Avantage de cette technique : la visualisation est directe, on n’a donc plus de problèmes de bruit de
fond lié à des interactions non spécifiques des anticorps (primaires et secondaires avec d’autres
constituants cellulaires). D’autre part, comme on contrôle la quantité de protéine produite, on n’est
donc plus limité par cette quantité.
Inconvénients : on ne travaille plus avec des protéines endogène ni à des concentrations
physiologiques. On n’est donc pas assuré d’avoir la localisation naturelle des protéines à tester.
Pour ces deux dernières techniques, l’interaction n’est pas prouvée, on montre juste que cette
interaction est possible de part la localisation des partenaires. Ces expériences ne sont donc en
aucun cas suffisantes pour démontrer une interaction.
♦ FRET (Föster Resonance Energy Transfer)
Le FRET est une technique qui permet de détecter la proximité de deux molécules. Chacune de ces molécules porte un groupement fluorescent et la technique repose sur le transfert, par résonance, de l’excitation de l’un de ces groupements (le donneur) à l’autre (l’accepteur) sans émission d’un photon. Pour cela, les deux partenaires de l’interaction (protéine A et B) doivent être conjugués avec un couple de fluorophores de couleurs différentes (donneur et accepteur). On excite ensuite le donneur A. Quand l’interaction entre A et B amène les colorants fluorescents à faible distance l’un de l’autre, un signal de fluorescence nouveau (issu de l’émission du receveur B) est développé. La présence de ce signal confirme la faible distance et donc l’interaction entre A et B. Ces interactions peuvent être suivies en temps réel grâce à une caméra jointe au microscope à fluorescence. Pour réaliser le transfert d’énergie de fluorescence, les spectres d’absorption de la première molécule
fluorescente (le donneur) et de la deuxième molécule fluorescente (l’accepteur) doivent se
superposer.
La famille des GFP (Green Fluorescent
Protein) offre différentes paires de mutants
utilisables pour des expériences de FRET.
Par exemple, le mutant appelé EGFP
(Enhanced GFP) et le mutant appellé BFP
(Blue Fluorescent Protein).
24/10/2011 202
Avantage de cette technique : La visualisation de l’interaction se fait dans les cellules vivantes
Inconvénients : on ne travaille pas sur des protéines endogènes.
♦ BRET
Une variation de cette technique est le BRET (Bioluminescence Resonance Energy Transfert).
Dans cette variante, le « donneur » est une molécule capable d’émettre des photons. Les photons émis
iront, si la distance entre le donneur et l’accepteur est suffisamment faible, exciter l’accepteur.
Généralement, le donneur est la luciférase de Renillla, qui sera fusionnée à une protéine d’intérêt
(protéine A). La GFP est fusionnée à l’autre protéine d’intérêt (protéine B), susceptible d’interagir
avec la protéine A. La luciférase est excitée à l’aide d’un substrat qui pénètre dans la cellule (la
cœlenterazine).
La luciférase de Renilla, initialement isolée à partir de l’organisme Renilla Reniformis (pensée de
mer) est une enzyme de 36 kDa qui catalyse l'oxydation de la coelentérazine en présence d’oxygène.
Cette réaction catalytique produit une lumière bleue avec un pic d'émission à 480 nm.
Si les deux protéines n’interagissent pas, on ne détecte que le signal émis par la luciférase. Si les deux
protéines interagissent, il y a transfert d’énergie entre la luciférase et la GFP et l’on peut mesurer un
signal supplémentaire émis par la GFP à 530 nm. Le transfert d’énergie reflète une interaction
physique étroite : pour qu’il y ait transfert d’énergie, la distance entre la luciférase et la GFP doit être
inférieure à 100 Å.
24/10/2011 203
Avantage de cette technique : Les mêmes que pour le FRET mais, en plus, le BRET est plus sensible
que le FRET et elle permet de s’affranchir d’une source excitatrice extérieure évitant ainsi les
problèmes de photoblanchiment des GFP, d’effet de filtre des milieux à la longueur d’onde
d’excitation du donneur ou encore de l’excitation croisée de l’accepteur.
Inconvénients : Les mêmes que pour le FRET
6 - Cross-linking (association par des agents pontants) On l’utilisera en complément d’une des techniques décrites ci-dessus chaque fois que l’on voudra
stabiliser une interaction.
Le principe consiste à associer de façon covalente la protéine à tester avec son partenaire avant
d’isoler le complexe. Cette technique nous permet de révéler des complexes présentant des
interactions de faible affinité. Elle peut aussi se réaliser in vivo, à condition que les agents cross-
linkant utilisés traversent les membranes de la cellule. Enfin, en utilisant un ensemble d’agents
pontants qui agissent à des distances variables, on pourra positionner les différents constituants au
sein d’un complexe multimoléculaire.
Les agents cross-linkant chimiques :
Il existe un très grand nombre d’agents cross-linkant chimiques. Ils se distinguent :
• Par la nature du résidu impliqué dans le cross-link (amine, sulfhydryls, carboxyls, hydroxyls,
…)
24/10/2011 204
• Par la distance entre les deux espèces à cross-linker (de 1,5 à plus de 30 A)
• Par la possibilité de réverser le cross-link (certains ne sont pas réversibles, d’autres le sont en
présence de thiols, d’un milieu basique, …)
• Le milieu dans lequel ils sont solubles (on choisira de préférence ceux qui le sont en milieu
aqueux pour un cross-link in vivo)
• Leur capacité à traverser les membranes de la cellule (indispensable pour un cross-link in
vivo)
• Le nombre de partenaires (deux ou plus) qu’ils peuvent assembler, …
La société Pierce en commercialise un très grand nombre, toutes leurs caractéristiques sont
répertoriées dans leur catalogue. Leur site sur le web – www.piercenet.com permet même un guide de
sélection de l’agent cross-linkant en fonction de l’expérience que l’on veut réaliser.
Cette technique ne permet pas d’affirmer qu’il y a interaction directe entre les deux partenaires, il
peut y avoir seulement une proximité dans l’espace qui peut être due à une interaction indirecte.
1. Caractérisation de l’interaction
♦ Quelle partie de la protéine X interagit avec la protéine Y
Beaucoup de protéines, en particulier des protéines eucaryotes, présentent une structure avec différents domaines structuraux indépendants. Dans ce cas, la protéine peut être « découpée » en différents morceaux capables de se structurer dans l’espace indépendamment les uns des autres. Dans ce cas là (et dans ce cas là uniquement), on peut rechercher le ou les domaines impliqués dans l’interaction protéine/protéine.
définition des domaines structuralement indépendants
il est nécessaire de connaître la structure de la protéine soit directement (RMN ou
cristallographie), soit parce qu’elle appartient à une famille dont la structure est connue,
soit parce qu’elle présente des domaines structuralement identifiés.
Ex : 1 séquence protéique pour X – bioinfo (voir TP bioinfo)-> 1 domaine POU (lui-même constitué de deux sous domaines POUh et POUs), 1 domaine GLU, 1 domaine ring. Pour Y, pas de domaines structuraux définis POU GLU RING
24/10/2011 205
Clonage de ces sous domaines
clonage dans un vecteur d’expression, production, éventuellement purification (pas obligé)
PCR
Etude de leur interaction (far western, coIP, pull down…) avec Y repérable (marquage par exemple).
♦ Kd, Kon, stœchiométrie de l’interaction, détermination des paramètres de tampon, …
Ultracentrifugation analytique
L'ultracentrifugation analytique (UCA) est une méthode de choix pour l'étude des interactions en solution. En effet, elle permet de déterminer les stœchiométries, les processus d'association, l'agencement spatial des sous-unités dans des complexes, l'influence des paramètres du solvant (pH, sel, température).
Il existe deux types principaux d’expériences de sédimentation :
vitesse de sédimentation
équilibre de sédimentation
La plus utilisée pour étudier les interactions protéine/protéine est la deuxième.
Pratiquement, on va mesurer précisément la masse des particules présentes dans des solutions
présentant des concentrations croissantes en protéine A, protéine B, et protéine A + protéine B. On
pourra ainsi en déduire
• si la protéine A est présente en solution sous forme d’un monomère ou d’un multimère
• idem pour la protéine B
• si les protéines A et B s’associent. Si cela est le cas, la stœchiométrie de l’interaction sera
déduite de la masse du complexe.
Des expériences de diffusion de lumière (DLS – Dynamic Light scattering) peuvent nous apporter en
plus une information sur la forme du complexe, information qui peut nous aider à proposer un
modèle d’interaction pour ce complexe.
Biacore
24/10/2011 206
La fonction de cet appareil est déjà suggérée par son appellation : "BIA" signifie Biospecific
Interaction Analysis et "core", au cœur de. En effet, le BIAcore est un automate qui permet de
mesurer en temps réel toute interaction biologique sans marquage de molécules. L'intérêt majeur de
cette mesure en temps réel est de pouvoir visualiser, sur l'écran, la cinétique de l'interaction et d'en
dégager ses caractéristiques propres. On peut ainsi mesurer les vitesses d'association et de
dissociation et en déduire la constante d'affinité et la constante de dissociation
Son principe de fonctionnement est d'enregistrer, en continu, à la surface d'une lamelle réactive
(appelée "sensor chip") la modification de résonance induite par toute interaction moléculaire
[résonance plasmonique de surface ( SPR ) ] . Cette modification est directement proportionnelle à la
masse de molécule liée et à sa quantité fixée sur le chip.
Le système de mesure est composé de trois éléments :
1. Le sensor chip
Il comprend une lamelle de verre sur laquelle est déposée une fine pellicule d'or elle-même
recouverte d'une couche de dextran carboxyméthylé sur lequel on couple de façon covalente la
première molécule impliquée dans la réaction que l'on veut étudier. Le couplage peut se faire par les
groupements amines, par les sucres ou par les groupements thiols selon des procédés de chimie
classique.
2. La micro-plaquette fluidique
Elle contrôle l'injection (de 5 à 300 microlitres) et le débit (de 1 à 100 microlitres/mn) des réactifs
à la surface du sensor chip.
3. L'unité optique
Une lumière polarisée est envoyée sur un prisme de verre, en contact direct avec la lamelle de
verre du sensor chip. L’appareil mesure et enregistre les changements de l’indice de réfraction
générés par un faisceau de lumière polarisée dirigée vers la face opposée de la feuille d’or lors du
processus d’association et de dissociation de A et B. Le faisceau réfléchi, qui est analysé en temps
réel par un ensemble de diodes, montre une extinction partielle pour un angle précis d’incidence, qui
dépend de l’indice de réfraction au voisinage de la feuille d’or. Les signaux obtenus, mesurés en
unités arbitraires (unités de résonance ou RU) sont proportionnels à la masse de B adsorbée à la
24/10/2011 207
surface (pour les protéines, 1 RU approximativement égal à 1 pg.mm-2). Les courbes obtenues sont
alors traitées par le logiciel BIAevaluation -> constante d’équilibre à l’interface K’d. L'interaction
peut être analysée rapidement en quelques minutes et nécessite de très petits volumes de réactifs (80
microlitres en moyenne).
En pratique, une protéine ligand (A) est immobilisée sur un support (chip).
On distingue alors trois phases :
1 - Phase d’adsorption : un tampon circule en flux continu à sa surface. Dans ce tampon se trouve la
protéine (B) qui interagit avec la protéine (A).
2 - Phase de désorption : un tampon n’incluant pas B est injecté, conduisant à une dissociation
progressive des complexes AB formés.
3 – Phase de régénération : la dissociation est brutalement accélérée, aboutissant à une surface vierge
de B, comme au début de l’expérience.
Microcalorimétrie [Microcalorimétrie isotherme à titration (ITC)]
1) Principe et méthode
24/10/2011 208
Afin de mesurer l’interaction entre deux molécules et les paramètres thermodynamiques qui en découlent, il est nécessaire de mesurer les échanges thermiques dus aux associations entre ces molécules. Le principe est le suivant : une macromolécule est placée dans la cellule de mesure d’un calorimètre isotherme puis est progressivement saturée par injection à l’aide d’une seringue de petits volumes de la deuxième molécule. L’interaction entre 2 molécules peut s’accompagner d’un échange de chaleur (absorption ou émission). Le suivi des interactions va se faire indirectement par suivi des échanges thermiques. Prenons l’exemple d’un ligand se fixant sur une protéine : En fonction de la quantité de complexe formée, on obtient des signaux thermiques proportionnels qui seront visualisables sous forme de pics grâce à un logiciel (Origin). La mesure du signal thermique permet donc de mesurer la quantité de complexe formé, et ainsi de mesurer les paramètres thermodynamiques de l’interaction.
Ainsi, la microcalorimétrie isotherme à titration permet de mettre en évidence et de quantifier les interactions entre diverses familles de protéines et leurs ligands potentiels et les modifications structurales qui en découlent.
♦ Interactions moléculaires – structure 3D
Une protéine se replie et acquiert une conformation particulière dans l'espace. C'est cette structure tridimensionnelle qui détermine la fonction que va jouer la protéine dans la cellule. Connaître cette structure est donc une étape-clé si l'on veut comprendre le détail des mécanismes de la cellule, par
Ligand + protéine = complexe + ΔH
24/10/2011 209
exemple pour concevoir des médicaments. Pour étudier la structure tridimensionnelle des protéines, mais aussi des complexes protéine/protéine, il y a plusieurs approches possibles :
La RMN (Resonnance Magnétique Nucléaire) On excite les atomes de la molécule étudiée. Chaque atome résonne à une fréquence qui lui est propre et qui dépend de son environnement magnétique. L'atome réémet un signal à cette fréquence. La superposition des signaux provenant de tous les atomes est enregistrée puis analysée. En jouant sur les différents types d'atomes et en utilisant des séquences d'excitation particulières, on peut faire apparaître de façon sélective certaines propriétés géométriques comme la proximité de deux atomes à travers l'espace ou leur proximité dans le squelette de la molécule. Contrairement à la cristallographie, l'analyse des spectres de RMN ne donne pas accès immédiatement à la structure tridimensionnelle. Il faut d'abord attribuer chaque fréquence de résonance à l'atome correspondant dans la molécule, puis utiliser les données géométriques observées pour calculer la structure tridimensionnelle globale. Aujourd'hui, la RMN est limitée par la résolution des spectres, qui dépend directement de la puissance des champs magnétiques utilisés pour exciter les atomes.
La RMN en phase liquide est la seule méthode amenant à la structure atomique de macromolécules en solution. Elle comporte cependant des contraintes significatives sur la taille des molécules étudiées (30 - 40 kDa au plus) comme sur leurs propriétés de solubilité. La RMN du solide ouvre quant à elle des possibilités intéressantes, mais encore peu exploitées, pour l’étude de macromolécules sous forme de poudre (donc non cristallisable) et pour les protéines membranaires.
Cristallographie et diffraction aux rayons X
En envoyant des rayons X sur un cristal de protéines, on observe un spectre de diffraction. Grâce à une transformation mathématique simple, il est possible d'accéder rapidement à la structure tridimensionnelle des protéines dans le cristal. L'étape limitante de cette méthode est la production d'un cristal pur (un monocristal). Elle peut être plus ou moins difficile, de façon plutôt imprévisible. Amélioration de la technique : le rayonnement synchrotron. Le rayonnement synchrotron permet la production d’un rayonnement X intense, stable, de longueur d’onde variable et de grande qualité optique. Ils offrent des données exploitables pour des cristaux de macromolécules que des méthodes classiques ne permettaient pas d’étudier : mailles plus grandes (et donc molécules ou complexes plus grands), cristaux plus petits voire imparfaits. D’autre part, le rayonnement synchrotron a considérablement accéléré la vitesse d’acquisition des données, réduisant celle-ci à quelques heures au lieu de quelques semaines. La très grande majorité des études cristallographiques contemporaines reposent sur l’utilisation de données collectées à partir d’un synchrotron.
In silico
Il est possible de prédire in silico la structure tridimensionnelle d'une protéine X par homologie par rapport à une autre protéine, de structure connue et présentant des homologies structurales avec la protéine X.
24/10/2011 210
La prédiction ab-initio du repliement, sans autre information que la seule séquence de la protéine, reste encore largement hors de portée, sauf cas exceptionnels. La méthode ab-initio nécessite des puissances de calcul importantes. Toute molécule dessinée doit être minimisée, c’est à dire que sa conformation doit être amenée à une position stable. Cette procédure appelée minimisation est un processus itératif dans lequel les coordonnées des atomes sont constamment ajustées jusqu'à amener la molécule à une énergie minimale. La conformation ayant la plus basse énergie est considérée comme la plus stable. Le docking est l'étude des interactions entre molécules. D’autre part, différents programmes ou serveurs permettent soit de prédire les régions protéiques permettant éventuellement à une protéine d’interagir avec une autre, soit de retrouver une interaction déjà mise en évidence dans le passé. Quelques exemples de ce type de sites :
banques d’interaction protéine/protéine
DIP : Database of Interacting Proteins : http://dip.doe-mbi.ucla.edu
Cette banque de donnée catalogue les interactions (déterminées expérimentalement) entre protéines.
Ce site présente un accès libre sur Internet et est supposé aider ceux qui étudient les interactions
protéine/protéine, les voix de signalisation les interactions multiples et les systèmes complexes.
prédiction de surfaces potentielles d’interaction
Protein – protein Interaction server : http://www.biochem.ucl.ac.uk/bsm/PP/server
Ce serveur nous fourni un moyen de calculer une série de paramètres descriptifs sur l’interface entre
deux chaînes polypeptidiques dans une structure protéique tridimensionnelle. En comparant ces
résultats avec des résultats obtenus avec des protéines connues pour interagir les unes avec les autres,
on peut estimer la validité de l’interface prédite entre nos deux protéines.
Inconvénient : ce programme ne fonctionne actuellement que sous Unix et nécessite une bonne
connaissance en biologie structurale et en bioinformatique.
Applications – conception de peptides inhibiteurs
Lorsqu'un composé actif de base (LEAD) a été identifié (expérimentalement ou in silico) et sa structure
chimique déterminée, on peut améliorer l'activité et/ou réduire les effets secondaires en modifiant sa
structure chimique de base.
Les peptides sont subséquemment optimisés par des modifications apportées aux chaînes latérales ou au
squelette de base. On peut ainsi concevoir des peptides avec des affinités supérieures à la cible (par
24/10/2011 211
rapport à la molécule de départ). Mais le plus grand défi qui reste à surmonter dans le cas des inhibiteurs
peptidomimétiques est de modifier ceux-ci pour qu'ils puissent être absorbés oralement et qu'ils ne se
décomposent pas rapidement dans l’organisme. Il faut alors trouver des inhibiteurs de type