Interactions entre les gènes des enzymes antioxydantes et ... · Interactions entre les gènes des enzymes antioxydantes et leurs relations avec le cancer du sein Mémoire présenté
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
YOSR HAMOI
Interactions entre les gènes des enzymes antioxydantes et leurs relations avec le cancer du sein
Mémoire présenté À la Faculté des études supérieures de l'Université Laval
Dans le cadre du programme de MaÎtrise en Biologie cellulaire et moléculaire Pour l'obtention du grade de MaÎtrise ès sciences (M.Sc.)
Département de Biologie Médicale Directeur de recherche: Dr. Ven Murthy
FACULTÉ DE MEDECINE UNIVERSITÉ LAVAL
QUÉBEC
Remerciements:
« L 'homme sans servitude, ['homme sans croyance, ['homme sans mythes, c'est un mythe .... ~ais 6eaucoup de mythes sont devenus des réa.Eités }·ustement du fait des sciences »
« Je remercie beaucoup Dr. Ven Murthy pour sa disponibilité et sa compréhension, la direction du programme de Biologie Cellulaire et Moléculaire notamment Dr. Michel Vincent et Mme Andrée Filiatraut. Un gigantesque remerciement pour Dr. Jérôme Laroche et Dr. François Larochelle du centre de bioinformatique de l'université Laval pour leur collaboration, leur disponibilité et leur patience. Je tiens aussi à remercier mon marie Wassel Chabouha et mon frère Maher Hamdi qui m'ont beaucoup soutenu et qui ont été toujours une vraie idole pour moi. Merci à tous ceux et celles que j'ai connus dans toute ma vie parce que c'est sûr que j'ai appris beaucoup de choses de tous ces gens... »
Yosr Hamdi
Il
TABLE DES MATIÈRES
Numéro de la page
RÉSUMÉ ABSTRACT
CHAPITRET Cancer du sein: le rôle du stress oxydatif, les antioxydants et les enzymes antioxydantes ... ....... . ............................... .
1-1. les rôles des radicaux libres d ' oxygène, les pro-oxydants et les
iï ÏIÏ
oxydants et les antioxydants dans le phénomène de cancérogénèse. . ....... 2 1-2. Les antioxydants.............................................................. ... .. 4 1-3. Les enzymes antioxydantes.......................................... . ....... .... 7
1-4. Les hormones stéroïdiennes, leurs récepteurs et la thérapie endocrine du cancer du sein ............. . ........................................ 10
1-5. L 'œstrogène, le tamoxifen et leurs effets sur les gènes d ' enzymes antioxidantes ..... .. ................................................ ~ . . .. . .. . ....... 12
CHAPITRE 2 Les signaux de transduction, les interactions géniques, les dialogues entre les gènes et le polymorphisme .................. 14
2-1. Généralités: Les signaux de transduction.................... ... .. ...... ...... 15 2-2. Les voies de signalisation, les interactions géniques ainsi que les
polymorphismes trouvés dans nos quatre gènes ................................ 19 2-2-1 Voies de signalisation ..................................................... 19 2-2-2 Interaction génique............................................... ......... 19 . 2-2-3 Polymorphisme: Polymorphismes Nucléotidiques Simples
CHAPITRE 3 Le plan de travail en vue de découvrir les mécanismes de régulation des gènes d ' enzymes antioxydantes dans le
cancer du sein............................................... ................ ............... 26
_ 3-1 Méthodologie...................................... ................. . ...... . ...... 29 3-1-1. Les outils bio-informatiques.................................. ...... .... 29 3-1-2 Recherche des Variants de SOD2 et GPxl qui sont surexprimés
dans notre étude. . .. . .. . .. . . . . . . . . . . .. . . . . . . . . . . .. . . . . . . . . . . . . . . . . .. . .... 31 3-1-3 Comparaison et recherche des régions de similarité entre tous les
composants de nos quatre gènes....... . ............................... 33
i i
3-1-3-1 Extraction des séquences nucléotidiques et peptidiques des'quatre gènes: SODI, SODI,GPxI etCAT ............. 33
3-1-3-2 Alignement et comparaison des séquences nucléotidiques et peptidiques des quatre gènes: SODl , SOD2, GPxl et CAT..................................................... 43
3-1-4 Recherche des facteurs de transcription impliqués dans l' expression de nos gènes............................................ 49
3-2 Résultats et Discussion.. ..... . ...... ...... ........... .... .. ............. .. ....... . 50 3-2-1 Variants 1 de SOD2 et de GPx 1 ...................................... 50 3-2':'2 Régions similaires et pourcentage de ressemblance entre les
composantes de nos quatre gènes.................................... 51 3-2-2-1 Résultats pour SODI/SOD2................................ 52 3-2-2-2 Résultats pour GPxI/CAT .................................. ,64
3-2-3 Facteurs de transcription et régulation de l' expression génique... 74
Figure-l. L ' inactivation des radicaux libres par l' action des quatre enzymes étudiées dans notre projet..... .. .... ..... . ..... . .......... . .. 5
Figure-2. Quelques voies de signalisation impliquées dans quelques processus primordiaux dans la survie cellulaire: la régulation, la différentions, le cycle cellulaire et l' apoptose. ....... ........ ............... ....... ..... 16
Figure-3. Quelques voies de signalisations impliquées dans certains types de cancer.. ................................................ ......... . ........ .... 17
Figure-4. Multiples voies de signalisation impliquées dans le cancer......... 18
Figure-S. Les voies de signalisation appliquées sur les gènes antioxydants qui ont une relation avec la sclérose amyotrophique latérale......... 21
Figure-6. Localisation du gène SODI sur le chromosome 21 ................. .... 32
Figure-7. Structure de l ' enzyme SODI et représentation détaillé du site actif de SOD] et les acides aminés impliqués dans la liaison des ions Cu et Zn........................................................................... 34
Figure-8. Localisation du gène SOD2 sur le chromosome 6 .. ; .. ...... ... ......... ... 36
Figure-9. Localisation du gène GPx 1 sur le chromosome 3........... . .......... . ... 40
Figure-IO. Localisation du gène Catalase sur le chromosome Il . .... .............. 42
Figure-Il. Arbre phylogéniques des quatre gènes SODl , SOD2, GPx l et CAT... 73
v
--------j;:/
LISTE DES TABLEAUX
Numéro de la page
Tableau-l. Liste des familles d 'enzymes antioxydantes ion-dépendants....... 6
Tableau-2. L'interaction entre le polymorphisme de GPX l , Pro 198Leu, et celui de
MnSOD, Val] 6Ala, et le risque de cancer du sein ............ ... .... 25
Tableau-3. Amorces utilisés pour l'Amplification des ADNe de nos quatre gènes... 32
Tableau-4. Longueur des régions codantes et non codantes de SOD 1 ainsi que leurs
localisations sur ce gène ............................................... ..
Tableau-S. Longueur des régions codantes et non codantes des trois variants
de SOD2 ainsi que leurs localisations sur ce gène .................. .
Tableau-6. Longueur des régions codantes et non codantes des deux variants
de GPx] ainsi que leurs localisations sur ce gène .................. .
Tableau-7. Longueur des régions codantes et non codantes de l'enzyme Catalase
ainsi que leurs localisations sur ce gène ............................. .
Tableau-8. Quelques caractéristiques des gènes des enzymes antioxydantes ainsi
que les produits des gènes analysés dans ce projet. ................ .
Tableau-9. Identification des régions d'identité entre les séquences codantes
(exons) des gènes SOD] et SOD2 (Variant]) ainsi que le pourcentage
d'identité entre ces régions (Bestfit) .................................... .
Tableau-IO. Identification des régions d ' identité entre les séquences
non codantes (introns) des gènes SODI et SOD2 (Variant])
ainsi que le pourcentage d'identité entre ces régions (Bestfit) ..... .
Tableau-Il. Identification des régions d'identité entre les séquences 5' -UTR
et 3' -UTR des gènes SOD] et SOD2 (Variant]) et de leurs
37
41
45
47
48
54
55
ARNms ainsi que le pourcentage d'identité entre ces régions (Bestfit)... 58
Tableau-I2. Identification des régions d'identité entre les séquences peptidiques de SOD] et SOD2 (Isoforme A) ainsi que le pourcentage d ' identité entre ces séquences (Bestfit)................................... ... 59
v
Tableau-13. Comparaisons des exons de SOD] et SOD2 (variant]) par la méthode Gap............................................... ............. 60
Tableau-14. Comparaisons des introns de SOD] et SOD2(Variant]) par la méthode Gap... .. . ... ... ... ... ... ... ... ... ... ... ... ..... ..................... 61
Tableau-15. Comparaison des régions 5' -UTR et 3' -UTR des gènes SOD] et SOD2 (variant1) et de leurs ARNms selon le programme Gap .......................................... :........ 62
Tableau-16. Comparaisons des séquences peptidiques de SOD] et SOD2 (Isoforme A) par la méthode Gap. L ' jsoforme A est la protéine résultante
. du Variant] de SOD2...................................................... 63 Tableau-17. Identification des régions d ' identité entre les séquences codantes
(exons) des gènes GPx1 (Variant1) et CAT ainsi que le pourcentage d ' identité entre ces régions (Bestfit). . .. . . . . .. . . . . .. . . . . .. . .. . . . . . . . .. 65
Tableau-18. Identification des régions d ' identité entre les séquences non codantes (introns) des gènes GPx1 (Variant1) et CAT ainsi que le pourcentage d ' identité entre ces régions (Bestfit). . . . . .. . . . .... .. . .. . .. . .. ... . . . . .. . . 66
Tableau-19. Identification des régions d ' identité entre les séquences 5' -UTR et 3 ' -UTR des gènes GPx1 (Variant1) et CAT et de leurs ARNms ainsi que le pourcentage d ' identité entre ces régions (Bestfit)...... 67
Tableau-20. Identification des régions d ' identité entre les séquences peptidiques de GPx] (Isoforme A) et CAT ainsi que le pourcentage d' identité entre ces séquences (Bestfit).............................................. 68
Tableau-21. COlnparaisons des exons de GPxl(Variant1) et CAT par la méthode Gap... ... ... .................................................. .... 69
Tableau-22. Comparaisons des introns de GPxl (Variant1) et CAT par la méthode Gap...... ... ... ...... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .... . .. . 70
Tableau-23. Comparaison des régions 5' -UTR et 3' -UTR des gènes GPx1 (Variant]) et CAT et de leurs ARNm selon le programme Gap ... ... .
Tableau-24. Comparaisons des séquences peptidiques de GPx1 et CAT par la méthode Gap........................................................ ....... 73
Tableau-25. Liste des facteurs de transcription trouvés en abondance sur nos quatre gènes ainsi que le nombre de fois qu ' on a trouvé ces facteurs de transcription sur chacun des gènes indiqués. ~ ... .... ... 78
v
LISTE DES ANNEXES
Numéro de la page
ANNEXE l Les séquences nucléiques des gènes SODI , SOD2, GPxI et CAT... 83
. ANNEXE II Les séquences peptidiques des quatre enzymes antioxydantes SODI , SOD2, GPxletCAT ........................................................ 117
v
ROS 0 2-
H 20 2
OH-H+
SODI SOD2 MnSOD GPxl CAT ADN ADNe ARNm GSH Cu Zn Se Fe Kb Pb NF-KB ER PR TAM ER-a TGF-a EGFR BRCAI BRCA2 SNP aa TFD AP-2 CTF/CBp ·
LISTE DES ABBREVIATIONS
Radicaux oxygénés libres (Reactive oxygen species) Anion superoxyde Peroxyde d' hydrogène L'hydroxyle Ion hydrogène Superoxyde dismutase cytosolique Superoxyde dismutase mitochondriale Manganèse superoxyde dismutase Glutathionne peroxydase cellulaire Catalase Acide désoxyribonucléique Acide désoxyribonucléique complémentaire L'acide ribonucléique messager Glutathion Le cuivre Le zinc Le sélénium Le fer Kilo bases Pairs de base Nuclear factor-kappa B Récepteur de l'Œstrogène Récepteur dela progestérone Tamoxifen Récepteur de l 'Œstrogène alpha Transforming Growth Factor alpha Epidermal growth "factor receptor Breast Cancer 1 Breast Cancer 2 Single Nucleotide Polymorphism Acide aminé Transcription Factor Database Activating Protein 2 Co-activator Transcription Factor/CREB Binding Protein
RÉSUMÉ
Le cancer du sein est considéré comme le cancer le plus dangereux jamais diagnostiqué
chez les femmes dans le monde. Plusieurs équipes de recherche essaient de délivrer le mystère
de ce cancer en étudiant plusieurs facteurs qui y sont impliqués. Dans notre laboratoire on a
essayé d'étudier les interactions entre les gènes antioxydants : SOD l , SOD2, GPx 1 et CA T et
de comprendre la relation qui peut exister entre ces gènes et le cancer du sein. Ces enzymes,
malgré qu ' elles accomplissent des fonctions similaires, elles se localisent dans des
compartiments cellulaires différents.
Pour cette étude on a utilisé des outils bio-informatiques jugés de très intéressants et très
efficaces pour répondre à trois questions principales: a) Les quels des différents variants de
SOD2 et de GPxI qui sont surexprimés dans les cellules mammaires cancéreuses (ER+)?
b) y'a-t-il des régions similaires entre les différentes régions codantes et non codantes entre ces
gènes, si oui, est ce que ces ressemblances ont des effets sur leurs niveaux d'expressions et est
ce que ces ressemblances peuvent expliquer les mécanismes de · régulation de nos quatre gènes
et déterminer par quel moyen ils communiquent entre eux? c) Est-ce que la régulation de
l'expression de nos quatre gènes peut être due à certains facteurs de transcription communs entre
eux, si oui les quels?
Notre étude a réussi à répondre à ces trois questions pour donner des bonnes perspectives
au niveau des études scientifiques sur ce type de cancer, mais des études plus approfondis en
laboratoire seront très intéressants pour mieux comprendre la relation entre les gènes
antioxydants et le cancer du sein.
iT
ABSTRACT
Breast cancer is considered to be the most dangerous cancer ever diagnosed at the
women in the world. Several research teams have tried to understand the mystery of this cancer
by studying several factors which could be implied. In our laboratory we have attempted to
study the interactions between antioxidant genes: SODI , SOD2, GPxI and CAT and to
understand the relation that can exist between these genes and breast càncer. Although these
enzymes perform similar functions, they are located in different cellular compartments.
For this study we have used interesting bioinformatic tools to answer three maIn
questions: a) Which variants of SOD2 and GPxI are over-expressed in the breast cancer cells
(ER +)? b) Are there similar regions between the various coding and not co ding regions in these
genes, if yes, did these resemblances have effects on the levels of their expressions and could
they explain the mechanisms of regulation of our four genes and determine by which ways they
communicate between themselves? c) Could the regulation of the expression of our four genes
be due to sorne common transcription factors, if yes which ones?
Our study gave answers to these three questions and so it brought good perspectives to
scientific studies in this cancer, but deeper studies in laboratory will be acquired to better
understand the relationships between the antioxidant genes and breast cancer.
iTi
. CHAPITRE-l
CANCER DU SEIN: LE RÔLE DU STRESS OXYDA TIF , LES ANTIOXYDANTS ET LES ENZYMES ANTIOXYDANTES'
( 1 )
1-1. Les rôles des radicaux libres d'oxygène, les pro-oxydants et les antioxydants dans le phénomène de la cancérogénèse:
Le développement normal des tissus est régulé par une certaine hémostasie entre la
prolifération cellulaire et la mort cellulaire par apoptose. Cette dernière est programmée
génétiquement et elle est considérée comme une décision prise par les cellules elles mêmes pour
qu'elles se suicident pour le bien-être de l'hémostasie des tissus ce qui lui a permis d'être conservée
durant l'évolution. Cette apoptose est maintenu par des signaux intra et extracellulaires qui
aboutissent à des changements des niveaux d'expression génique. Ces changements poussent la
cellule d'entrer dans une cascade de changements morphologiques et biochimiques qui finissent par
la fragmentation de l'ADN et donc la morte cellulaire. Le désordre dans la régulation de la
prolifération cellulaire et dans l' apoptose sont des facteurs majeurs et responsables de l'initiation et
la naissance des cellules cancéreuses. En effet, les ROS ont été reconnues capables de dégrader et
d'inactiver des molécules importantes et des structures biologiques critiques dans la prolifération des
cellules ce qui explique leurs implications, directes ou indirectes, dans plusieurs maladies humaines
y inclus le cancer. «ROS» est un terme qui reflète plusieurs formes intermédiaires de l'oxygène y
inclue les éléments radicaux et non radicaux qui participent dans l'initiation et la propagation de la
réaction en chaine des radicaux libres (1).
Le superoxyde (02-), le peroxyde d'hydrogène (H20 2) et l'hydroxyle (OH-) sont des éléments
majeurs de la famille des radicaux libres (ROS). Ils sont générés continuellement par le
métabolisme normal « in vivo» et correspondent aux étapes intermédiaires de la réduction de
l'oxygène (2). Ces éléments, peuvent se transformer facilement en des formes dangereuses des
radicaux libres, par exemple, une dismutation de 0 2- en H202 par l'action des superoxydes
2
dismutases cytosoliques et mitochondriales (SODI et SOD2 respectivement). H20 2 à lui seul n 'est
pas très puissant dans les solutions aqueuses mais il a une demi-vie plus longue qu ' 0 2-, il est
capable de dépasser la membrane lipidique et il peut initier des réactions d ' oxydation et de
mutagénèse (3). La réaction Fenton et Haber-Weiss du radical O2 avec H20 2 en présence des
métaux catalytiques donne naissance au radical OH- qui est un des radicaux les plus actifs des
ROS (4):
OH- est le radical le plus agressif de touts les radicaux libres. Son action sur les protéines
mène à une réticulation protéine-protéine extensive (5) dans l'ADN, l' OH- peut provoquer
plusieurs dommages comme des modifications au niveau des bases et des sucres, des réticulations
entre les bases, réticulations entre ADN et protéine, des cassures doubles brin ainsi qu'une
formation des adduits (6).
Par conséquent, le rôle des enzymes antioxydants est crucial dans la régulation du
métabolisme. Notre étude est faite sur les enzymes antioxydantes les plus importantes, des
enzymes qui agissent directement sur des radicaux libres spécifiques et les dégradent en des
produits moins agressifs. Ces enzymes sont SODI , SOD2, GPxI et CAT (Tableau-l). Les SODI
et 2 convertissent le radical superoxyde en H20 2 qui, tous seul, ne forme pas un radical libre mais il
est considéré cümme un précurseur pour la formation du radical libre le plus puissant, OH-. La
détoxification de H20 2 est ensuite faite par GPxI qui réduit H20 2 en eau (H20) en présence du
glutathionne (GSH) ou bien par CA T qui décompose le H20 2 en eau et oxygène (H20 + O2)
(Figure-l). Les SODs, les GPxs ainsi que CA T sont des enzymes intracellulaires très performants,
qui ont une performance qui se manifeste par des fonctions spécifiques et non remplaçables, et
chaque classe de ces enzymes est nécessaire pour la survie des cellules même sous des conditions
normales.
3
1-2. Les antioxydants :
L'excès en des ROS est généralement inactivé par différents mécanismes en utilisant les
molécules ' antioxydantes endogènes ou exogènes qui peuvent retarder ou empêcher l'oxydation d'un
substrat. Ainsi , des mesures préventives proprement antioxydantes agissent en liant et en séquestrant
les promoteurs d'oxydation et les ions en métal, tels que le fer et le cuivre, qui contiennent les électrons
impairs et accélèrent fortement la formation des radicaux libres. Le balayage ou les ruptures des
chaines faites par les antioxydants agissent à une partie dans la réaction en chaîne des radicaux libres,
en convertissant les radicaux de haute énergie en des produits à énergie réduite qui ne peuvent pas
propager la chaîne plus loin. Les éboueurs lipide-solubles et hydrosolubles agissent dans les
environnements cellulaires qui sont hydrophobes ou hydrophiles, respectivement.
4
SODI
SOD2
Figurel. L'inactivation des radicaux libres par l'action des quatre enzymes étudiées dans notre projet. Yuan X, Liu G, Murthy M.H..V. Eostrogen receptor-posirive and oest:rogen receptor-negarive human breast cancer cells: regularion
of expression of cancer - related genes by estradiol and tamoxife n. 2008;3:7-21 .
Les Superoxyde DisJllutases permettent de convertir l'anion superoxyde en H20 2 (toxique), lequel H20 2 doit être détoxifié par la glutathion peroxydase] (GPxl). A défaut de cette réaction, H20 2 va réagir avec les ions fer et générer des réactifs hautement toxiques pour les acides nucléiques des cellules (génotoxiques).
5
Tableau-l. Liste des familles d' enzymes antioxydantes ion-dépendants. Yuan X, Liu C , M urthy M.R.V. Eostrogen receptor-positive and oeslrogen receptor-negative human breast can cer cell s: regulation of expression of cancer - related genes by est:radiol and tamoxifcn. 2008; 3:Î-21
Enzyme family Enzyme Metal Cellular Chromosomal Reaction ion location location
Ce tableau regroupe les caractéristiques des quatre enzymes étudiés dans notre projet. D' après les informations fournisses par ce tableau on remarque que nos quatre enzymes sont localisées dans des différents endroits soit au niveau cellulaire ou chromosomal mais leurs fonctions se ressemblent.
6
1-3. Les enzymes antioxydantes :
1-3-1. Le superoxydes dismutases cytoplasmiques (SODi) : le gène SOD1 est un gène de Il
Kb de longueur et il comprend 5 exons et 4 introns, il a été localisé dans le chromosome 21 au
niveau de la région 21 q22 (7-8). La protéine qui. résulte est surtout trouvée dans le compartiment
cytosolique, mais des petites proportions de ces protéines ont été tracées dans l ' espace
intermédiaire des mitochondries et. dans les lysosomes (9-10). L' enzyme est formée par deux sous
unités polypeptidiques identiques, une liée à l ' atome Cu et l ' autre au Zn. Ce gène est très conservé
durant l ' évolution et il a montré des grandes similarités avec les gènes correspondants pour
d ' autres espèces surtout au niveau de la TATA boxe et les CCAAT boxes, la région riche en GC
ainsi que par la présence des sites de liaison à un certain nombre de facteurs de transcription
comme: NF1 , SpI , API , AP2, GRE et NF-KB (7,11 ,12). L'expression de SOD1 augmente ou
diminue dépendamment d'une large variété de stimuli externes (13-21). Une diminution dans
l ' expression de SOD 1 ou bien des mutations au niveau de ce gène qui perturbent le f~nctionnement
normal de ce gène, ainsi qu 'une « over dose» de SOD 1 ont été reliés directement ou indirectement
à des maladies neurologiques comme le Syndrome de Down (22-24) et la sclérose latérale
amyotrophique (25 ,26).
1-3-2. Superoxyde dimutase mitochondriale (SOD2) : L'autre gène qui fait partie de la
famille des superoxydes dismutases et qui fait l ' objet de notre étude est SOD2. Le SOD2 humain
est de 15 Kb de longueur et il comprend 5 exons et 4 introns et est localisé à la région 6q25 du
chromosome 6 (27). Contrairement à SOD1 , SOD2 n 'a pas de TATA boxe ni de CAAT boxe
mais il a une région riche en GC qui est très bien conservée dans toutes les espèces. Il y a aussi de
7
multiples séquences consensus Sp 1 et AP2 dans la région 5' -UTR flanquante ainsi que des sites
NF-KB et SpI dans la région 3' -UTR flanquante en aval du site de polyadénylation (27,28). Toutes
ces régions et ces sites sont très bien conservés aussi. Ce gène mène à la formation d'une protéine
qui est formée par 4 sous unités identiques localisées dans la matrice mitochondriale de certains
tissus comme le foie , les reins et les cellules pyramidales de l 'hippocampe (29-31). Comme SOD 1,
l ' expression du gène SOD2 est induite par plusieurs stimuli pro-oxydants qui se trouvent dans
l ' environnement de la cellule (32-38). Des observations ont montrées que l ' activité de SOD2 est
réduite dans les cellules cancéreuses (39), et qu'une surexpression de SOD2 protège les cellules
contre les radiations et réduit la malignité des cellules cancéreuses (40,41). Deux autres
observations principales placent SOD2 comme un gène suppresseur de tumeur: la perte
d'hétérozygotie de la région 6q de chromosome a été trouvé dans environ 40% de mélanomes
malins humains (42) et la suppression du long bras du chromosome 6 identifié dans SV 40 a
transformé le fibroblaste humain (43). En outre, la surexpression de MnSOD (SOD2) supprime la
tumorigenicité des cellules humaines de mélanome, des cellules de cancer du sein (44) et des
cellules de glioma (45). Toutes ces observations suggèrent que SOD2 peut protéger les cellules
contre la cancérogenèse causée par les radicaux libres. D'autres recherches faites sur les mutations
et les polymorphismes au niveau du gène SOD2 ont montré que ces derniers sont associés à de
sérieuses maladies humaines comme le vieillissement prématuré (46), des maladies
neuropathologiques, la cardiomyopathie idiopathique (47) et le cancer du sein (48).
1-3-3. La glutathionne peroxydase cellulaire (GPx1) : Le gène GPx1 humain a été localisé
au niveau de la région 3qll-3qI3.1 du chromosome 3 (49) ainsi que deux autres loci considérés
comme pS'eudogènes ont été trouvés dans le chromosome 21 et le chromosome X (50-52). Le
locus de GPx1 sur le chromosome 3 est très proche de l' oncogène rhoH12 qui est localisé de
8
l'autre coté du centromère à la position 3q21 (53) de façon que les 511 paIrs de bases de
l ' extrémité 3' -UTR de l 'ADN complémentaire (ADNc) de rhoH12 chevauche avec la séquence
5' -UTR flanquante de GPxl et à une distance de 810 pb du point de départ de la transcription du
gène GPx l (54,55). Plusieurs allèles dans la région 3p du chromosome 3 ont été fréquemment
observés dans plusieurs types de cancer sporadiques y inclus les cancers des poumons, du sein, des
reins et des ovaires (56).
En plus de ce site oncogénique, d ' autres régions régulatrices potentielles ont été observées
dans la région 5' -UTR flanquante incluant une répétition Alu, une TA TA boxe, des séquences
consensus SPI et API (57). L'expression de GPx1 est régulée par plusieurs signaux biochimiques
comme la tension d ' oxygène, les hormones et les xénobiotiques (58,59). L'enzyme active est un
tétramère qui est abondamment exprimé dans les érythrocytes, les reins et le foie mais il est moins
exprimé dans d' autres cellules (60). Des polymorphismes dans le gène GPx 1 sont associés à des
grands risques à quelques types de cancers (61-62).
1-3 -4. Catalase (CAT) : le gène de la catalase se trouve à la position Il p 13 du chromosome
Il (63). Une analyse d ' une portion de 1.7Kb de la séquence 5'-UTR flanquante a montré que ce
gène a un promoteur de structure typique, et que dans les 500 pb précédant le codon Start il n'ya
pas de boxe TATA, mais par contre il ya Cinque boxes CCAAT, deux motifs CCAAT inversés,
deux sites de liaison SpI , une région riche en GC ainsi que de multiple sites de début de
transcription.
Dans cette région on trouve également 4 éléments intéressants: une séquence de liaison à la
protéine c-myc (TCTCTT A), une boxe Pu (GAGGAA), une séquence de 1 ' interféron-~
(AAGTGA) et un élément de réponse au glucocorticoïde (TGTTCT). Toutes ces séquences
peuvent avoir un rôle dans la régulation de l ' expression de ce gène (64-68). La protéine CA Test
9
une protéine hème tétraédrique qui contient 527 acides aminés (69-71). Dans le foie, on trouve
beaucoup de cette enzyme paroxysomale. L ' enzyme cible cette organelle par un signal sous forme
d 'un tripeptide Ser-His-Leu localisé proche du terminal carboxyle de la protéine (72,73). Une
catalase mutée cause l ' acatalasémie (74). Un disfonctionnement de l'enzyme CAT peut être assez
grave pour causer plusieurs maladies. humaines comme: le vieillissement, l' athérosclérose,
l ' arthrite, le cancer, un disfonctionnement pulmonaire ... etc (75-77). Il ya aussi un certain nombre
d ' anomalies comme le syndrome de Zellweger et la malàdie de Refsum infantile qui sont liées à un
mauvais emplacement de cette enzyme dans un autre compartiment cellulaire à cause d 'une
défiance de l ' assemblement du peroxysome (78-80).
1-4. Les hormones stéroïdiennes, leurs récepteurs et la thérapie endocrine du cancer du sein:
L' œstrogène et la progestérone sont des facteurs crUCIaux dans la crolssancè et la
différentiation des tissus mammaires (81). Ces hormones exercent leurs effets par leurs liaisons et
l'activation de leurs récepteurs spécifiques; le -récepteur d'œstrogène (ER) et le récepteur de la
progestérone (PR). Des anticorps monoclonaux sont généralement utilisés pour des analyses
immuno-histochimiques du statut de ces récepteurs dans les tumeurs au niveau des cellules
mammaires (82). ER et PR sont des membres d'une superfamille de récepteurs nucléaires
d 'hormones qui, une fois associés à leurs ligands, fonctionnent comme des facteurs de transcription
(83); par exemple, l ' œstrogène influence l'expression d'un certain nombre de gènes incluant le PR,
qui sont importants pour la signalisation au niveau de la mitogénèse. Malgré qu'il n ' ya pas de vraie
évidence que le gène de ER subit des larges délétions, des réarrangements ou des amplifications
durant la carcinogénèse des cellules mammaires, il ya quelques observations qui ont montré que
10
des variants moléculaires des ER peuvent être associés à des phénotypes bizarres dans des tumeurs
mammaires (84).
La thérapie endocrine du cancer du seIn cible les VOles de signalisation impliquant
l' œstrogène et l 'ER. Des études cliniques faites avec de nombreuses hormones antagonistes pour
l' œstrogène ont conduit à des résultats très promoteurs (85-87). Des modèles utilisant l ' anti
œstrogène ont montré des simples compétitions entre l ' œstrogène et l ' anti -œstrogène pour le site
de liaison au ligand d 'ER (88). Mais, malgré que . quelques anti-œstrogène, comme les stéroïdes,
sont des antagonistes très efficaces, in vivo comme in vitro, avec aucune activité agoniste, d ' autre
anti -œstrogène, comme le tamoxifen, peuvent avoir des effets mixtes : agoniste et antagoniste et
ceci dépend du type de la cellule impliquée (89).
Le tamoxifen (T AM) a été utilisé, depuis des années, comme un traitement pour le cancer du
sein et il a montré des résultats impressionnants avec plus que 700/0 d'efficacité au niveau de la
réponse des cellules mammaires cancéreuses (90-95). Il provoque un arrêt de la croissance ainsi
qu 'une apoptose au niveau des cellules cancéreuses et il a été approuvé comme un agent
chémopreventif pour les femmes qui risquent #d' avoir cette maladie (96). T AM inhibe la
prolifération cellulaire par son action sur ER -u, un facteur de transcription, qui régule la
transformation du TGF - u, un facteur de croissance, et celle du récepteur du facteur de croissance
épidermique (EGFR). Ceci peut mener à un arrêt de la croissance cellulaire ou à la mort cellulaire
et donc à une régression de la tumeur, dépendamment de la concentration de T AM utilisé (97,98).
L'effet anticarcinogénique de T AM peut être médié par d ' autre voies de signalisation que celui
qui implique l 'ER (99), y inclus la protéine kinase C, la régulation de la calmoduline, la
signalisation du calcium ainsi que la régulation du stress oxydatif cellulaire (100,101).
Il
1-5. L'œstrogène, letamoxifen et leurs effets sur les gènes d'enzymes antioxydantes:
Le cancer du sein, avec touts ces facteurs héréditaires ainsi que ceux environnementaux, est
une maladie cliniquement hétérogène et cOlnplexe (102). Les mutations des gènes qui mènent à
une prédisposition à un cancer héréditaire ~ont (103):
(a) Des mutations germinales qui sont hérités recessivement.
(b) Des mutations somatiques
(c) Des mutations qui sont soit germinales soit somatiques et qui sont dominantes.
Malgré que quelques mutations héritées, comme celles trouvées dans les gènes BRCA 1 et
BRCA2, sont plus prévalent dans certaines régions ethniques et géographique~ (104-107), elles ne
causent que seulement 5-10% des cas atteintes par le cancer du sein parmi toute la population en
général, alors que d'autres mutations sont plus fréquentes dans des cancers sporadiques (108-110).
Des gènes reliés aux cancers, comme les proto-oncogènes, les gènes suppresseurs de tumeur
et les gènes antioxydants sont généralement impliqués dans la régulation des fonctions normales
des cellules comme la prolifération, la différentiation et l' apoptose (111). Ils constituent un
système de processus multiples qui, normalement, guide les transmissions spécifiques des signaux
extracellulaires au noyau, et par conséquent régulent l'expression des gènes et la réplication ·des
cellules. Mais, n'importe quelle activation de ces gènes, due à des modifications héréditaires ou
bien sporadiques de ces voies régulatrices peut mener à une ou plusieurs des conséquences
suivantes (112): (a) une super production du produit du gène soit une concentration plus élevée de
la protéine résultante dans la région fonctionnelle de la cellule; (b) une expression non prévue du
gène: une activation du gène dans un moment ou un contexte inapproprié durant le cycle
12
cellulaire; (c) L' expression du gène dans un type de cellule différent de celui dans le quel la cellule
exerce normalement ces fonctions, et (d) des modifications structurales des protéines produites par
les gènes ce qui modifie le mode d' action de ces protéines.
Les effets de la prolifération de l' œstrogène qui Joue un rôle très important dans le
développement du cancer du sein ont une relation étroite avec l'ER (113,114). En général, les
tumeurs ER négative sont associées à une récurrence antérieure et à un faible espoir de survie des
patients, comparé aux tumeurs ER positive ce qui fait que la présence d'ER est considérée comme
un bon marqueur dans la prédiction de la réponse de la thérapie endocrine (115-117). D 'autres
observations ont montré que l'estrogène est aussi impliqué dans le dommage oxydatif de l'ADN
par sa liaison au récepteur de l 'œstrogène (118). D'autres études ont révélé que l'œstrogène peut
exercer des rôles antioxydants ainsi que anti-apoptotique dans la fibrose hépatique chez les rats
(119). Cette grande diversité fonctionnelle de l'œstrogène nous invite à se demander: C' est quoi le
rôle exacte de l' œstrogène dans la .carcinogénèse au niveau des cellules mammaires?
Le mécanisme d' action le plus important du tamoxifen comme une drogue anti tumeur tire
son effet de son rôle comme un agoniste et antagoniste d'ER, mais ça peut avoir d'autres
mécanismes qui n'ont pas de lien avec l'ER.
13
CHAPITRE-2
LES SIGNAUX DE TRANSDUCTION, LES INTERACTIONS
GÉNIQUES, LES DIALOGUES ENTRE LES GÈNES ET LE
POL YMORPHISME
14
2-1. Généralités: Les signaux de transduction
La transduction de signaux désigne l'intégration d'un message d'origine extracellulaire par
une cellule. La transduction de signaux est un point commun de la communication cellulaire des
systèmes endocriniens, nerveux et immunitaire chez les mammifères. Chez ceux -ci, il existe plus
de 200 types cellulaires différents et spécialisés. Ces cellules émettent des médiateurs (ligands,
hormones ... ) qui peuvent être détectées par d'autres cellules (par l'intermédiaire de récepteurs
spécifiques situés à la périphérie de la cellule, au niveau de la membrane plasmique) et induire des
réponses de ces dernières. Le signal est transmis à l'intérieur de la cellule par un changement de
conformation du récepteur membranaire. Cette trànsformation induit ensuite l'initialisation de
diverses voies. de signalisation parfois par l'intermédiaire de messagers secondaires (Figure-2).
On a déjà mentionné plus haut que le cancer est une maladie très complexe. Plusieurs facteurs
peuvent être impliqués dans cette maladie dont on peut citer les signaux de transduction. Parmi ces
voies de signalisation, beaucoup peuvent être impliqués dans le cancer, ce qui lui rends une
maladie compliqué et pas facile à traiter. La Figure-3 représente un sommaire des voies de
signalisation impliquées dans le cancer. Alors que la Figure-4 rassemble ces voies avec plus de
Figure-2. Quelques voies de signalisation impliquées dans quelques processus primordiaux dans la survie cellulaire : la régulation, la différentions, le cycle cellulaire et l' apoptose. http://en. wikipedia.org/wiki/Signal transduction (122).
16
~l/ TCF4
t ~~ . , -~~ J ~(RTK)~
RAS:GTP ~-- E-cadherin
Figure-3. Quelques voies de signalisations impliquées dans certains types de cancer. Toutes ces di fférentes voies de signalisations (voie de SMAD, Apoptose, p53 , PI3K ... ) et beaucoup d ' autres peuvent affecter le déroulement normal du cycle cel1uJaire ce qui J' empêchent même de se suicider ce qui cause une formation d ' une masse cellulaire immortelle signe évidente des cancers. Bert V, Kenneth WK. Cancer genes and the pathways they control (123). Nature Med. 2004 ; 8 :795.
17
Figure-4. Multiples voies de signalisation impliquées dans le cancer. Interaction de plusieurs voies de signalisation entre eux dans une même cellule ce qui rend parfois difficile de savoir exactement là où les voies qui sont réellement impliquées dans un cancer et non dans un autre type de cancer. GENE ASSIST ™ PATHWA y ATLAS (124).
18
2-2. Les voies de signalisation, les interactions géniques aInSI que les polymorphismes trouvés dans nos quatre gènes:
2-2-1. Voies de signalisation:
Plusieurs VOles de signalisation sont impliquées dans le fonctionnement de la défense
antioxydante contre les ROS. Les gènes indiqués ici sont nos quatre gènes en étude: SODI , SOD2,
GPx 1 et CA T. Dans la Figure-S, les voies impliquées ici sont en relation avec la maladie de
Sclérose Amyotrophique Latérale (SAL).
2-2-2. Interaction génique:
Les interactions génétiques correspondent à des modifications dans l' action d 'un gène
induites par l' expression d'un autre gène. Typiquement, les interactions génétiques sont mises en
évidence par une observation des phénotypes. Par exemple, si le phénotype d'un mutant sur un
premier gène est aggravé ou au contraire sauvé par une mutation sur un deuxième gène, alors il y a
interaction entre les deux gènes.
Une interaction génétique peut être la conséquence directe d'une interaction moléculaire mais
il se peut aussi qu'elle soit la conséquence d'une cascade d ' interactions moléculaires. Les
interactions génétiques sont donc des interactions dont on ne connaît pas le mécanisme moléculaire
ou qui sont la conséquence de plusieurs interactions moléculaires.
En définitive, la notion d' interaction que nous prenons en compte recouvre des réalités biologiques
variées:
• Augmentation ou diminution du niveau d' expression génique
19
• Régulation post-transcriptionnelle
• Modification post-traductionnelle
• Formation de complexes protéiques
• Activation ou inhibition d ' un gène par un autre
Figure-S. Les voies de signalisation appliquées sur les gènes antioxydants qui ont une relation avec la sclérose amyotrophique latérale. http://www.genome.jp/tmp/mark pathway www4694/hsa05030.gif (125).
22
Une autre étude sur le polymorphisme de ces gènes à été fait. L'étude a été réalisée en
comparant 1262 femmes diagnostiqués au cancer du sein a 1533 femmes saines (contrôles). Les
polymorphismes étudiés pour les deux gènes MnSOD et GPX-1 sont Val16Ala, rs1799725 et
Pro198Leu, rs1050450, respectivement et sont génotypés par l'utilisation de l'analyse de TaqMan.
Les résultats de cette étude sont résumés dans le tableau-2 (119). Jusqu'ici, peu de telles
interactions ont été détectées et rapportées dans la littérature. Afin d'avoir la puissance suffisante
de détecter de telles associations, des grandes bases de données sont nécessaires. Cette étude a la
puissance de 80% de détecter un rapport de chance de 1.85 pour une interaction entre les modèles
récessifs pour deux polymoJ]Jhismes comme ceux cités plus haut, où ni l'un ni l'autre seul, risque
d'augmenter le polymorphisme. Dans ces analyses, ils ont tiré bénéfice de la présence relativement
forte des deux polymorphismes. L'objectif évident était d'examiner plus de gènes le long de la
même voie, aussi bien que des variables non-génétiques telles que les niveaux de plasma ou les
facteurs de style de vie qui affectent l'effet oxydant tel que le tabagisme, la consommation d'alcool,
et les antioxydants diététiques ou les suppléments. Les travaux futurs sur des polymorphismes dans
les gènes le long des voies biologiquement relatives, et l'inclusion des interactions d'environnement
x gène, rendront nécessaire l'élaboration ultérieure des méthodes statistiques. La conclusion a la
quelle cette équipe de recherche est arrivé à la fin de leur projet est que les polymorphismes dans
les gènes de GPX-1 et de MnSOD sont associés à un grand risque de cancer du sein.
U ne autre étude faite sur les interactions géniques dans les gènes impliqués dans le cancer du
sein a confirmé que le polymorphisme génétique dans le gène de MnSOD peut être associé a un grand
risque de cancer du sein parmi les femmes chinoises avec des niveaux élevés de l'effet oxydant ou
d'une basse prise des antioxydants (120). En effet, dans cette étude ils ont constaté que le génotype
23
AlaJ Ala de MnSOD a été légèrement associé à risque élevé de cancer du sein. L'association positive
était plus évidente chez les femmes pré-ménopausées, en particulier parmi ceux qui ont consommé une
basse quantité des vitamines antioxydantes ou avec des niveaux élevés de stress oxydatif. Cependant,
l'étude est limitée par le de basse fréquence de l'allèle Ala dans la population chinoIse, et la majeure
partie de l'ORs ( odds ratio) n'était pas statistiquement significative.
24
Tableau-2. L'interaction entre le polymorphisme de GPX1 , Pro198Leu, et celui de MnSOD, Val16Ala, et le risque de cancer du sein. Basé sur Cox et al. Gene *Gene interaction between MnSOD and GPx1 and breast cancer risk: a nested case-control study (119). BMC Cancer. 2006; 6:217-2.
Genotype
Pro198 carrier and Val16 carrier
Leu 198Leu and Val16 carrier
Pro198 carrier and Ala16Ala
Leu198Leu and Ala16Ala
*OR=odds rati o.
*CI=Confidence lntervals
Cases (%)
771 (67.0)
90 (7.8)
255 (22.2)
35 (3.0)
Controls (%) OR. * (95% CI)
997 (67.4) 1.00 (Ref.)
124 (8.4) 0.94 (0.69 - 1.27)
331 (22.4) 1.01 (0.83 - 1.23)
28 (1.9) 1.87 (1.09 - 3.19)
Le Tableau 2 montre les relations el1tre les génotypes de MnSOD et de GPX-l et le rîsque de cancer du sein. La distribution des génotypes combinés et montrés dans ce tableau n'est pas statistiquelnent différente de cela prévue. Ni l'un ni l'autre de ces SNPs n ' augmentent individuellement le risque de cancer du sein. Étant donné que ces deux gènes sont en activité sur Ja voie de la désintoxification des ROS de 1 '0-à H20 2 (MnSOD), et ensuite à H20 (GPX-l) et ces polymorphismes influencent l'efficacité de cette désintoxication, ils ont présumé que le risque pourrait être détecté quand les deux SNPs sont combinés. Dans ces analyses, la cOlnbinaison des deux polymorphismes est associée à un risque sensiblement accru de cancer du sein. Les individus hOlnozygotes pour J'allèle AJa16 de MnSOD et J'allèle Leu 198 de GPX-1 ont une augmentation de 1.87 fois du risque de cancer du sein comparé aux porteurs Val16 et Pro 198, et la pvaleur pour J'interaction entre ces génotypes est de 0.03.
25
,.--------------- -- ---- -
CHAPITRE-3
LE PLAN DE TRAVAIL EN VUE DE DÉCOUVRIR LES
MECHANISMES DE RÈGULATION DES GÈNES D'ENZYMES
ANTIOXYDANTES DANS LE CANCER DU SEIN
26
Les résultats antérieurs obtenus dans notre laboratoire sur les traitements des cellules
mammaires cancéreuses récepteur d ' œstrogène positif et négatif (ER + et ER -) avec l ' œstradiol et
le tamoxifen, soit individuellement ou combinés ont aboutit aux observations suivantes (118):
(a) Traités avec l 'œstradiol seul (1.0 llM, 18h), le niveau d'expression de SOD2 et GPx l
augmente 1400 fois et 500 fois dans les cellules du cancer du sein ER+ par rapport à cellules ER-,
respectivement, comparés aux cellules non traités alors que le niveau d ' expression de SODI et
CAT diminue de 73% et de 81 % respectivement. (b) Traités avec le tamoxifen seul (1.0 J.1M, 18h)
le niveau d ' expression de SOD2 et GPx 1 a augmenté de 2000 et 500 fois respectivement comparé
aux cellules non traités, alors que l' expression de SOD 1 et CAT a diminué de 85% et de 760/0
respectivement. (c )Traités avec une combinaison de l' œstradiol et le tamoxifen (1 OnM œstradiol +
1.0 J.1M tamoxifen, 18h), le niveau d'expression de SOD2 et de GPxl a augmenté 903 fois et 950
fois respectivement comparé aux cellules non traités, alors que le niveau d ' expression de SOD 1 et
de CA T a diminué de 81 % et 570/0 respectivement. Les enzymes SOD 1 et SOD2 agissent sur les
radicaux superoxydes et les convertissent en peroxyde d'hydrogène alors que les enzymes GPxl et
CAT dégradent le peroxyde d'hydrogène en H20. Ainsi, les deux familles d'enzymes, d 'une part
les dismutases superoxydes SODI et SOD2, et GPxl et CAT, d'une autre part, agissent
séquentiellement sur les radicaux superoxydes.
Des résultats similaires sur les niveaux d' expression de SODI vs SOD2, et GPxl vs CAT
ont été observés quand les cellules Neuro-2A étaient traitées avec des neurotoxines; ménadione,
roténone et 6-0H dopamine, qui produisent une variété de ROS dans ces cellules (8). Ces enzymes,
malgré qu' elles accomplissent des fonctions similaires, elles se localisent dans des compartiments
27
cellulaires différents. Les différences qu 'on observe dans les niveaux d' expression dans chacun des
pairs des gènes correspondant suggèrent qu'il existe probablement un mécanisme de dialogue entre
les gènes membres de chaque pair aussi bien qu' entre les quatre gènes antioxydants. On ajoute à
ceci les mécanismes qui peuvent exister pour la translocation des différentes enzymes matures à
leurs compartiments correspondants.
Dans le but d' élucider la nature de ces mécanismes on a comparé les gènes de ces quatre
enzymes antioxydantes (SODI , SOD2, GPxI et CAT) dans différents compartiments et dans des
différents niveaux d'expression. Dans ce Chapitre on montre le travail effectué pour atteindre notre
objectif principale celui de Comprendre les mécanismes de régulation de nos quatre gènes et
détermine~ par quel moyen ils communiquent entre eux. Pour ce faire on s'est fixé trois objectifs
spécifiques. Le premier objectif était de chercher les variants de SOD2 et GPxI qui sont
surexprimés dans notre étude antérieure. Le deuxième objectif était de chercher des régions de
similarité entre tous les composants de nos quatre gènes en comparant les différentes régions de
ces gènes : exons, introns, 5' -UTR, 3' -UTR ainsi que les séquences peptidiques pour déterminer
les régions similaires et les régions qui diffèrent entre ces gènes, dans le but de voir si ces
comparaisons peuvent expliquer les observations déjà faites sur les changements des niveaux
d'expressions de ces gènes. Le troisième objectif était de chercher des facteurs de transcription
impliqués dans l'expression de nos gènes
Pour ce faire, on a utilisé des programmes bio-informatiques assez puissants et jugés de très
efficaces.
28
3-1. Méthodologie:
3 -1-1. Les outils bio-informatiques:
Notre recherche est basée sur les outils bioinformatiques et le système d ' exploitation utilisé
est Unix. Le système Unix est l ' un des systèmes d ' exploitation les plus populaires dans le monde,
en raison du grand nombre d'architectures qu ' il suppose. Ce système est un système d ' exploitation
multi-utilisateurs, multitâches, ce qui signifie qu' il permet à un ordinateur mono ou
multiprocesseurs d ' exécuter simultanément plusieurs programmes par un ou plusieurs utilisateurs.
Au sens strict, Linux n'est pas Unix. Linux n ' est que le noyau, le cœur du système
d ' exploitation. Le système Linux est construit par une succession de couche:
-Noyau: contient essentiellement tous les composants nécessaires au fonctionnement
matériel.
-Les daemons : correspondent essentiellement à des taches mises en service dès le démarrage
du système.
-le Shell : est l'interrupteur de commande disponible sur un système Unix. Il constitue le seul
moyen pour l'utilisateur de communiquer avec le système lui-même.
-Les commandes : des simples scripts Shell qui se tapent dans une fenêtre « terminale» pour
demander au système de faire une application.
À part ces composaI).ts du système Unix, il ya des applications et des programmes dont on
s ' est servi pour effectuer notre recherche. Les éditeurs de texte, comme Joe qu'on a utilisé pour
afficher le contenue de nos répertoires qui contiennent les séquences des gènes étudiés.
Les programmes Emboss et GCG, aussi , ont été très utiles. E~ effet, Emboss (European
Molecular Biology Open Software Suite) est une suite logicielle développée par l'EBI et l ' institut
SANGER. La suite comprend des programmes, des utilitaires et des banques de séquences qui
29
permettent de couvrir l'ensemble des besoins élémentaires dans le domaine de l ' analyse et de
l'exploitation des séquences biologiques.
GCG, de sa part est un ensemble de programmes d'analyse de bio-informatique. Il répond en
tout ou en partie à la majorité des besoins de bio-informatique: analyse de gels de
chromatogrammes, enzyme de restriction, recherche de gènes, phylogénie, comparaisons des
séquences nucléotidique ou peptidiques avec des b~nques de séquences. Il existe plusieurs version
de GCG, et dans notre projet on a utilisé la dernière version de GCG qui est GCG.II et qui nous
semble la plus performante.
Finalement, en utilisant le système Unix on peut remarquer la nécessité d ' avoir des sorties
graphiques qui peuvent être sauvegardées ou visualisés de plusieurs manières (commande
xwindows sur Unix, Cygwin qui est un environnement Unix pour Windows ... ). Dans notre analyse
on a utilisé SeqLab comme logiciel à interférence graphique sous Unix.
Au niveau de la recherche des variants de SOD2 et de GPx 1 qui sont impliqués dans notre
étude (Obj~ctifl) et au niveau de la recherche des facteurs de transcription qui pourront être
impliqués dans les changements des niveaux d'expression de nos quatre gènes (objectiD), on a
utilisé une commande sous le programme GCG.ll. Cette commande est Findpatterns qui permet
de chercher des petites séquences dans des grandes séquences. Comme par exemple si on cherche
une séquence consensus d'un facteur de transcription dans une séquence d'ADN d 'un gène on peut
utiliser cette commande qui nous donne comme résultats l ' existence ou non de cette sequence
consensus sur le gène en question.
Au niveau des étapes d ' alignement et de comparaIson des séquences, on a utilisé des
programmes comme BLAST, Bestfit, Gap et ClustaW.
30
BLAST (Basic Local alignement Search Tool), permet de comparer une séquence contre des
banques locales. L'utilisation de BLAST nous a donné une idée sur les gènes et les protéines
homologues et paralogues à nos gènes en étude.
De plus, on a utilisé Bestfit qui est un programme qui donne les meilleures séquences
similaires locales. Ce dernier nous a donné une série de séquences similaires entre n~s quatre
gènes. Quand à Gap, lui il donne les meilleures séquences similaires globales, ceci est utilisé pour
voir les similarités globales tout au long de nos séquences nucléotidiques ou protéiques.
Finalement Clusta West un programme d' alignement multiple. On l' a utilisé pour comparer les
séquences des quatre gènes ensembles pour trouver les séquences similaires chez les quatre gènes.
3-1-2. Recherche des Variants de SOD2 et GPxl qui sont surexprimés dans
notre étude:
Pour atteindre cet objectif on s'est servi de quelques informations déjà utilisé dans une étude
antérieure dans notre laboratoire. Dans cette étude, ils ont utilisé des amorces sens (F) et anti -sens
(R) (Tableau-3). On s'est servie de ces amorces pour chercher quels variants de SOD2 et GPXl qui
ont été impliqués dans cette étude puisque notre projet est basé sur des résultats déjà trouvés dans
cette étude antérieure. Pour chercher ces amorces sur la banque de données Genbank, on a utilisé,
comme indiqué plus haut, la commande Findpatterns comme suit:
Pour SOD2:
%Findpa tterns
Fi ndpatterns in wha t ·sequence? Genbank:* NC-0000006.10
Enter pattern
Pattern1 amorce sen s (F) SOD2
Pattern2 amorce ant i sens (R) SOD2
(NC-0000006.IO est le numéro d'accession de SOD2 dans la Genbank)
31
Tableau-3. Amorces utilisés pour l'Amplification des ADNc de nos quatre gènes
Antioxidant enzyme genes
SODI
SOD2
GPxl
CAT
32
La signification de cet ensemble de commande est qu'on est allé cherche l' amorce sens
(pattern1) et l' amorce anti sens (pattern2) dans les séquences des gènes SOD2 (NC-000006.10) qui
se trouvent sur la banque de données Genbank.
La même chose est faite pour le gène GPx 1 :
%Findpatterns
Fi ndpatte r ns in what sequenc e? Genbank:* NC-0000003.10
Enter pattern
Patternl amo r ce s ens (F ) GPx l
Pattern2 amo r ce anti sens (R) GPx l
(NC-0000003.10 est le numéro d 'accession de GPx] sur dans la Genbank)
3-1-3. Comparaison et recherche des régions de similarité entre tous les composantes de nos quatre gènes
3-1-3.1 Extraction des régions codantes Cexons) et non codantes Cintrons) ainsi que les régions 5' -UTR et 3' -UTR:
Durant cette étude, on s'est servi beaucoup de la littérature qui existe déjà sur des sites
internet sur les séquences complètes des gènes humains. Pour ça on s'est référé au site de NCBI
(http://www.ncbi.nlm.nih.gov/). Sur ce site, on trouve des informations intéressantes sur nos quatre
gènes.
Cette partie de notre étude consiste à extraire les régions codantes, les régions non codantes
ainsi que les régions 3' -UTR et 5' -UTR de nos gènes et celles de leurs ARNm. Cette étape est très
critique parce qu' elle demande beaucoup de précision puisque' on ne peut pas se permettre de
manquer ou d' ajouter même pas une base sinon ceci pourra causer un changement du cadre de
33
lecture. Pour ce faire , on s ' est servi du projet de séquençage du génome humain et pour chaque
gène on est allé voir le chromosome sur le quel se trouve notre gène et on essaie d ' extraire la
séquence du gène. Pour vérifier si on a choisi la bonne séquence de gène, on a utilisé des méthodes
de prédiction des gènes eucaryotes. Ceci consiste à vérifier les éléments suivant:
../ Les cadres de lectures ouverts,
../ Jonction exon/intron et sites d ' ép'issage,
../ Codon d ' initiation et codon dé terminaison,
../ Les régions promotrices,
../ Les sites de polyadénylation,
Après qu' on s ' est assuré que la séquence qu ' on a extraite correspond à la séquence du gène
en question on passe à découper ce gène en région 5' -UTR, 3' -UTR, régions codantes (les exons)
et les régions non codantes (les introns). Ce travail est fait sur nos quatre gènes SOD 1, SOD2,
GPx1 et CAT pour pouvoir comparer touts ces composants entre eux et pour voir c ' est où qu' ils se
ressemblent entre eux et aussi pour trouver les parties qui diffèrent entre ces gènes.
SODt:
Pour le gène SOD 1, l'annotation et la séquence nucléotidique ainsi que la séquence de la
protéine sont fournis. Le gène SOD 1 est un gène de Il Kb de longueur et il comprend 5 exons et 4
introns, il a été localisé dans le chromosome 21 au niveau de la région 21 q22 (entre le
nucléotide31953806 et le nucléotide 31963115 du chromosome 21) (Figure-6).
L ' annotation du gène SODI nous informe sur la longueur des exons et leurs séquences et de
même pour les introns et l' ARNm de ce gène. Par contre elle ne nous informe pas sur les
séquences 5' -UTR et 3 ' -UTR. Pour ces derniers, on est allé chercher les gènes en aval et en amont
34
du SOD 1 sur ~e chromosome 21. Dans la séquence du gène en amont du SOD 1 qui est KRT AP6-1 ,
on a pris les derniers 1000 pairs de base pour les considérer comme la région 5' -UTR de SOD 1
alors que dans la séquence du gène en aval de SOD 1 qui est OLIG 1 on a pris les premiers 1000 pb
de ce gène comme la séquence 3' -UTR de SODI. Cette méthode a été utilisé pour les autres trois
gènes (SOD2, GPx1 et CAT), c' est -à-dire, on a cherché les gènes en amont et en aval de nos
quatre gènes et on a déduit les régions 3' -UTR et 5' -UTR de ce gènes en étudiant les régions qui
chevauchent au niveau de la partie 3' -UTR de notre gène et la partie 5' -UTR du gène en aval. Pour
la région 5' -UTR on-a cherché la région chevauchante èntre la région 3' -UTR du gène en amont et
la région 3' -UTR de notre gène. On s' est basé sur les méthodes de prédiction déjà mentionné
(vérification des codons Start et stop, des promoteurs et des sites de poly adénylation) pour
s' assurer que les régions 5' -UTR et 3' -UTR de nos gènes sont les bonnes.
Comme on a indiqué plus haut, la séqu~nce complète du gène de SOD1 est de Il Kb de
longueur, mais sans la région 5' -UTR et 3' -UTR, on trouve qu' elle est composé de 9310 pb, entre
le nucléotide31953806 et le nucléotide 31963115 du chromosome 21 (Figure-6b). Le Tableau3
regroupe les séquences des exons et des introns de SOD 1.
La protéine de SOD 1 est composée de 154 acides aminés. Elle lie les ions cuivre et zinc et
est l'une de deux isozymes responsables de détruire les radicaux libres de superoxyde dans le corps.
L'isozyme codée est une protéine cytoplasmique soluble. L' acide aminé His63 est considéré
comme crucial pour la liaison des deux ions (Cu et Zn) (Figure-7).
35
b)
[3195380G ~
Ideogran
a) 21p13 -f~J 21p12 -==
21pl1.2
21pl1.1 21911.1 21911.2
21"121
21"122
-~=
NC_000021.7
Figure-6. a) localisation du gène SOD1 sur le chromosome 21. b) représentation du gène SODI avec sa région 5' -UTR et 3' -UTR (les triangles), ces exons (les rectangles), cesintrons (1es régions entre les exons). NC_000021.7 est le numéro d'accession de notre gène sur NCBI (NC_000021.7). (126)
, 36
Tableau-4. Longueur des régions codantes et non codantes de SOD 1 ainsi que leurs localisations sur ce gène. * les numéros attribués aux nucléotides dans ce tableau sont par rapport au gène SODI et non par rapport au chromosome 21 (Annexel).
Longueur des séquences des exons et des
introns de SOD 1
Exon-1 71pb(de 149 à 220)
Intron-l 3949pb(de221 à4169)
Exon-2 96pb (de 4170 à 4265)
Intron-2 2563pb (de 4266 à 6828)
Exon-3 69pb (de 6829 à 6897)
Intron-3 740pb (de 6898 à 7637)
Exon-4 117pb (de 7638 à 7754)
Intron-4 1096pb (de 7755 à 8850)
Exon-5 107pb (de 8851 à 8957)
37
a)
b) 1.10 elect ron density
Human 500 1 metal-binding site. Cu (cynn sphere) and l n (orange sphere) atorm . 1Ir(' bridged by il llis\ idine ligand {His631_ Th'" Cu il\ ()'TI ln tllis f igure i~ re(lu/;('(l îlJ)d thE' Cu ' NIHis(1) bond ls b(Hwn.
Figure-7. a) Structure de l' enzylne SOD1. b) représentation détaillé du site actif de SODI et les acides aminés impliqués dans la liaison des ions Cu et Zn.
Arg143 et His63 sont les acides aminés les plus crucialement impliqués dans le mécanisme catalytique de SOD 1. His63 forme un pont entre les ions de cuivre et de zinc par sa liaison à ces ·deux ions avec son anneau nitrogène. Ce pont est cassé et reformé pendant la catalyse. Argl 43 est nécessaire pour fixer le superoxyde (par l'intermédiaire d ' une liaison d'hydrogène) en une bonne position et en une correcte orientation pour permettre le transfert d'électron avec le cuivre. http://www.nottingham.ac.uk (127).
38
SOD2
Le gène de SOD2 humain est un gène de 15 Kb de longueur et formé de 5 exons et 4 introns
et est localisé à la région 6q25 du chromosome 6 (Figure-8). Le gène SOD2 se trouve entre le
nucléotide 160020138 et le nucléotide 160034343 du chromosome 6. Le gène SOD2 est constitué
de 14206 pb (sans compter les régions 5' -UTR et 3 ' -UTR). On trouve 3 variants pour SOD2. Le
variant 1 représente le transcrit le plus long. Il donne une protéine similaire à celle produite par le
variant 2 (isoforme A).
Le variant2 a de multiple différence dans la région 3' -UTR comparé au variant 1. Le varient3 ,
comprend plusieurs différences par rapport aux deux autres variants, il lui manque un ex on et il est
très différent au niveau de la région 3' -UTR. La protéine résultante (isoforme B) est plus courte
que l'isoforme A (Tableau-4).
Les deux protéines résultantes de ces trois variants sont appelées isoforme A et isoforme B.
Les variant1 et le variant 2 donne l' isoforme A qui est la plus longue et elle est constituée de 222
acides aminés, alors que le variant 3 donne l' isoforme B qui est composée de 183 acides aminés.
Une remarque assez intéressante qu'on veut indiquer ici est le voisinage remarquable entre le gène
SOD2 et le gène du récepteur d' œstrogène (ER). En effet, le gène du récepteur d'œstrogène est
placé à la région 6q25.1 du chromosome 6 et le gène de SOD2 est placé à la région 6q25.
i:; ot'.:>t"iil E; '~"e( 'Jr':; .:>~" CCDS34564" 1 P 1) 01 0 19(\36.1 i:; c.·t"c.t."." A pt'e( IJr·:; or' CCDS52~::'5+:I
i:; 0"'01""(1 A pl"ec IJr'~ .)1" CCD :~:52(.5+ 1
Figure-8. a) localisation du gène SOD2 sur le chromosome 6. b) représentation du gène SOD2 avec sa région 5' -UTR et 3' -UTR (les triangles), ces exons (les rectangles), ces introns (les régions ente les exons). NC _ 000006.10 est le numéro d'accession de notre gène sur NCBI. Ce gène comprend 3 variants qui diffèrent aux niveaux de }'exon 2 ainsi qu'au niveau de la région 3'-UTR. (126)
40
Tableau-S. Longueur des régions codantes et non codantes des trois variants de SOD2 ainsi que leurs localisations sur ce gène.
Variant 1 Variant 2 Variant 3
Exon-l 22pb (de 155 à 177) 22pb (de 155 à 177) 22pb (de 155 à 177)
Intron-l 282pb (de 178 à 459) 282pb (de 178 à 459) 282pb (de 178 à 459)
Exon-2 202pb (de 460 à 661) 202pb (de 460 à 661) 202pb (de 460 à 661)
Intron-2 4419pb (de 662 à 5080) 4419pb (de 662 à 5080) 7628pb (de 662 à 8289)
Exon-3 179pb (de 5081 à 5196) 116pb (de 5081 à 5196) 179pb (de 8290 à 8468)
Intron-3 3093pb (de 5197 à 8289) 3093pb (de 5197 à 8289) 2216pb (de 8469 à 10684)
Exon-4 179pb (de 8290 à 8468) 179pb (de 8290 à 8468) 145pb (de 1~685 à 10829)
Intron-4 2216.pb (de 8469 à 10684) 2216pb (de 8469 à 10684)
Exon-5 145pb (de 10685 à 10829) 145pb (de 10685 à 10829)
41
1
i
GPxl
Le gène OPxl humain a été localisé au niveau de la région 3qll-3qI3.1 du chromosome 3
ainsi que deux autres loci considéré cOmme pseudogènes ont été trouvés dans le chromosome 21
et le chromosome X. Ce gène est situé entre le nucléotide 49369613 et le nucléotide 49370795 du
chromosome 3. GPxl est un petit gène de 1183 pb.
Des études faites sur ce gène ont montré que la protéine codée par ce gène protège contre
l'apoptose de CD95 dans des cellules cultivées de cancer du sein et sa surexpression retarde la
croissance endothéliale et augmente la résistance aux défis toxiques. Cette protéine est l'une des
quelques protéines connues chez les primates et qui contient le sélénocystéine (121), qui se trouve
dans le site actif de la glutathionne peroxydase et est codé par le codon stop TGA. En outre, cette
protéine est caractériséè par un polymorphisme dans la séquence poly-alanine dans la région de N
terminale, qui inclut trois allèles avec cinq ou six répétitions ALA dans cette séquence. L'allèle avec
cinq répétitions ALA est hautement associé au cancer du sein (121). GPXl est polymorphe au codon
198, ayant pour résultat une proline ou une leucine à cette position, et on peut dire que la fréquence
de l'allèle de leucine est fortement associée à une augmentation du risque du cancer du poumon et
probablement le cancer du sein.
Deux variantes alternativement épissées codent pour deux isoformes distinctes ont été
trouvées pour ce gène (Figure-9). Le variant1 représente le transcrit le plus court et code pour
l'isoforme le plus long. L ' isoforme résultant est de 203 acides aminés de longueur. Le variant2 ne
comprend pas d ' intron «intronless ». Il a un segment additionnel dans la région codante
42
(Tableau-5) ayant pour résultat le décalage du cadre de lecture ouvert par rapport au variantl. Par
conséquent l'isoforme 2 a un C':'terminal distinct et plus court, soit 98acides aminés, par rapport à
l'isoforme l. Un autre voisinage qu 'on veut indiquer ici est celui du locus du GPx1 et l ' oncogène
rho 12 (ils ont une région chevauchante entre les deux gènes).
CAT
Le gène de la catalase se trouve à la position Il p 13 du chromosome Il. Ce gène est composé
de 33180 pb dont on trouve 13 exons et 12 introns (Figure-IO et Tableau-6). Il est situé entre le
nucléotide 34417054 et le nucléotide 34450183 du chromosome Il. Ce gène donne naissance à
une protéine de 527 acides aminés.
OLe Tableau-7 résume toutes les informations qu'on a recueillies sur nos quatre gènes.
3-1-3.2. Alignement et comparaison des séquences nucléotidiques et peptidiques des quatre gènes: SODl, SOD2, OPx1 et CAT
Après avoir découpé nos gènes en différents morceaux (5'-UTR, exons, introns et 3' -UTR),
on a pro~édé à la comparaison de ces parties. Comme on a déjà précisé, dans cette partie de notre
projet on a utilisé plusieurs programmes bio-informatique, on a commencé par comparer les 4
gènes entre eux mais on a focalisé ces comparaisons et ces alignements pour les duos SOD1~SOD2
et OPx 1-CA T puisque les résultats déjà trouvés dans notre laboratoire ont déjà montré qu'il ya une
certaine relation entre les niveaux d'expression de ces gènes (SODLet SOD2 d'une part et GPx1 et
CAT d'une autre part).
43
a) Ideogran
b) NC_000003.10
~ 4 ~1370 795 ] ... 4936'3613 ]
Figure-9. a) localisation du gène GPxl sur Je chromosome 3. b) représentation du gène GPx l avec sa région 5' -UTR et 3 ' -UTR (les triangles ), ces exons (les rectangles), ces introns (les régions ente les exons). NC _ 000003 .10 est le numéro d'accession de notre gène sur NCBI. Ce gène comprend 2 isoformes qui diffèrent au niveau des exons ainsi qu'au niveau des régions 3 ' -UTR(126)
44
Tableau-6 . . Longueur des régions codantes et non codantes des deux variants de GPx 1 ainsi que leurs localisations sur ce gène.
Figure-IO. a) Localisation du gène Catalase sur le chromosome Il. b) représentation du gène CAT avec sa région 5' -UTR et 3 ' -UTR (les rectangles), ces exons (les rectangles), ces introns (les régions ente les exons) . NC_OOOOOl].8 est le nUlnéro d ' accession de notre gène sur NCBI. Ce gène ne comprend pas de différents variants donc on a une seule isoforme du gène Catalase. (126)
46
Tableau-7. Longueur des régions codantes et non codantes de l' enzyme Catalase ainsi que leurs localisations sur ce gène.
Longueur des séquences des exons et des introns de CA T
Exon-1 65pb (de 84 à 149) Intron-1 10113pb (de 149 à 10262)
Exon-2 171pb (de 10262 à 10433) Intron-2 1625pb (de 10433 à 12058)
Exon-3 110pb (de 12058 à 12168) Intron-3 979pb (de 12168 à 13147)
Exon4 13 Op b (de 13147 à 13277) Intron-4 4883pb (de 13277 à 14160)
Exon-5 104pb (de 14160 à 14264) Intron-5 607pb (de 14264 à 14871)
Exon-6 125pb (de 14871 à 14996) Intron-6 2005pb (de 14996 à 17081)
Exon-7 191pb (de 17081 à 17272) Intron-7 463pb (de 17272 à 17735)
Exon-8 152pb (de 17735 à 17887) Intron-8 4434pb (de 17887 à 22321)
Exon-9 138pb (de 22321 à 22459) Intron-9 2715pb (de 22459 à 25174)
Exon-10 131pb (de 25174 à 25305) Intron-10 4053pb (de 25305 à 29358)
Exon-11 107pb (de 29358 à 29465) Intron-11 2563pb (de 29465 à 32028)
Exon-12 83pb (de32028à32111) Intron-12 327pb (de 32111 à 32438)
Exon-13 65pb (de 32438 à 32503)
47
Tableau-8. Quelques caractéristiques des gènes des enzymes antioxydantes ainsi que les produits des gènes analysés dans ce projet. * La longueur des gènes, introns et exons sont exprimés en nombre de bases (pb) et les longueurs des protéines en nombre d ' acides aminés (aa).
SOD} SOD2 GPx } CAT
Localisation sur 21q22 6q25 3q Il Il P 13 les chromosomes
Longueur du gène 11Kb 15Kb 1.3 Kb 37 Kb
Les types des sites Boxe Régions riches en un oncogène 5 boxes de régulation des TATA, boxe G+C, Sp l , AP2 (rho2), répétition CCAAT, 2
gènes CCAAT, NF-kb Alu, boxe SpI , région région riche TATA, SpI , API très riche en
en G+C, G+C, NF1 , SpI , séquence de Apl , Ap2, liaison à c-
GRE et NF- myc kb (TCTCTTA),
une boxe Pu (GAGGAA), une séquence d ' interféron
beta (AAGTGA), un élément de réponse aux
glucocorticoïd e (TGTTCT)
Nombre et 4 introns 4 introns 1 intron 12 introns longueur totale 8348 pb * 100] 0 pb 280 pb 34767 pb
des introns Nombre et 5 exons 5 exons 2 exons 13 exons
longueur totale 460 pb 664 pb 610 pb 1572 pb des exons Nombre et 1 ARNm 3 ARNlns 2ARNms 1 ARNm
longueur totale 981 ARNml=918 ARNm1=921 2305 des ARNm (en ARNm2=1035 ARNm2=1200
bases) ARNm3=1593
NOlnbre et 1 protéine 2 protéines 2protéines 1 protéine longueur des 154 aa* ARNm 1 et 2=222aa ARNml=203 aa 527 aa proté i nes( en ARNm3=183aa ARNm2=98 aa
acides aminés) Nombre des sous
unités 2 4 3 3
48
Pour ce faire on a utilisé trois programmes différents qui servent à la comparaIson des
séquences °nucléotidiques et peptidiques. Le premier est un programme de comparaison multiple
appelé ClustaW qui permet d'établir l'alignement multiple des séquences personnelles ou de
banques, nucléiques ou protéiques. Il propose en outre de générer l'arbre phylogénétique à partir
d'un alignement donné. Ceci on l' a utilisé pour déterminer les régions communes pour les quatre
gènes.
Les deux autres programmes, Bestfit et Gap, sont deux programmes de comparaison des
séquences en pairs. En effet, Bestfit et Gap ne peuvent pas comparer plus que deux séquences à la
fois. La différence entre ces deux programmes consiste au niveau des séquences à comparer. Bestfit
est un programme de comparaison qui donne les meilleures régions locales de similarité entre des
séquences nucléiques ou peptidiques. Quand a Gap, il donne toutes les régions globales qui sont
similaires entre deux séquences.
3-1-4 Recherche des facteurs de transcription impliqués dans l'expression de
nos gènes:
Pour accomplir cette étape, on a utilisé la même commande qu'on a utilisée pour la recherche
des variants de SOD2 et de GPx 1 : Findpatterns. Mais dans cette étape on a fait la recherche a
partir d'une banque de donnée spéciale pour les facteurs de transcription (TFD : Transcription
Factor Database).
Cette étape consiste à vérifier l' existence, sur nos quatre gènes, d ' une centaine de facteurs de
transcriptions qu'on a jugé parmi les plus intéressants selon plusieurs études faites avec des
facteurs de transcription. Ces facteurs de transcription sont situés dans la TFD, donc on a cherché
49
leurs existences sur nos gènes en se servant de leurs séquences consensus comme l' indique
l ' ensemble de commande suivant:
%Findpatterns - data= genrunda t a : tfd.dat
Findpa t t e rns in what sequence? "Nom du gène".rsf
Enter pattern
Pattern1 séquence consens u s F . TI
Pattern2 s é quence consensus F .T2
Pattern 100
To t a l fi nds : n ombr e de f acteur de t rans c rip ti on t r ouvés.
3-2. Résultats e Discussion: 3-2-1 Variants 1 de SOD2 et de GPx1 .
Notre recherche des Variants de SOD2 et de OPx 1 qui sont surexprimés dans notre étude sur
le cancer du sein ont montré que ce sont les variants 1 de SOD2 et de OPx 1 qui ont été surexprimé
dans cette étude. Ceci est expliqué par le fait que les amorces qui ont été utilisé pour l'amplification
de ces deux gènes ont été trouvées seulement dans les séquences des Variants 1 de SOD2 et de
OPx 1. Donc on peut déduire que ce sont ces variants 1 de ces deux gènes qui sont impliqué dans
notre étude sur la relation entre les gènes antioxydants et le cancer du sein.
50
3-2-2 Régions similairès et pourcentage de ressemblance entre les composants
de nos quatre gènes:
Cette partie montre l' ensemble des résultats qu 'on a eu pour cette partie de . notre étude.
L'utilisation des programmes Bestfit et Gap nous a permis d ' avoir des pourcentages de
ressemblance entre nos gènes.
Dans les tableaux de Bestfit et de Gap, les résultats sont exprimés en pourcentage de
ressemblance. Comme on a déjà mentionné, Bestfit est un programme d ' alignement local qui
utilise l'algorithme Smith et Waterman. C' est un programme qui cherche à repérer les segments
qui ont les plus fortes ressemblance. Donc il ne compare pas la séquence globale mais il compare
chaque nucléotide d'une séquence avec le nucléotide qui lui correspond dans l ' autre séquence.
Quand à Gap, c' est un programme d'alignement global 'qui utilise l' algorithme de Needleman et
Wunsch. Ce dernier est un programme qui tente d'aligner les deux séquences sur la totalité de leurs
longueurs.
Dans les tableaux qui montrent le niveau de ressemblance (les tableaux Bestfit et Gap), les
chiffres mentionnés représentent le pourcentage de ressemblance entre les différentes régions qui
composent les gènes: (5 ' -UTR, 3'-UTR, exons et introns).
D~ns les tableaux qui montrent les régions similaires entre les différents gènes, les chiffres
représentent les numéros des nucléotides ou des acides aminés qui composent soit les séquences
nucléiques ou les séquences peptidiques de nos quatre enzymes antioxydants, respectivement. Les
chiffres sont par rapport à la séquence du gène ou du peptide (Annexe let 2) et on précise que dans
les séquences nucléiques de nos gènes le chiffre 1 représente le premier nucléotide de la région 5' -
UTR de l'ARNm du gène. Pour les séquences 5' -UTR des gènes, on les a attribué des chiffres avec
51
des signes (-) alors que des signes (+) ont accompagné les numéros des nucléotides des régions 3' -
UTR de nos quatre gènes (Annexel).
Pour les séquences peptidiques (Annexe 2), le chiffre 1 représente le premier acide aminé de
la séquence.
3 -2-2-1. Résultats de la comparaison des différentes composantes' des gènes SOD1/S0D2:
Les résultats de la comparaIson des deux gènes SOD 1 et SOD2 sont résumés dans les
tableaux suivants. Les tableaux de 9 - 12 résument les résultats de comparaisons des régions
composantes des gènes SOD 1 et SOD2 selon le programme Bestfit alors que les tableaux de 13-16
résument les résultats de comparaison selon le programme Gap. Selon le Tableau-9, on remarque
que les pourcentages de ressemblance sont élevés, surtout pour l ' ex on 1, mais les régions
similaires sont assez courtes (entre 10 et 21 pb). Dans le Tableau-lO, on al ' ensemble des
pourcentages de ressemblance ainsi que les régions similaires pour les quatre introns de SOD 1 et
SOD2. Dans ce tableau on remarque que les pourcentages de ressemblance sont presque pareils
pour les quatre introns. Mais au niveau des longueurs des régions similaires entre ces introns on
remarque que les régions de ressemblance pour les introns 1 et 2 sont assez longues (139 pb et 622
pb respectivement). Tout en sachant que les introns peuvent avoir un rôle dans la régulation de
l ' expression des gènes en ayant des régions régulatrices qui peuvent se lier a des facteurs de
transcription, ceci suggère que ces régions , ~imilaires déterminées par le programme Bestfit peuvent
avoir une importance dans la régulation de nos deux gènes, SOD 1 et SOD2.
Dans le tableau-lIon a identifié les régions de ressemblances entre les régions 5 ' -UTR et
3' -UTR des deux gènes, SOD 1 et SOD2 et de leurs ARNm. Dans ce tableau, on remarque que les
pourcentages de ressemblance entre les régions 5' -UTR et 3' -UTR des gènes SODI et SOD2 sont
52
plus élevées que les pourcentages de ressemblance entre les régions 5' -UTR et 3' -UTR des ARNm
de ces gènes (81.47% et 83.330/0 pour les régions 5' -UTR et 3' -UTR des gènes respectivement et
75% et 76.360/0 pour les régions 5' -UTR et 3' -UTR des ARNms respectivement).
53
Tableau-9. Identification des régions d' identité entre les séquences codantes (exons) des gènes SOD 1 et SOD2 (Variant 1) ainsi que le pourcentage de ressemblance entre ces régions (Bestfit).
Pourcentage de ressemblance entre Régions d ' identité au niveau des régions codantes
Liste des exons les régions similaires (exons) pour SOD 1 et SOD2 dans les exons des
gènes SOD 1 et SOD2 (%) SOD1 SOD2
Exon-I 90.90 de ]60 àI71 (11 pb) . de167à177(10pb)
Exon-2 75 de4251 à4266 (14 pb) de 568à583(15pb)
Exon-3 80 de 6836 à 6860 (24 pb) de 5124 à 5148 (24 'pb)
Exon-4 77.77 de 7653 à 7682 (29 pb) de 8342 à 8371 (29 pb)
Exon-5 65.21 de 8859 à 8881 (22 pb) de 10805 à 10826 (21 pb)
54
Tableau-lO. Identification des régions d' identité entre les séquences non codantes (introns) des gènes SOD! et SOD2 (Variant!) ainsi que le pourcentage de ressemblance entre ces régions (Bestfit)
Pourcentage de ressemblance entre Régions d'identité au niveau des régions non codantes
les régions (introns) pour SODI et SOD2 Liste des introns similaires dans les
introns des gènes SODI et SOD2 (%)
SODI SOD2
Intron-1 65.90 de 408 à 545 (138 pb) de 260 à 399 (139 pb)
Intron-2 70.68 de 4355 à 4747 (392 pb) de 3023 à 3645 (622 pb) de 4948 à 5294 (346 pb)
l11tron-3 72.72 de 6988 à 7020 (32 pb) de 6057 à 6089 (32 pb)
Intron-4 71.87 de 8394 à 8425 (31 pb) de 10497 à 10528 (31 pb)
55
En revanche, l' étude de la longueur des régions semblables entre ces régions montre que la
région similaire la plus longue correspond à la région 5' -UTR des deux gènes (285 pb). Ceci
confirme nos résultats trouvés avec les introns, puisque la région 5' -UTR des gènes est la région la
plus importante dans la régulation de l' expression des gènes. Ces résultats suggèrent qu ' il ya une
forte relation entre les régions régulatrices des gènes SOD 1 et SOD2 ce qui en résulte des
correspondances dans les niveaux d ~ expressions de ces deux gènes.
Les résultats de comparaison des séquences peptidiques de SOD 1 et SOD2 (Tableau-12) ont
montré un pourcentage de ressemblance de 50% entre ces deux gènes. Ceci est un résultat qui n 'est
pas prévu vu que les deux enzymes de SODI et SOD2 accomplissent presque la même fonction.
Pour ceci on a fait une comparaison de chacun de ces deux gènes avec des banques de données par
le moyen du programme BLAST Les résultats de BLAST ont donné une e-value (valeur
d' expectation) > e-40 ce qui veut dire que ces deux protéines sont pas mal proche.
Les résultats donnés par Gap pour la comparaison des deux gènes SODI et SOD2
(TableauxI3-16) ont confirmé les résultats donnés pas Bestfit. On remarque que les pourcentages
de ressemblances baissent avec le programme Gap par rapport aux pourcentages données par
Bestfit, ceci est dû au fait que les deux programmes sont différents un qui est local (Bestfit) et
l' autre est global (Gap). Ce dernier donne des pourcentages dépendamment de la longueur des
régions semblables. Puisque la plupart des régions trouvées sont des petites régions ceci explique
les bas pourcentages donnés par Gap. Dans ces tableaux (de 13 à 16) on remarque qu ' avec le
progr~mme Gap on a pu confirmer les résultats qu'on a trouvé avec Bestfit concernant les intronsl
et 2 et la région 5 'UTR des deux gènes SOD 1 et SOD2. En effet, les pourcentages de
ressemblance donnés par Gap à ces régions sont comme suit 46~97%, 49.62% et 46.180/0 pour
lntronl , Intron2 et la région 5' -UTR du gène respectivement. Ces pourcentages représentent les
56
pourcentages les plus élevés parmi touts les pourcentages données par Gap (le pourcentage de 650/0
pour l' ex on 1 n ' est pas significatif vu que la longueur de la région similaire pour cet exon est très
petite (10 pb) par rapport aux autre régions).
Ainsi, les résultats donnés par nos deux programmes de comparaison, Bestfit et Gap, pour les
deux gènes SODI et SOD2 ont bien montré qu ' il ya une très bonne ressemblance entre les régions
régulatrices de nos deux gènes. Ces ressemblances sont montrées soit par le pourcentage de
ressemblance et par la longueur des régions similaires. Ceci nous confirme qu' il ya une relation
entre les niveaux d ' expression de ces deux gènes.
57
Tableau-Il. Identification des régions similaires entre les séquences 5' -UTR et 3' -UTR des gènes SODI et SOD2 (Variant!) et de leurs ARNms ainsi que le pourcentage de ressemblance
entre ces régions (Bestfit)
Pourcentage de Régions d ' identité au niveau des régions 5' -UTR et ressemblance entre les 3'-UTR des gènes SODI et SOD2 et de leurs ARNm régions similaires dans les régions 5' -UTR et
3 ' -UTR des gènes SODI SOD2 SODI et SOD2 et de
leurs ARNm(%) 5' -UTR de 80 à 95 (15 pb) de 96 à 1] ]
ARNm 75.00 3'-UTR de 9144 à 9207 (64 pb) de 1] 342 à 11408 (66 pb)
76.36 5'-UTR de -924 à -1214 (290 pb) de -555 à -840 (285 pb)
Gène 81.47 3 ' -UTR de + 1788 à + 1811 de +8] 1 à +834 (23 pb)
83.33 (23 pb)
58
Tableau-I2. Identification d~s régions d ' identité entre les séquences peptidiques de SODI et SOD2 (Isoforme A) ainsi que le pourcentage d ' identité entre ces
séquences (Bestfit)
Pourcentage de Régions d'identité au niveau des séquences peptidiques de ressemblance entre SODI et SOD2 (acides aminés)
les séquences peptidiques de SOD'I
SODI SOD2 et SOD2 (%)
de Ala5 à Cys7 de A]a5 à Cys7 de G ]n23 à Lys24 de Gln23 à Lys24
50.00 Ser26 Ser26 de Ala2 à Lys4 (codon) de Leu2 à Arg4 (codon) de Val8 à Glu22 (codon) de G ly8 à Arg23 (codon)
Glu25 (codon) His26 (codon)
59
Tableau-13. Comparaisons des exons de SODI et SOD2 (variantl) par la méthode Gap.
Pourcentage de ressemblance
entre les séquences des
exons de SOD 1 et SOD2 (0/0)
'----
Exon-1
65.21
Exon-2
43.29
Gène SODI/SOD2
Exon-3 Exon-4 Exon-5
39.13 33.89 37.03
60
Tableau-14. Comparaisons des introns de SODI et SOD2(Variantl) par la méthode Gap
Pourcentage de ressemblance
entre les 1 séquences des introns de SOD 1
et SOD2 (0/0)
Intron-l
46.97
Gène SOD/SOD2
Intron-2 Intron-3 Intron-4
49.62 39.64 4].00
61
Tableau-1S. Comparaison des régions 5' -UTR et 3'-UTR des gènes SODI et SOD2 (variantI) et de leurs ARNms selon le programme Gap. ·
ARNm (SOD1/S0D2) Gène (SOD1/S0D2)
5' -UTR 3'-UTR 5' -UTR 3' -UTR
Pourcentage de ressemblance
entre les régions 40.41 44.07 46.18 35.26 5' -UTR et 3'UTR des gènes SOD 1
et SOD2 et de leurs ARN ln (0/0)
62
Tableau-16. Comparaisons des séquences peptidiques de SOOI et S002 (Isoforme A) par la méthode Gap. L' isoforme A est la protéine résultante du Variantl de S002.
Séquences peptidique de SODl/S0D2
Pourcentage de 50.00 ressernblance(~o)
63
3-2-2-2. Résultats des comparaisons des différentes composantes des gènes GPxl et CAT:
Les tableaux17-24 résument les résultats des comparaisons des régions qui composent les
gènes GPx 1 et CA T. Pour la comparaison de ces deux gènes on a procédé de la même façon que
pour SOD1 et SOD2 en utilisant les mêmes programmes: Bestfit (Tableaux 17-20) et Gap
(Tableaux 21-24).
Dans les tableaux 17-20, qui résument les comparaisons faites par le programme Bestfit, on
remarque que les pourcentages de ressemblance sont élevés pour toutes les régions: Exons
(Tableau-17), lntrons (Tableau-18), les régions 5'-UTRet 3'-UTR des gènes et des 'ARNm
(Tableau-19) et pour les séquences peptidiques des deux enzymes (Tableau-20). Par contre, on
remarque que la longueur des régions similaires est très petite (entre Il et 39 pb pour toutes ces
régions). Ceci montre que les résultats des pourcentages ne sont pas significatifs ce qui signifie qu'il
n'ya pas de ressenlblance significative entre les deux gènes GPx 1 et CAT selon le programme
Bestfit.
Au niveau des régions régulatrices (5 'UTR et lntrons) les longueurs des régions similaires
sont très basses.c entre 7 et 35 pb) ce qui suggère qu'il ya pas de relation importante entre les régions
régulatrices de ces deux gènes et donc il ya pas de relation entre les niveaux d'expression de GPx 1 et
CAT.
Les résultats donnés par le programme Gap pour les gènes GPx 1 et CA T (Tableaux 21-24)
ont bien confirmé, encore une fois, les résultats donnés par le programme Bestfit. En effet, les
pourcentages de ' ressemblance donnés par ce programme sont très basse ceci est expliqué par les
petites régions similaires entre les régions composantes de nos deux gènes (exons, introns, 5' -UTR et
3'-UTR des gènes et des ARNms).
64
Tableau-17. Identification des régions d ' identité entre les séquences codantes (exons) des gènes GPx 1 (Variantl) et CAT ainsi que le pourcentage d ' identité entre ces régions (Bestfit)
Pourcentage de ressemblance entre les Régions de ressemblance au niveau des régions
Liste des exons régions similaires dans codantes (exons) pour GPx 1 et CA T les exons des gènes GPx1 et CAT (0/0)
GPx] GPx]
Exon-l 83.33 de 260 à 271 (] ] pb) de 1 ] 3" à ] 24 (] ] pb)
Exon-2 65.00 de 672 à 711 (39 pb) de 10299 à 10338(39 pb)
65
Tableau-18. Identification des régions d' identité entre les séquences non codantes (introns) des gènes GPx 1 (Variant 1) et CA T ainsi que le pourcentage d' identité entre ces régions
(Bestfit).
Pourcentage de Régions d ' identité au niveau des régions non codantes Liste des ressemblance entre les (introns) pour GPxl et CAT introns régions similaires dans les
introns des gènes GPxl et CAT (0/0) GPx1 CAT
1ntron-1 76.00 de 545 à 569 (24 pb) de 9449 à 9473 (24 pb)
66
Tableau-19. Identification des régions d' identité entre les séquences 5' -UTR et 3' -UTR des gènes GPxl(Variantl) et CAT et de leurs ARNms ainsi que le pourcentage d' identité entre
ces régions (Bestfit).
Pourcentage de Régions d ' identité au niveau des régions 5' -UTR et resselnblance entre 3 ' -UTR des gènes GPx1 et CAT de leurs ARNm
les régions simi laires dans les régions 5' -UTR et 3 ' -UTR des gènes GPx1 et CAT GPx1 CAT
de leurs ARNln(%) 5' -UTR de16à23(7pb) de 17 à 24 (7 pb)
ARNm 100 3 ' -UTR de 171 à 182 (11 pb) de 260 il 271 (]] pb)
91.66 5' -UTR de -56 à -91 (35 pb) de -]562 à -1597 (35 pb)
Gène 7] .43
3 ' -UTR de +251 à +272 de +761 à +782 (21 pb) 81.8 ] (21 pb)
67
Tableau-20. Identification des régions d' identité entre les séquences peptidiques de GPx l (Isoforme A) et CAT ainsi que le pourcentage d' identité entre ces séquences (Bestfit)
Pourcentage de Régions d ' identité au niveau des séquences peptidiques entre les ressemblance entre gènes de GPx 1 et CA T (acides aminés)
76.92 Ser150 Ser163 Leu 137 (codon) IIe152 (codon)
de Ala139 à A1a 144 (codon) de Phe154 à Ile 159 (codon) Ala147 (codon) Phe161 (codon)
68
Tableau 21. Comparaisons des exons de GPx 1 (Variant 1 ) et CAT par la méthode Gap.
Gène GPxl/CAT
Exon-l Exon-2
Pourcentage de ressemblance entre les 45.55 39.53
exons des gènes GPx 1 et CAT (0/0)
69
Tableau-22. Comparaisons des introns de GPxI (Variantl) et CAT par la méthode Gap.
Gène GPxI/CAT 1ntron-l
Pourcentage de ressemblance entre les 39.14
introns des gènes GPx 1 et CAT (0/0)
70
Tableau-23. Comparaison des régions 5' -UTR et 3' -UTR des gènes GPx1 (Variant1) et CAT et de leurs ARNm selon le programme Gap.
ARNm (GPxl/CAT) Gène (GPx l/CAT) .
5' -UTR 3'-UTR 5' -UTR 3' -UTR
Pourcentage de ressemblance
entre les régions 5'-UTR et 3'- 35.44 35.44 37.70 40.48
UTR des gènes GPxlet CAT et de leurs ARNm (%)
71
Pour les régions régulatrices soit les introns et la région 5' -UTR des gènes (Tableau-22 et
Tableau-23 respectivement) les pourcentages de ressemblance (selon Gap) sont très basse (ils ne
dépassent pas les 40 0/0), ceci confirme que ces deux gènes n'ont pas de mécanismes de régulation
d' expression génique commun c'est-à-dire chacun des deux gènes a un mécanisme de régulation
d' expression génique indépendant de l' autre.
Les résultats de comparaison des séquences peptidique de GPx 1 et CA T selon le programme
Gap (Tableau-24) montrent un très bas pourcentage de ressemblance (28.57%) ce qui montre encore
une fois la grande différence entre les protéines résultantes de ces deux gènes malgré qu' ils
accomplissent des fonctions assez similaires. Pour confirmer nos résultats on a comparé ces deux
gènes (GPxI et CAT) avec des banques de données nucléotidiques en utilisant le BLAST. Le résultat
de ce dernier a bien montré que ces deux gènes sont très différents (e-value < e-40).
Ces résultats nous montrent qu ' il n ' ya pas de ressemblance significative entre les deux gènes
GPx 1 et CA T ni au niveau des régions régulatrices ni au niveau des régions codantes.
72
Tableau-24. Comparaisons des séquences peptidiques de GPxl et CAT par la méthode Gap
Séquences peptidiques GPxl/CAT
Pourcentage de ressemblance 28.57
(0/0)
73
Après qu 'on a comparé les quatre gènes deux par deux (SODI et SOD2 d'une part et GPXI
et CA T d'une autre part) on a essayé de faire une comparaison multiple des quatre gènes pour voir la
relation entre les quatre gènes en utilisant un programme de comparaison multiple Clusta W. Ce
programme permet de comparer les quatre gènes ensemble. Les résultats de cette comparaison qu ' il
ya pas beaucoup de régions commune entre les quatre gènes, ce qui montre qu' il ya pas de relation
importante entre les quatre gènes au niveau de leurs structures nucléotidiques. Pour finir cette partie
de notre projet, on a établit l'arbre phylogénique de nos quatre gènes en se servant de l' alignement
multiple par ClustaW et d'un logiciel de phylogénie appelé MEGA4 (www.mega4software.net).
L'arbre phylogénique de nos quatre gènes est représenté à la Figure-13. Cette Arbre
phylogénique confirme touts les résultats trouvés dans notre étude en montrant, d'une part, la grande
ressemblance entre les deux genes SODI et SOD2 et les différences significatives entre les deux
gènes GPXI et CAT, d'une autre part.
3-2-3. Facteurs de transcription et régulation de l'expression génique:
Dans cette dernière partie de notre projet on a cherché un grand nombre de facteurs de
transcription (100 facteurs) qui sont regroupés dans une banque de donnés des facteurs de
transcriptions (TFD). On a donc utilisé les séquences consensus des facteurs de transcription
trouvés dans cette banque de donnés et on a vérifié l' existence de ces séquences consensus sur nos
quatre gènes.
Les résultats de cette étape ont montré que les facteurs de transcription sont plus abondants sur
SOD2 et CAT que les deux autres gènes SODI et GPxI.
74
Une liste de facteu!s de transcriptions (Tâbleau-25) a été déterminée durant cette partie de
notre étude. Quelques un de ces facteurs identifiés (AP2, SPI , NF-KB) ont été déjà trouvés sur nos
gènes dans d' autres études (128).
Mais on vient ajouter une nouvelle liste de facteurs de transcription assez importants dans la
régulation de nos quatre gènes comme: PEA3, CTF/CBP, EFII, B-factor, TF2D/TBP. On a aussi
trouvé que la plupart des facteurs de transcription (surtout PEA3 et CTF /CBP) trouvés sur les deux
gènes SODI et SOD2 sont localisés dans la région 5' -UTR commune entre les deux gènes (Tableau:
Il). En effet, on a calculé le nombre de facteurs de transcription qu'on trouve sur la région 5' -UTR
commune entre ces deux gènes et on a trouvé que parmi les six séquences consensus de PEA3 trouvé
sur SOD 1 il ya quatre qui se trouve dans la région 5 'UTR commune entre ce gène et celle de SOD2,
et parmi les onze séquences consensus de PEA3 trouvé sur SOD2 il y'en a 7 qui sont sur la région
5 'UTR commune entre SOD2 et SOD 1. Ceci nous donne un pourcentage de 65% des sites de liaison
de PEA3 trouvés sur les deux gènes SODI et SOD2 sont localisé sur la région 5' -UTR commune
entre ces deux gènes. Pour CTF/CBP, 63.33% des sites de liaison de ce facteur de transcription sont
localisés dans la région 5' -UTR en question.
75
Figure-Il. Arbre phylogénique des quatre gènes SODI , SOD2, GPxI et CAT
\ H.Sapiens SOD2
H.Sapiens SODI
H.Sapiens GPxI
H.Sapiens CAT
0.2
Cette figure montre la relation phylogénique entre nos quatre gènes. On peut remarquer facilement l' approchelnent qui se troue entre les gènes SODI et SOD2. Ce rapprochement suggère qu ' il ya un ancêtre commun entre ces deux gènes. Au niveau des gènes GPx 1 et CA T, on remarque qu ' il ya une certaine distance entre ces deux gènes et l'arbre ne Inontre pas de relation ancestrale entre ces deux gènes ce qui montre encore une fois la grande différence qui se trouve entre GPxl et CAT.
76
Les résultats trouvés dans cette partie de notre projet montrent aussi qu'il ya une certaine
relation évidente entre les mécanismes de régulations des deux gènes SOD 1 et SOD2, ce qui
suggère que les facteurs de transcription cités plus haut jouent un rôle important dans la régulation
de l' expression de ces deux gènes en stimulant l' un et en inhibant l ' autre ce qui explique les
résultats qu'on a déjà trouvé dans des études antérieurs faites par notre équipe de recherche.
Au niveau des gènes GPxl et CAT, on n' a pas trouvé de correspondance importante dans la
localisation des facteurs de transcription sur ces deux gènes. Le tableau-25 montre le faible nombre
de facteurs de transcription trouvés sur le gène GPxI alors qu'un grand nombre de facteurs de
transcription est trouvé sur le gène de la Catalase. Les facteurs de ~ranscription trouvés sur ces
deux gènes sont localisés sur des régions différentes et non sur les régions communes entre ces
deux gènes. Ainsi, l ' étude des facteurs de transcription a aussi montré une autre différence au
niveau de ces deux gènes et vient confirmer l'indépendance qui se trouve au niveau de la
régulation de l' expression des deux gènes GPxl et CAT.
En vérifiant les fonctions des deux facteurs de transcription trouvés dans notre étude: PEA3
et CTF /CBP, on trouve que PEA3 est un oncogène qui Appartient à la famille des Ets et ça a été
déjà montré qu' il intervient dans la régulation de l' expression du gène BRCA2 (129) ce qui pourra
nous confirmer l ' importance de ce facteur de transcription dans la régulation de nos deux gènes
SODI et SOD2. Pour CTF/CBP, c'est un facteur de transcription qui a plusieurs fonctions au
niveau du cerveau et surtout on le trouve en abondance au niveau des neurones en jouant un rôle
dans l' amélioration de la mémoire à long terme (130). Ceci nous explique les résultats qu'on a déjà
trouvés dans notre laboratoire (8) et qui montre une dépendance entre les niveaux d' expression de
SODI et SOD2 aux niveaux des neurones
77
Tableau-25. Liste des facteurs de transcription trouvés en abondance sur nos quatre, gènes ainsi que le nombre de fois qu'on a trouvé ces facteurs de transcription sur chacun des gènes indiqués.
Facteur de SOD] SOD2 GPx 1 CAT transcription
AP-2 7 13 0 9
SPl 3 9 1 4
NFKB 2 5 0 7
PEA3 6 Il 2 14
CTF/CBP 3 8 1 Il
EFII 2 1 0 5
B-factor 1 5 2 5
TF2D/TBP 7 10 0 20
78
CHAPITRE~4
CONCLUSION
79
Au niveau d 'une cellule, le désordre dans la régulation de la prolifération et dans l ' apoptose
sont des facteurs majeurs et responsables de l ' initiation et la naissance des tumeurs. En effet, les
ROS (radicaux libres) ont été reconnues capables de dégrader et d' inactiver des molécules
importantes et des structures biologiques critiques dans la prolifération des cellules ce qui explique
leurs implications, directes ou indirectes, dans plusieurs maladies humaines y inclus le cancer.
Pour ceci l ' organisme humain a développé un système de défense contre ces agents agressifs :
les enzymes antioxydantes. Par conséquent, le rôle des enzymes antioxydants est crucial dans la
régulation du métabolisme. Notre étude est faite sur l~s enzymes antioxydantes les plus importantes,
des enzymes qui agissent directement sur des radicaux libres spécifiques et les dégradent en des
produits moins agressifs. Ces enzymes sont: SODI, SOD2, GPxl et CAT. Des études antérieurs
dans notre laboratoire ont été effectuées sur ces quatre gènes et ont montré que, en absence
d'œstradiol-~17 , l ' expression de SOD2 diminue dans les cellules du cancer du sein (ER positive) par
rapport aux cellules cancéreuses (ER négative), alors que celle de SOD 1 augmente. En présence de
l ' œstradiol-~17 , le niveau d'expression de SOD2 augmente beaucoup dans les cellules cancéreuses,
ER positive, par rapport aux cellules ER négative et celle de SOD 1 diminue. Donc les différences
dans les niveaux d'expression dans chacun des pairs des gènes correspondants (SODl/S0D2 et
GPxl/CAT) suggèrent qu'il existe probablement un mécanisme de dialogue entre les gènes membres
de chaque pair aussi bien qu'entre les quatre gènes antioxydants.
L 'objectif principal de notre étude était de comprendre les mécanismes de régulations de
l ' expression des quatre gènes antioxydants : SOD l , SOD2, GPx 1 et CA T ainsi que de déterminer par
quel moyen ils communiquent entre eux. Pour ce faire on a utilisé un ensemble de programme bio-
80
informatique parmi ces programmes on a des programmes de comparaIsons et d' alignement des
séquences nucléotidiques et peptidiques (BLAST, Bestfit, Gap .. ) ainsi que d 'autre programme de
recherche de séquence dans des banques de données (Findpatterns dans Genbank, TFD ... ).
La première étape de notre projet était d'identifier le quel des trois variants de SOD2 et le quel
des deux variants de GPx 1 qui ont été sur-exprimés dans -notre étude antérieurs cité plus haut. Nos
analyses nous ont permis de montrer l ' implication des Variants 1 de SOD2 et GPx 1 dans notre étude
sur le cancer du sein.
Notre deuxième objectif pour cette étude était de chercher des régions de similarité entre tous
les composants de nos quatre gènes. Les résultats de cette partie ont révélé qu' il y a une très bonne
ressemblance entre le duo SOD 1 /SOD2 surtout au niveau des introns 1 et2 et de la région 5 'UTR de
ces deux gènes. Pour le Duo GPx l/CAT, notre étude a montré qu' il ya pas de régions similaires
significatives entre ces deux gènes.
Les résultats de notre dernière partie, qui était sur la recherche des sites de transcription
impliqués dans l ' expression de nos gènes, ont montré l'importance de quelques facteurs de
transcription dans la régulation de l'expression génique de nos gènes notamment AP2, SP 1, NFKB,
PEA3 et CTF/CBP.
En guise de copclusion, on peut déduire que les gènes SODI et SOD2 ont un mécanisme de
régulation de l ' expression dépendant par le moyen d'un certain nombre de facteurs de transcription qui
servent à stimuler un gène et à inhiber l'autre ce qui explique les différences dans le niveau
d' expression de ces gènes. Dans la liste de facteurs de transcription cités plus haut, on indique que
c ' est la première fois qu ' on démontre l'importance des deux facteurs PEA3 et CTF /CBP dans la
régulation de l ' expression des gènes antioxydants. Pour les genes G Px 1 et CA T, nos résultats n ' ont pas
montré de ressemblances significatives au niveau des composants de ces deux gènes ni au niveau des
81
régions régulatrices ni au niveau des régions codantes, ce qui nous montre que se sont deux gènes très
indépendant l'un de l'autre.
Comme on a indiqué en plusieurs reprises, durant notre étude on a utilisé des outils purement
bio-informatiques, donc des études plus approfondis au laboratoire seront très intéressantes pour
mieux comprendre cette relation qu'on a déterminé entre les gènes antioxydants et le cancer du sein.
82
- ------- - -------- - --- - --- ----- - -------
ANNEXE 1: Les séquences nucléiques des gènes SOD1. SOD2. GPxl et CAT:
Séquence nucléotidique du brin codant de SODI :
5'-UTR DU GENE
-1981 CAGGACAGCC-TCCACAGCAA-AGAACTGTCT -GGCCCAAAAT -GTCCA T AGTG -1931 CCCACATTCG-ATGCCCTGCA-TTAGGAAGAT-ATAAATACTC-TTAAATATCA -1881 CAGAGTT AAA-TTCCTTACCC-CTGTTCT AGC-AGAGA TGA TA-TTCTTGCGGG -1831 GGGAGCA TCT -TCTTGGCTTC-AACACA TTCT -TTTCTCCA TG-GGAGA TGA TG -1781 CCAGAAGAGG-GACAGAACAG-GGCCCAGT AA-AGCA TGGGGC-CTGGGGCCAG -1731 GGACCCCCTT -GTTCAGGTGT -GACGACCA TC-CTACGAAGGC-ACCACCCAGG -1681 CA TCA TT AGA-CCGTCTCAAA-AGAAGAGT AA-TTCACTGTCC-CAAAGCAGCT ' -163] CTCTCGTGTC-TGTGGGCGGA-TCCCTTGGCA-AGTTTACAA T -GAACTGAAA T -1581 CTGCCGAACT -TCCTGGAACC-CAAAGAAACT-TT AGCCTTGG-GCAAAGGCCC -1531 TTTGGCCAGC-ATTTGCACTG-TTTATGCAAC-CGTTTAGAAT-ATACGAATTA -1481 TCTGGAGACT -ACT ACCAAA T -ACAACAGGCA-AAACTGCAAA-T ATGT AT ACT -1431 TCCT AGAGGA-TGA T AAAAAA-A TGTGAA TTG-TA TTTCTCTG-AT AGAGGA TG -138] CATTAGAGTC-TGAGGGTCTA-AATAGCGTAA-ATAATAAATA-AGTAAATAAA -1331 TCGA T AGT AG-TGT ACTCCAA-ACGAGGCTGG-AA T AGCTTCT -A TTGTTGTTT -1281 CACACTGGAC-TTCAATTAAG-TCTCAGTATT-TTGCCATACT-CAATATTAAG -123] T ACTAGGCTG-GACGTGGTGG-CTCA TGTCTG-T AA TCCCAGC-ACTTTGGGA T -118] TGGGAGGTGG-GT AGA TGGCT -GGCTTGAGCT -CAGGAGTTTG-AAACCAGCCT -1131 GGGCAACA TG-GT AAAACCCC-A TCTGT ACCC-AAAA TACAAA-AA TCAGCCAG -1081 GAAGGGTGGC-ACA TGCCTGT -GGTCCCAGGT -ACTTGGGA TT -GGGAGGCAGG -] 031 AAGATGGCTT-GAACCCAGGA-GGTGGAGGCT-GCAGTGAGCT-ATGATGGCGA -981 TTGGGCACTC-CAGCCTGGGT -GACA GAGGAA -GA CCCTGTCT -CAAAAAGGAA -931 GCAAACAACC-CCCTCGCCCC-GGACAAAAGT-AGTTTGCACT-ATTTTCTCAT -881 TTCACAATAT-GTTTTTGAAA-ATTTCCCTT-GAAAGGTAAG-TCATATTTAT -831 CATTCCTGTT-GTATGGAGGC-ATCATAAATT-ATTTCACCAT-TCTACCCTCC -781 TTGAGTGTTG-TGGCCTTT AG-GCCAGACAAA-AACGCAGGTG-ATGCCT AGAA -731 GCCAACT AGT -TGCCGTTTGG-TT A TCTGT AG-GGTTGTGGCC-TTGCCAAACA -681 GGAAAAATAT-AAAAAGAATA-CCGAATTCTG-CCAACCAAAT-AAGAAACTCT -631 AT ACT AAGGA-CT AAGAAAA T -TGCAGGGGAA-GAAAAGGTAA-GTCCCGGGA T -581 TGAGGTGT AG-CGACTTTCT A-T ACCCTCAGA-AAACT AAAAA-ACAAGACAAA -531 AAAA TGAAAA-CT ACAAAAGC-A TCCA TCTTG-GGGCGTCCCA-A TTGCTGAGT -481 AACAAA TGAG-ACGCTGTGGC-CAAACTCAGT -CA T AACT AA T -GACA TTTCT A -431 GACAAAGTGA-CTTCAGA TTT -TCAAAGCGT A-CCCTGTTT AC-A TCA TTTTGC
662 GTAGGTTCC-AGGCTGAGCG-GCGGGAGGCA-GTCCCCGGCA 701 GA GGCGA CCC-CA GGGA GCCA -GGCCCCA TA C-GGA CGGGCCT-CTCCGTGGA G 751GAGAACTCGC-TTCGTATTTG-TACCGGTTCC-GAGTTTTCCA-GGCACGATAG 801 TCTCTCTTTT-AAACACATGG-TCTACCTCAT-TGTAGAAGGA-GTGCCTCGAT 851 GGGTTTGAA C-A CA CTTCTG T-CA TCTCA GGG-AA CTTGGGGT-CCTGCGAA GG 901 A GCTTGCCTT-A CTGTTGTGA -GCCA CA TTCC-GTT A CA CATA"-TTGCCA GCA C 951 TGGTGAA TTG- TA GGGCCTGA -AAA GAAA GCT-CTA CTG TG TC-A CTCGTTTTT
1001 TTTGCAAA TT-GA A A TTGTTC- TTGTTGTA TA -A TGTGCTTTG-GGGAAA TG TT 1051 TGGTCTCTCA -GG TA GGTGTG-CCA GCCGTTT-GCA GGA GGGC-TGA GA GCGCC 1101 TG TC CA CTGG-TGGCCA GA CA -TCA TCGGGTC-CGCA GGTGTC-TCTGA GTG TC 1151 AGGGTCACCT-CCTGATAGAA-GTGGGAGTGG-TGTCTTACTG-CCAGGTCACA 1201 CTGAAGGTGG-GAGACAGGAG-GACACTACTC-CGTGCTAGGA-ACCATGGTCC 1251 TTGTCATCTT-CCTGAGAGCA-AACGGGGTCG-GGACTCCAGC-CTAGGACTTG 1301 GA GA CTCCCT-GCA TCCCCA G-CT A CCCTGCA -GGTGAAA CTT-CA CTGA GCCC 1351 A CTTGA CTTC-A GGTGGGA GA -GGA GGA GGCA -CA CCGTTGTG-G TG TGCG TT A 1401 CCAAAAAAGC-AGTAACCTAA-CTGTGGAACA-GTTCAGGATC-TTTAGACTTG
91
1451 ATACTTTTCT-TGATTTCCCT-TAGGGGTCAA-AGTTCACAAG-GAAAATAGCC 1501 CTTTAGTGGG-AAACTGAAAC-AGGCTTGTTT-TTATTTACTA-TTTACTCATA 1551 TTTGTAATGC-AATTAAAATA-TATGTTGTTA-ACTTTTTTTT-TTTTTCTCAA 1601 GA GCTCGGTT-GA TAAAA CCA -GGGCjTA TGTG-GA CTTTTTGA -GTCTGTGCCT 1651 TTTGGGGGTG-TGTATGGGAA-TGTTATGTTT-TAACGTTTTT-TACAAAATAG 1701 TATTGTCTTT-TTAATTTATT-CGTTAGTGGT-TTGCACAAGG-AAGATAATCG 1751 A TAGTCATGT-TTTTTAGA CT-CTCTGTATTG-CTTGGTAAGC-TA CG TA GTAA 1801 · AAAATGTTTA-CTTTTCCTTA-AA TGTTTTGA-ATTTCGGGGT-TATGAAA TTT 185] GTTGAGTAAT-TTTTAGACAG-TCACATCTTG-TTGACTGGAG-GCATCTAGTG 190] GAAAAA TG CA -GTA TTTCA GC-CTGA TTGTGT- TTGAA GTAAA -TGA TTAAAA G 1951 AGGAGGAAGT-TACCACATTC-TGGAAGATTT-ACTTGAGACA-GACGAACCTT 2001 GAATTACGGG-AAAAGGCCCC-GTGATTTAGG-AAATAACAAA-TTTGGGAAAC 2051 A TGTAATGGG-GA GA GA CTGG-GGAA TA CCCC-A GTTGTGAAA -GTA CTTCCTG 210] TAAGGCAACA-TCTGACACCA-GGAACCTTTC-TCTTCAGTAT-TTTAAAAACA 2151 ACTTAATTTC-AGTCCTTTAC-TTGTGGAATC-AGAGCCTTAC-TTATGTAATA 2201 CAACCCACTG-GAAAAAAGCT-TTTTATTGTA-TTGTACTATA-TTGTTTATAA 225IGTGATTGAGT-ACCTGCAGAG-CTTTCTTTTA-CTTAAACATA-TTTTAAAAAT 2301 TATTAAAAAG-ATTTTCATGT-TTGAAAACTT-GGGGAAAAAA-GATAAAACAA 2351 TGTCATAATC-TCATCACATT-TAACTGACTA-ATATGAATAT-TTTTCAACAA 2401 AAAGCATTTG-ACTTTTATTA-TTATTTGAGG-CAAAAACTAA-ACTGAAACCA 2451 AATAAAATGT-TGAATTTCAG-AAAAGTGTTC-TTAAAAGCAG-ATATTAAGCC 2501 CTCAATTTTT-ATTAATTTTA-AAATGAGTAA-GCAAACTGTA-AGATGTTAAG 2551 ATTATTAAAT-TATCTCTCAT-TAAGCATGTA-TCTTTCCCAT-TTTAAAAATT 260] CAGTTACTAT-TGATTTATTA-AAAAACAATA-GAAAAGTTAC-ATCTATTTTT 2651 AGAGTGACTC-TCAAGAAAAT-TTAATAAGGG-AAACACAGAT-CTATAAAAAA 2701 CTGTTTGTAA-ACCTAACAAA-GGAAAAAAAA-AGTTGGTGTC-TTTAAAAAAC 2751 CCTTTGAGAT-TAGCTGTGTA-TTCAGATATC-AGTTGGTTCT-CTCCTTTCTG 2801 AATCGCTAAA-CAACTGGAGC-TTGTTTCAGA-AAGCAGCATT-GTCTACGTAT 2851 GTTCCTTT1A-AAAATTTTTT-TTTTAATTCT-GTCTAAAAAA-AACAGACGGG 2901 GTCA CA CT A T-GTTGCCCA GG-CTGCTCTTGA -A TTCCTGGGC- TCCCCTA TCC 2951 ACGCACCTCG-GCCTTCCAGA-GTGCTGGGAT-TACAGGTGTG-AGCCACCGTG 3001 CCTAGTCAGA-CATACTTTTT-TTTTTTTTTT-TTTTTTTGAC-GGAATCTCAG 3051 TCTGTCCCGC-AGGTTGGAGT-GCAGTGATGT-GATCTCGGCT-CACTACAACC 3101 TCCGTCTCCT-GGGTTCAA GC-AA TTC TCCTG-CCTCA GCCTC-CTGA GTA GCT 3151 GGGA TT A CA G-GCGTA CGCCA -CCA CGCCTGG-CTA CTTTTTG-TGGGTTTTTT 3201 A GTA GA GA CA -GGGTTTTTCC-A TG TCGTCCA -GGCTGGTCTG-GAA CTCCTGA 3251 CC TCA A GTGA -TCCGCCCA TC- TCA GCCTCCC-AAA GTGCTGG-GA TT A CA GGC 3301 GTGAGCCACC-TCACCTGGCC-TTGTATGTAT-GTTTTTTTCT-TTCTCTTTCT 3351 TTTTTTTTTT-CTGTGACGGA-GTATTGCCCT-GTCGCCCAGG-CTGGAGTGCA 3401 GTGGCGTGTT-CTTGGTTCA C-TGCAA CCTCT-GCCTCCTGGG- TTCAA GCCA T 3451 TCTCCTGCCT-CA TGCTCCTG-A GTA GCTGGG-A TT A TA GGCA -CGCGCCA CCA 3501 TACCTGGCTA.;.ATTTCTGTAT-TTTTAGTGAA-GACAGGGTTT-CACCATGTTG 3551 GCCA GGCCGG-TC TTGAA A TC-CTGA CCTGAA -GA GA GCTGCC-CGCCTCGGCT 3601 TCCCAAA GTG-CTGA GA TT A C-A GGCGTGA GC-CA CCGCA CCC-GGCCCA GA CA 3651 TATGTTCTTA-ACGTACACTT-TCAGAACAGC-AGTTGAGAAC-TTTTTCCAAA 3701 ATGTAAGCTC-CTTGAGAGCA-AAGCTCTCAG-TGGGTCTCTG-TGTCCTTTAC 3751 TTTGCTTCTC-TTGGTATCTT-GTGGATAATA-TGCACAAAAT-ATTTATTAAA 3801 CAAGAGGATT-TCCATTTTTT-TCTAATATTA-ATAGTTCATT-TAGTCTGTAG 3851CTTCTTGAAG-GCATAGAAAA-GACTATTTTA-TTTTGCCTAC-TTATTTGGCA 3901 AGGTACCCAT-GCAGTATGCC-AGGAGTTACA-GGGCCTATTG-AGAAGGAGTA 3951 AA GGGTCTGG-GA GGGGTGGC-AGGGAGTTGC-TAATTCATGT-ATGGTGGCTA 4001 GAGAAGGCTT-CACTGATGGG-GTTGATGTTT-CAGTGGAGAC-TTGAAGGAGG 4051 AA CA GGAA CG-CA GCA TGA GA -CTGTCTTGGG-GAA GA GTGTT-CA GCA GA GGC 4101 AGCAGTGCTC-AGCTAGCCTT-GAGGGGAACA-TCCAAGTTGG-TCATGTGAGT
92
4] 51 GCAAAAA GGC-CA GTGA GGCT-GCA GCTGCG T-GA GCA CGTGC- TCAA TGA CGG 420] GGTCAAGTGC-AGCGCCTCTT-GGTAGTAAGA-GTAGCTGAGT-GTAAACACCT 4251 A GGGTTCGCT-CCA GTGA GAA -GGGGA GCCTT-TGGA GGGGGC-AA GGCCCA CC 4301 CCCA CCCCCC-AAAA CTGA GG-GGA TA GTGGC-A CCA G TG CA G-TGA GAAA TA C 4351 TGGTCCTCTG- TCCCAA TGA G-GTGGCA GTA G-A GTTA GGGA G-AA GGGA TT AG 4401 GTTCTGCTTG-TGTTTTATTT-TTTTCTTTTA-TTTTTCTCTG-TGTGCTTTTA 445] TA TA GA TTGG-A TG TA TTTTA-AA GGTAGA GC-TGGCTTTGCT-AA TG GA TA TG 4501 CTGGTGGATT-GGATGTGGGG-TGAAGGGAGA-GGAGTCAAAA-ATGACATCAG 4551 GTTCCCAA GG-A TG TCCTGA G-GGA CA GA GCT-GGCATTTA CT-GA GA CG TG GA 4601 GGACAATAGG-AGGAGTAAGT-TTGGGGTAGA-ACATCAGGAG-TTCAATTTTG 4651 A GTA TGTTGA -GTTTCTTGTT-AA TGTGA CTT-GGA GA TA TTT-CCCAA TGAAT 4701 CGTCGTCTGT-CTTGAAA GTG-A GA GTTGAA G-GTTTTCTGTA -CA G TC TG TA T 4751 GTTGAGCCAT-ACATTTTAGC-ATTCTATTAT-TTTGATTGTC-CTCTTTGGTG 4801 TTTCATTTCC-TAAAATCTCT-TCTATCTAAG-AGATCCCTGA-GCCTAGCAGC 4851 CAGGAGTGAA-TTTTCTAGCT-TTTCCACCTC-TGCTAGGTCC-TTCATCAGTT 4901 GTTCAGCATG-TCTGGGACAA-ATAATTTTGG-GGCGGGGGGG-TGCTGAATTT 4951 TAGGACAAAC-GGATGTTATA-GATAAGCTGG-TCCCATTATC-TAATAGCTTA 5001 CAAAGAAAAA-AATATAATGT-ATACAGTGGT-TGAAAAAGTA-GGAGTTACAA 5051 AAAAATGTGT-TTGCATTTTA-ACTTTTCAGG- 5080
EXON-3
5081 -AGATGTTACA-GCCCAGAT AG 5101 CTCTTCAGCC-TGCACTGAAG-TTCAA TGGTG-GTGGTCA TAT -CAA TCA T AGC 5151 A TTTTCTGGA-CAAACCTCAG-CCCT AACGGT -GGTGGAGAAC-CCAAAG- 5196
INTRON-3
5197 -GTTG 5201 GTATATATTG-GTGCACCCTT-ATCTACATTT-TGTGCACAGT-AGGAATCGAT 5251 TGTTGATTTA-CTGAAGTTAC-CTTATACTTG-TTTTTTGTTT-TTTTTGTTGT 5301 TGTTTTTTTG-AGACAAGAGT-TTTGCTCTTG-TTGCCCAGGC-TGGAGTACAG 5351 TGGCGCAGTC-TTGGCTCACT-GCAACCTCCG-CTTCCTGGGT-TCAAGTGATT 5401 CTCCTGCCTC-A GCCTCCCAA -GTA GCTGGGA _ TT A CA GGCGC-CCGCCA CCA C 5451 GCCTGGCTAA-TTTTTGCATT-TTTAGTAGAG-ATGAGGTTTC-ATTCACCATG 5501 TTGGCCAGGC-TGGTCTTGAA-CTCCTGACCT-CATGATCTGC-CCACCTTGGC 5551 CTCCCAAAGT-GCTGGGATTA-CAGGCATGAG-CCACCGTGCC-TGGCCTAAGT 5601 TACCTTATTC-TTACCAGAGG-TATCATAGTG-GCATATTTTT-CATAACAACG 5651 AGTATGATAA-AAGTTGTAAC-TTTCAAAAGG-ACACAAGTAG-GAATGGAGAA 5701 TGCTTTCATG-GGGTTATGTC-ATAAGATTTT-ATGTTCACGC-CAACATAGAA 5751 TATCACATCA-ACTCCACCTT-CTGGTTTCTG-GATGGTACTT-CATATTAGGG 5801 AAAGACTGAG-AGACTTCATT-TTATGAACTT-TTTTTTTTTG-AGACGGAGTC 5851 TTACAGTCGC-CCAGGCTGGA-GCGCAGTGGT-GCAATGTCGG-CTCATTGCAA 5901 CC TCCGCCTT- TCA GGTTCA T-GCAA TTCTTG- TG TCTCA GCC-ACCCAA GTA G 5951 CTGGGATTAC-AGGCATGTGG-CATCACTCCC-GGCTAATTTT-TATATTTTTG 6001 GTA GA GA CA G-GGTTTCA CCA -TGTTGGCGGG-GCTGG TC TCG-AA CTCCTGGC 6051 CTCAA GTGA T-CCA CCCA CCT- TGGCCTCCCA -AA GTGCTGTG-GTA TGGATGT 6101 GA GCCA CCGC-GCCA GTCTA G-AAAA GA TGAA -CTTTCTGTCT-A CTA GTTTCT 6151 AGGGCCTGGA-TTAGATAGTT-AACCGTCTGT-ACCTTTTTTC-ATCTATGTGA 6201 TACAGGGATA-ACAATGGTGT-TGTTTTGAGA-ATTAAATTAT-AGTGTCATTT 6251 GCTA TTTTTC-A CTCTTTCCT-AA CrGA T AAA -AA CTCA G TTG- TTCCA GGAAA 6301 rTAGGTTTTC-TGGGTATTTT-TAAAAAGTGT-TCAGGGAATG-AGGAGAGTAC
10830 A-CCACGATCGT-TATGCTGAGT 10851 ATGTTAAGCT-CTTTATGACT-GTTTTTGTAG-TGGTATAGAG-TACTGCAGAA 10901 T ACA GT AAGC-TGCTCT A TTG-T AGCA TTTCT -TGA TGTTGCT -T AGTCA CTT A ] 0951 TTTCA T AAAC-AA CTT AA TGT -TCTGAA T AA T -TTCTT ACT AA -ACA TTTTGTT 1 ] 00 1 A TTGGGCAAG-TGA TTGAAAA-T AGT AAA TGC-TTTGTGTGA T -TGAA TCTGA T 1 ]051 TGGACATTTT-CTTCAGAGAG-CTAAATTACA-ATTGTCATTT-ATAAAACCAT 11101 CAAAAATATT-CCATCCATAT-ACTTTGGGGA-CTTGTAGGGA-TGCCTTTCTA 11151 GTCCTATTCT-ATTGCAGTTA-TAGAAAATCT-AGTCTTTTGC-CCCAGTTACT 11201 T AAAAA T AAA-A TA TT AACAC-TTTCCCAAGG-GAAACACTCG-GCTTTCT AT A 11251 GAAAA TTGCA-CTTTTTGTCG-AGT AA TCCTC-TGCAGTGA T A-CTTCTGGT AG 11301 A TGTCACCCA-GTGGTTTTTG-TT AGGTCAAA-TGTTCCTGT A-T AGTTTTTGC 11351 AAA T AGAGCT -GT AT ACTGTT -TAAA TGT AGC-AGGTGAACTG-AACTGGGGTT ] 1401 TGCTCACCTG-CACAGT AAAG-GCAAACTTCA-ACAGCAAAAC-TGCAAAAAGG 11451 TGGTTTTTGC-AGT AGGAGAA-AGGAGGATGT -TT A TTTGCAG-GGCGCCAAGC 11501 AAGGAGAA TT -GGGCAGCTCA-TGCTTGAGAC-CCAA TCTCCA-TGA TGACCT A 11551 CAAGCTAGAG-TA TTT AAAGG-CAGTGGT AAA-TTTCAGGAAA-GCAGAAGTT A 11601 AAGGCAAAAT-TGTAAATCAG-TCGAGATCGG-GTGCCTTCAG-GGTGGTATGG 11651 CTGT AT ACCA-AAA TTGT AAA-TCACT ACA TG-AAGCTT A TA T -A TTGGTTTGG 11701 CCTGAAAGGT -GAAGTGGGGT -AGGCAGGGGG-CGGGCTT ACA-GGTT A TGGTG 11751 GA TTCAAAGA-CTCCCTGA TT -TGTGA TTGGT-T AAGGAAGCA-AAGCTTTGTC 11801 T AAAAACTTG-GGGTCCGCAG-AAAGGAACA T -T AAGGTCTGG-CCAGGCCCCT 11851 CAGGAAGAAA-CTGAGAGCAA-AGAA TGGAGG-TCAGAGTTTA-GTCCCTGGTG 11901 TTCCCCCTT A-TCTGACGTCT -GTGTGAA TCC-A TTTGGTGGG-GGTCTGGGTT 11951 TCTGAAAAGT-AGCTCAGGGG-CACGTGTTAA-GGATGTCTCT-AGGTGACTCT 12001 AACTTCCCTG-GCT A TTGTTT -GAAACTGTT A-TGACCTTCTT -GCTTA TCAGC 12051 TTGCTGGTTT -CCTTCTCGGG-GCGAGCTGGG-TGCCTGGAGT -TTTCGGTGAA 12] 0 1 GGAAACTCAA-GATTCTCCTT -TA TTTCTGTG-CTTGTGGGAA-TCCCCCTG'GC 12151 ACACCCCAAA-GAGGGGTCCC-TGCTCCGTCT-CACAGGGATC-TTTTTGTATA 12201 TTTGGCTTAG-CATCATACAT-TTGCCATGTT-GTTTCATCAT-CTGCCTAAATT 12251TACTGTTTTT-GAATATTTCA-TTTGTTTCTA-ATTGTTACTA-CAGATAATGC 12301 TGGGGTGAGC-AACTCTGTGT-ACATAGGTTT-ATCTCCTATT-GGAA TATTTT 12351 CTTTATATAG-GCGTTTTTTT-TTTTTCTTTT-TTTTTGGAGA-CAGAGTCTTG 12401 CTCTGTTGCC-CA GGCTGGAG-TGCAGTGGCG-CGACCGGA GC-TCACTGCAA C 12451 CTCCACTTCC-CGGGTTCAAG-TGA TTGTCCC-ACCTCAGCCT -CCTGAA TAGC 12501 TGGGATTACA-GGTGCATGCT-ACCATGCCTG-GCTACTTTTT-GTATTTTTAG 12551 CAGAGACAGG-GTTTCACCA T -GTTGGCCAGG-GTGGTCTCGA-ACTCCTGACC 12601 TCAAGTGA TC-CGTCTGGCTC-AGCCTCCCAA-AGTGCTGGGA-TT ACAGGTGT 12651 GAGCCACTGC-ACCTGGCCTA-TATAGGCTTT-TTTCTTAAAC-CTATTTAGTA 12701 ATGTTTTCCC-AAGTTTATTT-TTTATTTTTA-ATTTTTTCCC-CAAGTTTATT 12751 TTTCTATTTT-TTTTTCATGG-AAAAATGGGG-TAACTTAGCA-GTTTCAATAT 12801 TGAAGACTGA-AGTTT AAAAA-AAA TTT AAA T _ TCAAGGT ACT _ TTT AAAA TTC 12851 AGTT AGAAAA-GT AGGCTTTA-AAAA TT A TT A-GAGACAAGAG-T ACCAAAGCG 12901 GTGTGTGTAT-GTGTGTGTGT-GTATGCATGC-TTGTGGATTG-GAAAAACTTT 1295] GGAGACTGAT-TACTTTTCAT-TATATATGTG-TCACAGTGAA-ACAGCTTTTA ] 3001 TGTGTCA TGT -AAGA TT ACTG-CTTGCCTÇTC-T AAGGAAGGT -CGTGACTGTT 13051 T AAA T AGACG-GGCAAGGTGG-AACCTTTTGA-AAGA TGAGCT -TTTGAA TA TA 1310] AGTTGTCTGC-T AGA TCA TGG-TTTGT A TTGA-ACT AACAAGG-TTTGCAGA TC 13151 TGCTGACTTA-T ATAAAGCTT-TTTGATTCCT-ACTAAGCTTT-AAGATTTAAA 13201 AAA TGTTCAA-TGTTGAAA TT -TCTGTGGGGC-TCT A TTTTTG-CTTTGGCTTT 13251 CTGGTGAGAG-AGTGAGGAAG-CA TTCTTTCC-TTCACT AAGT -TTGTCTTTCT 13301 TGTCTTCTGG-ATAGATTGAT-TTTAAGAGAC-TAAGGGAATT-TACAAACTAA 13351 AGA TTTT AGT -CA TCTGGTGG-AAAAGGAGAC-TTT AAGA TTG-TTT AGGGCTG 13401 GGCGGGGTGA-CTCACA TCTG-T AA TCCCAGC-ACTTTGGGAG-GCCAAGGCAG
96
13451 GCAGAACACT -TGAAGGAGTT -CAAGACCAGC-GTGGCCAACG-TGGTGAAACC 13501 CTGTCTCTAC-TAAAAATACA-AAAATTGTTT-AGCTCTGTTT-TTCATAATAG 13551 AAA T AGAAAA-GGT AAAA TTG-CTTTTCTTCT -GAAAAGAACA-AGT ATTGTTC 13601 A TCCAAGAAG-GGTTTTTGTG-ACTGAA TCAG-CAGTGCCTGC-CCT AGTCAT A ] 3651 GCTGTGCTTC-AAAAACCTCA-GCA TGA TT AG-TGTTGGAGCA-AAACAAGGAA ] 3701 GCAAAGCAAA -T ACTGTTTTT -GAAA TTCT AT -CTGTTGCTTG-AACT A TTTTG ]3751 TAATAATTAA-ACTTTGATGT-TGAGAAATCA-CAACTTTATT-GTACACTTCA 13801 TTGCAACTTG-AAATTCATGG-TCTTAAAGTG-AGATTTGAAT-TTCTATTGAG ] 3851 CGCCTTT AAA-AAAGT AA T AC-CAAACCA T AA-AGTT AAAATC-TA TGT AT A TT 13901 GAGTCATATC-TAAAACCACG-TATAAACATA-AATTGTATTT-CCTGTTTTAA ] 3951 TTCCAGGGGA-AGT ACTGTTT -GGGAAAGCT A-TT A TT AGGT A-AA TGTTTT AC 14001 AAA TT ACTG T -TTCTCA CTTT -CAG TCA T ACC-CT AA TGA TCC-CA GCAA GA TA 14051 A TGTCCTGTC-TTCT AAGA TG-TGCA TCAAGC-CTGGT ACA TA-CTGAAAACCC ] 410 1 TA T AAGGTCC-TGGA T AA TTT -TTGTTTGA TT -A TTCA TTGAA -G AAACA TTT A 14151 TTTTCCAATT-GTGTGAAGTT-TTTGACTGTT-AATAAAAGAA-TCTGTCAACC 14201 ATCAAA- 14206
3'-UTR DU GÈNE
+ 1 CCGCCCCGCC-CCCCCCCCCC-GCGGGCCCCG-CCCCGCGCCC-GCCGCGCCCA +51 ACCCCGGGGG-TGCCCTGCG T -GCCTG TCCCG-CCCGCCCGCG-CTTGCCGT AC
972 GGCGCCCCT CCT ACCCCGG CTGCTTGGCA 1001 GTTGCAGTGC TGCTGTCTCG GGGGGGTTTT CA TCT A TGAG GGTGTTTCCT I051 CT AAACCT AC GAGGGAGGAA CACCTGATCT T ACAGAAAA T ACCACCTCGA Il 0 1 GA TGGGTGCT GGTCCTGTTG ATCCCAGTCT CTGCCAGACC AAGGCGAGTT 1 ] 51 TCCCCACT AA T AAAGTGCCG GGTGTCAGCA GAA- 1183
-1981 CTCTCGCCTC-AGCCACCTGA-GT AGCTGAGA-CT ACAGGCGT -GTGCCACCAC -1931 GCCCAGCT AA-TTTTTGT A TT -TTT AGCAGAG-GTGGGGTTTT -ACCA TGTTGG -1881 CCAGACTGGT -CTCGAACTTC-TGGCCACAAG-TGA TCCGCCT-GCCTCGGCCT -1831 CCCAAGGTGC-TGGGA TT ACA-GGCGTGAGCC-CCCGCACCCA-GCCTCCT ATG -1781 TAACATTATA-AATTTATTGT-CATTACTTGT-AAGCCTGCCC-TTTATTTTAA _] 731 AATACAAGAT-ATGACAAGAT-CAGAAACCAG-TCTTGTTTCT-CCATTTCTTT -] 681 CTCT AGAAA T -AA TTCTTT AG-GAA TTCAAA T -CCA T AGT AA C-AAAAACAAA G -]631 GAAAAAAAAA-CATGCTTTTT-TTTATATAAT-GAATAAAGGT-TAAGAAATGA -158] CTCCAGGTCT-CTTATTTATT-TTGTTGATAT-TTGTGTTGGT-TAGTTAAGAA _] 531 GATGATTTGC-TCGATTATTT-CAACATTTAT-TTATTCAACA-AACTGTGGAC -1481 TTTGGAGA TG-AACAGCTGAA-GCT AGAA TCC-TGACT ATCCC-TT AA T AGCTG -143] TGTAACTTTG-GGCAAGTTAT-TTAACCTCCC-TATACCTCTG-TTTCCTAATC -1381 TGTAAAATGA-AGATAATATT-AGTATCTAAC-TCATAGGGTT~GTTGGGAGGG -1331 TT AACT AAGC-AAA TA T ACAA-AAAGCTGAGA-A T AGTCCCTG-GT AT AT AGT A -1281 AGTGCTCAA T -AAA TT A TGGA-TGGGAGGA TC-CTGACCCACA-TGGAGTTTAC -1231 AGTCTTGGCA-GT A TGGA TCG-GGCAGGT AGA-AAAAGACACC-AAATTACACA -1181 GCCAACAGCA-TCTTTATAAT-TGTTTTTAAT-ATAGGAAAAG-TATAGGGTGC -1131 T AAAGA TCAA-TTTGTGGCTT _ TCTTTTCCAA-TGAACTGCT A-AAGTTCCACT -1081 TTTATGCCCA-AGATTCTTAT-CATACTTTTG-TAAGATCAAG-AACAACATGT -1031 GAAGTTTCCA-CTATTATATA-TCCACCCATT-ATATGTAGTT-GTACTGGAAA
-98] AAATTAAAAG-CTGATAACTT-TTAATTTGAA-GATGATGGTA-TATACTATGT -931 AT AT AT ATT A-AGGTGCTT AA-AGA T AAA TCC-T AGCACCTGA-GGAGGTGT AG -881 AAA TCATTCA-AACTCTTTGA-TT ACAA TGAC-AAACT AGTCA-GT AACTT ACT -831 AAA T A TTGT A-CTA TA TA TT A-CT AAGT A TTT-T ACTCTTCAA-CAT AGCTTTT -781 T AAAGACACA-AAGCTTTTCA-AAA TTCCTGC-TT ACCTGGGG-GT AAAA TTTG -731 GGGAAGCAGA-TTTCTCCAGT -GTTT AAAGAA-GCCAA TTTGG-CAGTGTACCA -681 GAGTTGAA TA-CA TTTTTCCC-A TCACAAGGG-AA T ACATTTT -TCCCA TCT AA -631 GTT AAGTTGT -TTTTCTCTGG-T AAAGGAGGA-AATCAACACC-CA TCTGT ACG -581 GAGATAAACG-TTTCAGAGTG-TTTTTATATT-AAATAATTAG-TATACTAGTC -531 T AGT AAGTGA-T AA TCCACGA-A T AAGTT AAG-AAGAGCT AAG-AAAGAAAAAG -481 AAAAGCA TCC-A TCCA TCCTT -TGGTTGCAAA-TAAT ACTTAC-A TT AGCGT AT -431 GGCAAAATTT-AATTTTGTAC-AGAGTAATTT-AACCCAGGAT-TGCTGACTTT -381 TT AAGAGCTG-AGAAAGCA T A-GCT A TGGAGC-GCAAGGCCCC-ACCCAGCAGG -331 GTCT AAGT AT -TCCGTCTGCA-AAACTGGCAG-GCCACCAACG-GCCGCGTCCC -281 AGGGCGGCCT -GAAGGA TGCT -GA T AACCGGG-AGCCCCGCCC-TGGGTTCGGC -231 TA TCCCGGGC-ACCCCGGGCC-GGCGGGGCGA-GGCTCTCCAA-TTGCTGGGCC -181 AGAGCGGGAC-CCTTCCTTTC-CGCACCCTCC-TGGGT A TCTC-CGGTCTTCAG -131 GCCTCCTTCG-GAGAGCCCTG-CTCCGAGCCC-A TTGGGCTTC-CAA TCTTGGC
-81 CTGCCT AGCG-CCGAGCAGCC-AA TCAGAAGG-CAGTCCTCCC-GAGGGGGCGG -31 GACGAGGGGG-TGGTGCTGA T -TGGCTGAGCC
32504 GGCCGGG-GCCCTGCACC-TGTGCAGCGA-AGCTT AGCGT -TCA TCCGTGT 32551 AACCCGCTCA-TCACTGGA TG-AAGA TTCTCC-TGTGCT AGA T -GTGCAAA TGC 3260 l AAGCT AGTGG-CTTCAAAAT A-GAGAA TCCCA-CTTTCT AT AG-CAGATTGTGT 32651 AACAA TTTT A-A TGCTA TTTC-CCCAGGGGAA-AATGAAGGTT -AGGATTT AAC 32701 AGTCATTTAA-AAAAAAAATT-TGTTTTGACG-GATGATTGGA-TTATTCATTT 32751 AAAATGATTA-GAAGGCAAGT-TTCTAGCTAG-AAATATGATT-TTATTTGACA 32801 AAA TTTGTTG-AAA TT ATGTA-TGTTT ACA TA-TCACCTCA TG-GCCT ATTA T A 32851 TT AAAA TA TG-GCT AT AAAT A-TA T AAAAAGA-AAAGA TAAAG-ATGA TCT ACT 3290] CAGAAATTTT-TATTTTTCTA-AGGTTCTCAT-AGGAAAAGTA-CATTTAATAC 32951 AGCAGTGTCA-TCAGAAGA T A-ACTTGAGCAC-CGTCA TGGCT -T AA TGTTT AT 3300] TCCTGATAAT-AATTGATCAA-ATTCATTTTT-TTCACTGGAG-TTACATTAAT 3305] GTTAATTCAG-CACTGATTTC-ACAACAGATC-AATTTGTAAT-TGCTTACATT 33]01 TTTACAATAA-ATAATCTGTA-CGTAAGAACA- 33140
3'-UTR DU GÈNE
+] AGAGA TGGT A-TTTTCTTTCT -TTCGA CTCCA -TA TGT AA CTG-T AAACTGCT A +51 CCAGACTCTT-AATTTGAACA-TCATCATTTT-CAGATGTTTA-CCCTTAAAAA
+101 TGGAAATGCC-AGTATCTCGA-GGACTCCATG-TTATTTGTTT-AAATCTATAG + 151 CCTTTGGACA-GCCTTCTGAG-ACACTGATAA-AATAGCAAAT-GCCCCAACTT +201 TGAAAATTAC-TTAAATCTCTT-GTCCATTTGC-TCACTTACC-TGTGATTGAC +251 TTTTT AAAAC-AAGGGCTCAG-AACCACTGGT -CACTTTCCTC-TTCCTTCTTT + 301 TT AAAGCCCA-T A TTTGCCT A-TCA TGGTTGA-AAA TCACA TG-GAAGACTTT A +351 AAG·ATGAGTT-CTGAATACTA-AATGAAAATT-TGTTTTCCTT-GAAAATCTTT +40] A TTCCGTTCA-TA TTCAAAAC-CAGTTTGTGC-CGGGTGTGGT -GGCTCAT A TG +451 CCTGT AAA CC-CAGCACTTTG-GGAAGCCAA G-GCAGGAGGA T -CACTTGAA CT +501 CAGGAG TTTG-AGACCA GCCG-GGGCAA CA TG-GCGAAGCCCT -G TCTGT ACAA +551 AAAA T ACAAA-AA TT AGCCGA-GT A TGGT AAC-GCA TGCCTGT -AGTCCCAGTT +601 A CT A GGGAGG-CTGAGGCGGG-AGGA TCTCTT -GA GCCCAGGA -GG TTGAGGCT +65] GCAGTGAGTC-GTGA TTGCAC-CACTGCACTC-CAGTCTGGGC-AACAGAGTGA +701 GACCTTGTCT-GAAAACAACA-ACAA TAACAA-CTAAAAACAA-AAAACCAAAC + 751 CAGTTT AT AC-TTTCAGGAGT -TCCTGAGTT A-CGGGCTTCAG-GAAACAGACC +80] ACTAGCAGAC-AGATACAAAC-TCATTCTTGG-TCTTTTAGCT-CAAATTTCTT
115
+851 T ACTCCTCTG-TCAAACCCTC-CTGCCT AA TT -CCCCCCGT AT -TTGAGT A TGC , +901 TTTGAGACTG-TTATATTTGT-AGACATAGAA-AATAGATATA-TCGGGCTGGG +951 TGCAGTGGCT -CACGCCTGT A-AA CCCA GCAC-TTTGGGAGGC-CAAGGCGGG T