-
1
Rpublique Algrienne Dmocratique et Populaire
MINISTERE DE LENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE
SCIENTIFIQUE
UNIVERSITE MENTOURI CONSTANTINE
FACULTE DES SCIENCES DE LA NATURE ET DE LA VIE
N dOrdre : 183/T.E/2007 N de Srie : 10/S.N/2007
THESE
EN VUE DE LOBTENTION DU DOPLME DE
DOCTORAT DETAT EN MICROBIOLOGIE
THEME
Prsente par CHIKHI ABDELOUAHAB
Soutenue le 30 Dcembre 2007 Devant le jury : Prsident : Mr
DOUADI. KHELIFI Professeur Universit de Constantine Rapporteur : Mr
MUSTAPHA BENCHARIF Professeur Universit de Constantine Examinateurs
: Mr HAMID AIT AMAR Professeur U.S.T.H.B. Alger Mr ABDELHADI GUECHI
Professeur Universit F. Abbas Stif Mr MESBAH LAHOUEL Matre de
confrences Universit de Jijel
CALCULS ET MODELISATIONS DES INTERACTIONS PEPTIDE
DEFORMYLASE
SUBSTANCES ANTIBACTERIENNES A LAIDE DE TECHNIQUES DE DOCKING
(ARRIMAGE) MOLECULAIRE
-
2
A ma mre
A mon pouse et mes enfants
toute ma famille
A mes amis
A la mmoire de mon regrett pre
-
3
Je tiens remercier :
_ Monsieur le Professeur Bencharif mustapha pour avoir dirig mes
travaux, pour mavoir
accueilli dans son laboratoire et pour toute laide quil ma
accorde.
_ Monsieur le Professeur Boulahrouf Abderrahmane pour son aide
dans ce travail, ses
prcieux conseils et sa grande disponibilit.
_ Monsieur le Professeur Khelifi Douadi pour avoir accept la
charge de prsider mon
jury.
_ Monsieur le Professeur At Amar Hamid qui ma fait lhonneur de
participer mon jury.
_Monsieur le Professeur Guechi Abdelhadi qui a accept de juger
mes travaux en
participant mon jury.
_Monsieur le Docteur Lahouel Mesbah qui ma fait lhonneur
dassister mon jury et juger
mes travaux.
_ Monsieur le Professeur David Perahia pour laccueil quil ma
rserv et pour le temps
quil ma consacr au niveau du laboratoire de biochimie et de
biophysique molculaire et
cellulaire (Universit dOrsay, Paris-sud).
-
4
SOMMAIRE
- INTRODUCTION..8 - Chapitre 1 : Docking molculaire12
1. Principes12
1.1. Approche combinatoire12 1.2. Approche stochastique....12
1.3. Approche dterministe.13 2. Obtention des structures.14 3.
Applications...14 4. Programmes utiliss....15 4.1. FlexX..15 4.1.1.
Flexibilit conformationnelle du ligand...16 4.1.2. Interaction
protine-ligand .17 4.1.2.1. La modlisation de linteraction..17
4.1.2.2. Les diffrentes tapes de docking..19 4.1.3. Fonction de
score..22 4.1.3.1. Gnralits.22 4.1.3.2. La fonction de score..23
4.2. Surflex....24
- Chapitre 2 : Mthodes de score ou estimation de lenthalpie
libre dinteraction26
1. Mthodes semi-empiriques...26 2. Mthodes empiriques....27 3.
Potentiels bass sur des connaissances...28 4. bas sur le premier
principe de la thermodynamique..29
- Chapitre 3 : La peptide dformylase30
1. Gnralits.30
2. Sources de la PDF...31 2.1. PDFs bactriennes.. 31
-
5
2.2. PDFs des parasites.........33 3. Structure de la peptide
dformylase bactrienne..35 4. Classification des PDFs (arbre
phylogntique des PDFs)39 4.1. Les PDFs des Eucaryotes
suprieurs..42
4.2. Les PDFs des Eukaryotes infrieurs.42 4.3. Les PDFs
orthologues des Archae42
- Chapitre 4 : Les inhibiteurs de la peptide dformylase.45
1. Recherche de nouveaux antibactriens..45 2. Les diffrentes
classes dinhibiteurs.46
2.1. Gnralits.46 2.2. Inhibiteurs faible ou sans activit
antibactrienne (Classe I)..47 2.3. Inhibiteurs possdant une activit
antibactrienne (Classe II)..48 2.4. Inhibiteurs de la PDF actifs in
vivo (Classe III)............49 2.5. Autres inhibiteurs de la
PDF49
- Chapitre 5 : Matriel et mthodes.52 1. Banque de donnes des
protines..........52 2. Tests dvaluation des programmes utiliss52
2.1. Prparation des molcules larrimage ...........52
2.2. Programmes utiliss..........52 2.2.1. Arguslab ...52 2.2.2.
FlexX..53 2.2.3. Surflex54
3. Inhibition de la 1bsj ..55 3.1. Choix de la 1bsj..55 3.2.
Rgle de Christopher A. Lipinski ...........55 3.3. Inhibition de la
1BSJ par divers inhibiteurs connus 56 4. Essais de modlisation56
4.1. Les Ligands et leurs similaires ..........56
4.2. Les mono et bi substitutions de lactinonin58 5. Etude
comparative de lactivit inhibitrice de deux nouvelles classes de
molcules non peptidiques, testes in vitro, avec
lactinonin............59
5.1. Drivs de lacide isoxazole-3-hydroxamique...59 5.2. Composs
agissant spcifiquement sur les PDF bactriennes (noyau indole et ses
drivs)60
-
6
- Chapitre 6 : Rsultats ..65 1. Fiabilit des programmes
utiliss.65 2. Inhibition de la 1bsj ....68
2.1. Rgle de Lipinski ...68 2.2. Inhibition de la PDF par les 5
composs connus.............68
3. Essais de modlisation.............73 3.1. Ligands et
similaires..73
3.2. Substitutions effectues sur lactinonin...79 3.2.1. Mono
substitutions.....79 3.2.2. Bi substitutions83
4. Etude comparative par Surflex de lactivit inhibitrice de deux
nouvelles classes de molcules non peptidiques testes in vitro
....88
4.1 Drivs de lacide isoxazole-3-hydroxamique....88 4.2 Composs
agissant spcifiquement sur les PDFs bactriennes....90
- DISCUSSION92 - CONCLUSION...95 - REFERENCES BIBLIOGRAPHIQUES
....98 - ANNEXES.111
-
7
THEME
Calculs et Modlisations des interactions peptide
dformylase-substances
antibactriennes laide de technique de docking (arrimage)
molculaire.
-
8
INTRODUCTION
-
9
La recherche en biologie ne peut, actuellement, se passer des
outils informatiques pour traiter le flot de donnes produites et
optimiser ses avances. Lun de ces outils est la modlisation
molculaire et plus prcisment larrimage molculaire (plus souvent
connu sous le terme anglo-saxon "docking"). Lemploi initial du
"docking" molculaire a t de prdire et reproduire des complexes
protine-ligand [1,2].
Les succs dans ce domaine et lessor des techniques de chimie
combinatoire
ainsi que lexploitation systmatique de la diversit chimique
provenant dautres cibles ont largi son utilisation loptimisation de
molcule et au criblage de bases de donnes. Ainsi cette mthode,
permettant de cribler des milliers de composs pour une protine
cible, est couramment utilise en pharmacochimie pour lobtention de
nouveaux mdicaments. Une telle approche serait difficilement
ralisable en biologie traditionnelle o le rcepteur est
classiquement une protine ou un oligomre de protine et le ligand
est une petite molcule.
Tous les programmes de "docking" peuvent se dcomposer en deux
tapes, la
partie de recherche des conformations possibles du ligand et la
partie dvaluation de ces conformations ou fonction de score.
Celle-ci doit permettre dattribuer le meilleur score au complexe le
plus raliste dtermin exprimentalement. Pour effectuer ce choix la
fonction de score est base classiquement sur la complmentarit
strique des fonctions et des groupements chimiques. Il existe de
nombreuses fonctions de score mais envisager tous les paramtres
physico-chimiques qui entrent en jeu dans les interactions
intermolculaires est pour linstant irralisable.
Cependant, parmi les forces en jeu, certaines sont plus
importantes que dautres.
Ainsi les liaisons hydrogne constituent une des composantes
jouant un rle primordial dans les interactions intermolculaires.
Ceci est d principalement lubiquit des groupements polaires dans
les macromolcules biologiques.
Le premier objectif de ce travail est dvaluer les programmes
disponibles pour
effectuer un "docking" molculaire entre une protine enzymatique
et des ligands divers. Pour cela, trois programmes parmi les plus
utiliss actuellement ont t choisis : Arguslab, FlexX et Surflex. Il
sagit l dune approche " in silico" de la biologie traditionnelle
qui complte les approches classiques "in situ " (dans le milieu
naturel), "in vivo " (dans l'organisme vivant) et "in vitro " (en
prouvette).
Dans ltude ralise ici la protine est la peptide dformylase
(PDF), enzyme
essentielle chez une grande varit de microorganismes pathognes
mais qui nest pas requise pour la synthse protique cytoplasmique
chez les eucaryotes et constitue ainsi une cible potentielle
intressante pour les agents antimicrobiens [3]. Les ligands sont
des composs organiques divers pouvant jouer le rle dinhibiteur de
lenzyme.
-
10
Ces dix dernires annes, une partie substantielle du programme de
dcouverte de mdicaments antimicrobiens de lindustrie pharmaceutique
a t consacre lidentification de nouvelles classes de molcules
antibactriennes, par opposition lamlioration du pouvoir ou du
spectre daction des classes existantes. Ce changement de stratgie a
t men en raison de limportance du problme de la rsistance et du
besoin consquent de nouveaux mdicaments prsentant des mcanismes
diffrents et insensibles aux antibactriens existants [4].
En effet, Les maladies infectieuses causes par les bactries, les
moisissures et
dautres organismes parasites affectent des centaines de millions
de personnes travers le monde et entranent des millions de dcs
chaque anne.
Ainsi, le second objectif porte sur ltude de linhibition de la
peptide dformylase
par une grande varit de molcules, peptidiques et non
peptidiques, dans le but de dcouvrir de nouveaux antibiotiques.
Par cette tude, nous essayons de contribuer d'une part, la
comprhension des
mcanismes fondamentaux de la liaison entre une cible protique et
son ligand et, d'autre part, la recherche dagents thrapeutiques
potentiels par arrimage et criblage virtuel de la peptide
dformylase (PDF) laide de simulations sur ordinateur.
De plus, par ce travail, nous souhaitons acqurir des comptences
en "docking"
molculaire de faon pouvoir dvelopper cette nouvelle technique
luniversit de Constantine.
-
11
REVUE BIBLIOGRAPHIQUE
-
12
- CHAPITRE I -
DOCKING MOLECULAIRE
1. PRINCIPES
Le plus important problme pour ltape de Docking est de parcourir
le mieux possible lespace conformationnel. La complexit de ce
problme est fonction du nombre de degrs de libert, de translation,
de rotation en plus des conformations de dpart possibles du ligand.
Afin dviter des calculs que les machines ne peuvent rsoudre ou
seulement dans des temps bien trop importants, plusieurs
approximations sont possibles. Les algorithmes de recherche de la
flexibilit du ligand peuvent se classer en trois principes, nomms
combinatoire, stochastique, et dterministe.
1.1. Lapproche combinatoire
Cette approche est base sur des grilles de valeurs pour chaque
degr de libert, et chacune de ces grilles est explore de manire
combinatoire au cours de la recherche. En raison de leffet
combinatoire, le nombre dvaluations augmente bien plus rapidement
que le nombre de degrs de libert. Pour cela, des critres de fin
sont imposs pour viter lalgorithme de parcourir des portions de
lespace qui ne mneraient qu de mauvaises solutions.
Dans un premier temps le ligand est dcoup en parties rigides et
flexibles. Entre les points o des rotations sont possibles, une ou
plusieurs ancres rigides sont dfinies, ensuite une premire partie
rigide est mise en interaction avec le rcepteur puis les parties
flexibles sont ajoutes de manire successive avec une exploration
des angles de torsion. Le plus important est le choix des fragments
de base placer en premier dans le site car il est trs difficile
pour les algorithmes de compenser une mauvaise position initiale.
Les diffrentes implmentations changent par la manire dont le
premier segment rigide est plac dans le site et dans les procdures
dlimination quand le nombre dangles de rotation augmente. Nous
supposons que la position du segment rigide de dpart ou ancre fait
partie des n positions de plus basse nergie possible. Le nombre n
dtermine la largeur de larbre de recherche. Cette hypothse peut
savrer tre un biais dans le cas de petits segments ancres car
ceux-ci sont susceptibles de sadapter de nombreux endroits la
surface du rcepteur entranant la construction de branches sans
intrt. Cette mthode a t incorpore dans plusieurs programmes dont
Dock [5] et FlexX [6]. Le programme FlexX positionne lancre partir
dune modlisation des interactions chimiques et effectue une
slection automatique des fragments de base [7,8]. Les fragments
sont ajouts de manire incrmentale. Chaque angle possible est
construit et les angles qui produisent des recouvrements avec le
rcepteur ou des conflits internes sont rejets. A chaque ajout, le
calcul de lnergie est pratiqu et les molcules partiellement
construites sont classes. Cette procdure est rpte jusqu la
construction complte de la molcule.
-
13
1.2. Lapproche stochastique
Lapproche stochastique consiste effectuer des changements
alatoires dans la structure tridimensionnelle du ligand.
Habituellement il sagit de modifier un degr de libert chaque fois.
Lun des points faibles de cette mthode est lincertitude de
convergence. Pour lviter, il faut multiplier les calculs,
indpendamment les uns des autres. Un des principaux algorithmes
stochastiques est la mthode de Monte Carlo [9].
Pour la mthode de Monte Carlo le ligand est considr dans son
ensemble et les changements seffectuent aussi bien sur les
translations, les rotations que sur les torsions. A chaque
mouvement, la molcule est minimise et son nergie est calcule. Pour
dterminer si une structure doit tre conserve les programmes se
servent du critre de Metropolis [10]. Pour les systmes
macromolculaires le critre de Metropolis peut sexprimer ainsi :
partir dune configuration i, on tire au hasard une configuration j.
Cette nouvelle configuration est accepte avec une probabilit , qui
est la probabilit que le systme puisse aller dun tat dquilibre i
vers un tat j. La diffrence dnergie entre la nouvelle et lancienne
configuration est calcule. Si la nouvelle configuration est dnergie
plus basse elle est accepte. En revanche si elle est dnergie plus
haute, un nombre au hasard entre 0 et 1 est tir, si ce nombre est
infrieur la nouvelle configuration est accepte, sinon lancienne
configuration est garde. Ce critre est, dans la plupart des cas,
trs efficace et simple mettre en uvre.
Pour obtenir la structure la plus stable ou quand il est
raisonnable de penser que la structure de dpart est trs loigne de
celle de linteraction, il est possible dutiliser le recuit simul.
Cette mthode est une variante de la mthode de Monte Carlo qui
sapplique particulirement bien aux macromolcules. Elle consiste
effectuer plusieurs cycles de calculs avec la particularit que le
premier cycle sera simul haute temprature et que dans les cycles
suivants ce facteur sera progressivement diminu. Chaque nouveau
cycle commence avec la meilleure structure du prcdent.
Une autre modification possible de Monte Carlo moins employe est
la recherche Tabou qui consiste en un critre de choix suivant la
zone de lespace conformationnel o se situe la structure, avec des
zones permises et dautres interdites (tabou), afin de limiter le
calcul [11], cette technique se retrouve dans le programme
PRO_LEADS.
Le programme ICM [12] utilise des probabilits partielles pour
son algorithme de Monte Carlo. Les mouvements de translation et de
rotation sont tests par une simulation des mouvements
pseudo-brownienne, alors que les mouvements de torsion se basent
sur des probabilits partielles. Aprs chaque cycle une minimisation
locale est faite, qui est suivie par un calcul de lnergie de
solvatation et de lentropie. Le choix se fait selon le critre de
Metropolis. Les probabilits partielles sont drives du diagramme de
Ramachadran de structures connues.
Le programme Glide [13] utilise lui aussi la mthode de Monte
Carlo. Il se sert de caractristiques chimiques pour valuer la
pertinence des structures et faire un choix chaque cycle, mais afin
de rduire lespace explorer par Monte Carlo il emploie pralablement
plusieurs filtres qui permettent dliminer les mauvais contacts
notamment polaires ou hydrophobes.
1.3. Lapproche dterministe
Dans lapproche dterministe, ltat initial dtermine les mouvements
effectuer pour gnrer ltat suivant. Cet tat devant tre dnergie gale
ou infrieure celle de
-
14
ltat initial. Le problme des systmes dterministes est quils
peuvent facilement rester pigs dans un minimum local car leurs
capacits surmonter des barrires nergtiques sont faibles. Il sagit
de lapproche la plus simple et la plus directe.
Lexemple le plus rpandu est la simulation de dynamique
molculaire. Cette mthode est trs rarement employe en Docking du
fait des moyens quelle demande et de son biais pour les minima
locaux.
Pour simuler les interactions protines-ligands, nous avons
choisi trois programmes de docking. Il sagit en premier de deux
programmes parmi les plus rpandus, FlexX et Surflex [2], qui
utilisent une mthode incrmentielle et Arguslab [14] qui utilise des
mthodes mixtes.
2. OBTENTION DES STRUCTURES La majorit des structures protiques
sont disponibles via la Protein Data Bank
[15], un grand nombre de structures dune mme molcule avec ou
sans ligand permet davoir une information pertinente. Quand la
mthode exprimentale nest pas possible ou na pas t encore ralise, la
solution envisager en premier est une approche par modlisation
comparative [16].
Il sagit de prdire un modle daprs dautres molcules le plus
proche possible de celle tudie et dont les structures sont connues
exprimentalement. La conformation dune protine tant code par sa
squence en aminoacides, la premire tape est deffectuer un
alignement de squence pour identifier les molcules similaires. La
recherche dhomologues peut seffectuer principalement par trois
voies. En premier lieu la mthode dveloppe par Needleman et Wunsch
qui utilise un algorithme de programmation dynamique pour raliser
un alignement global puis celle de Smith et Waterman, semblable la
prcdente mais qui ralise des alignements locaux et enfin au moyen
de recherches par heuristique, qui permettent de travailler avec un
nombre de squences beaucoup plus grand. Parmi ces mthodes, on peut
citer les approches utilises par les logiciels BLAST (Basic Local
Alignment Search Tool) [17] et FASTA [18].
Il est possible dobtenir une structure secondaire uniquement
partir de la squence de la molcule en tudiant la composition locale
des squences et en la comparant des bases de donnes dans lesquelles
sont identifies les tendances quont certains acides amins former
des structures particulires. Mais pour une simulation de Docking
cette structure nest pas suffisante. Une fois ltape dalignement
effectue, il est possible de raliser ltape de modlisation
comparative qui doit produire une structure reprsentative de la
squence fournie, laide dun modle choisi grce aux homologies quil
prsente avec cette squence. Plusieurs logiciels existent, nous
citons par exemple les programmes Jackal [19] et Modeller [20].
Jackal est compos dune suite de logiciels permettant la
construction dune structure base sur une mthode dvolution
artificielle. Modeller permet une modlisation comparative par
satisfaction des contraintes spatiales. La prcision de la structure
obtenue dpend principalement du degr de similarit avec les squences
de rfrence slectionnes, ce qui peut poser des problmes pour la
structure globale de la protine, le taux de similarit ntant pas
constant sur toute la squence. Ces restrictions font que ces modles
ne sont pas toujours exploitables en Docking molculaire.
3. APPLICATIONS
-
15
Il y a deux principales applications au programme de docking. La
plus ancienne est la prdiction du mode dinteraction. La seconde
consiste optimiser des molcules ayant dj une activit avec le
rcepteur. Plusieurs mthodes sont utilises pour valuer les
performances des diffrents programmes de docking pour chaque
application. Laptitude dun algorithme trouver lemplacement correct
du ligand par rapport son rcepteur est habituellement dtermine au
moyen de la dviation quadratique moyenne ou RMSD (root-mean-square
deviation) du modle conu par le logiciel vis--vis de la structure
du cristal. La valeur admise est une diffrence maximale de 2
angstrms au-del de laquelle la prdiction est considre comme non
adquate [21,22]. En gnral, les erreurs de docking sont dues un
chantillonnage insuffisant ou une fonction de score inadquate. Pour
savoir de quel type derreurs il sagit, il faut comparer lnergie la
plus basse obtenue par docking avec le score de la structure
cristalline. Si le score du complexe de docking est moins favorable
celui de la structure cristalline il sagit dun problme de la partie
charge de parcourir lespace conformationnel. Lchantillonnage dans
ce cas est incomplet et na pas permis de trouver le conformre
correspondant au minimum global dnergie potentielle [23]. Dans le
cas o le score de docking serait bien plus bas que celui de la
structure cristalline il sagit dune erreur de la fonction de score.
Pour remdier ces problmes, dans le premier cas il faut augmenter le
nombre de conformres valus, dans le deuxime il faut revoir la
fonction de score. Il sagit l de cas classiques qui supposent que
lespace conformationnel autour de la structure exprimentale est
parfaitement parcouru et que la structure cristalline est bien
celle correspondant au minimum global dnergie potentielle. Il faut
donc ladapter selon son propre calcul.
Pour optimiser les molcules activit pharmacologique, le
programme doit tre
capable de ranger correctement des molcules semblables
chimiquement. La fonction de score doit tre capable de limiter les
faux positifs et les faux ngatifs. Pour vrifier la capacit
diffrencier du logiciel, il faut disposer dune banque exprimentale
de complexes. Il convient davoir une structure c
-
16
ristallographique pour au moins un complexe protine-ligand
proche des molcules testes.
4. PROGRAMMES UTILISES
4.1. FlexX
FlexX incorpore les concepts de quatre diffrents programmes
appliqus dans le design des mdicaments (design bas sur la
structure) : La plus importante tape est la stratgie de docking de
ligands flexibles par une voie incrmentielle analogue celle de
Leach et Kuntz qui t prsente en 1992 [24]. La slection du fragment
de base est une tape interactive durant la prdiction du complexe
protine-ligand excute par FlexX [6]. Le principe de la modlisation
de linteraction protine-ligand est celui de Bhm (1992) utilis dans
son programme LUDI [25]. Les positions du ligand sont calcules
selon la gomtrie de linteraction, ces positions sont guides par les
proprits physico-chimiques du ligand. Pour estimer lnergie libre de
la liaison et classer les solutions obtenues, une variante de la
fonction de Bhm appele The scoring function a t applique [26]. Pour
manipuler la flexibilit du ligand le programme MIMUMBA, dvelopp par
Klebe et Metzner en 1994, est utilis [27]. Les conformations sont
gnres par un rseau direct, la longueur de la liaison et les angles
sont gards invariants. Les conformations retenues sont dtermines
pour chaque fragment par une valuation statistique du CSD
(Cambridge Structural Database) [28]. Le rcepteur est considr
rigide. Le processus de la construction incrmentielle est bas sur
une stratgie simple : aprs avoir mis le fragment dans toutes ses
conformations possibles et dans tous les placements trouvs dans la
premire itration, seuls les K meilleurs placements sont pris en
considration dans litration suivante. Cette stratgie est utilise
dans le programme Grow dvelopp par Moon et Howe en 1991 pour le
design des peptides [29].
FlexX est bas sur trois parties majeures [6] : la flexibilit
conformationnelle du ligand, les interactions protine-ligand et la
fonction de score utilise pour classer les solutions ou les
rsultats gnrs par FlexX.
4.1.1. Flexibilit conformationnelle du ligand Le modle qui dcrit
la flexibilit du ligand a t dvelopp en 1994 par Klebe et
Metzner [27] dans leur programme MIMUMBA. Le rle de ce programme
est de classer les conformations qui ont une basse nergie. Il
utilise les valeurs partir des donnes de la structure en ce qui
concerne la longueur et langle de la liaison. Ce programme contient
aussi une base de donnes de 900 fragments molculaires qui vont tre
affects automatiquement chaque liaison simple par un algorithme
appel a subgraph matching algorithm .
4.1.2. Interaction protine-ligand
Pour attacher un ligand une protine (docking) le problme est de
prdire la conformation et lorientation du ligand relative au site
actif de la protine cible. Le docking est la base de la
reconnaissance molculaire et du type de linteraction. chaque
protine cible de structure connue le docking se rvle tre la cl dans
le design de
-
17
nouveaux mdicaments [26,30-32]. Le ligand est considr comme une
petite molcule organique. Les interactions qui peuvent exister
entre cette petite molcule (le ligand) et la protine sont : des
interactions polaires (liaisons hydrogne, liaisons ioniques) et des
interactions hydrophobiques (contact entre des groupes
hydrophobes).
Les interactions entre la protine et le ligand suivent le
concept de la complmentarit strique. Rcemment dautres algorithmes,
se basant sur le matching of interacting group , ont t dvelopps
[33]. Ces algorithmes sont moins performants car ils modlisent les
diffrentes interactions de la mme manire. Pour contourner cette
carence la technique utilise considre trois niveaux de types
dinteraction :
- les interactions du 3me niveau concernent les liaisons
hydrogne et les liaisons ioniques, elles sont les plus restrictives
gomtriquement cause de leur courte distance H-accepteur --------
H-donneur = 1.9A. - les interactions du 2me niveau sont les
interactions hydrophobiques entre le centre dun cycle aromatique et
les atomes dun autre cycle, dune amide ou des groupements mthyle.
La gomtrie de ce type dinteraction est lgrement moins restrictive,
on peut alors le sparer des interactions purement hydrophobiques.
Des tudes sur linteraction protine-ligand ont montr que ce type
dinteraction est le plus frquent. - les interactions du 1erniveau
sont les contacts hydrophobiques non spcifiques entre les atomes de
carbone aliphatique ou aromatique. Ces interactions sont gnralement
sphriques avec un rayon de 4A et elles couvrent la plus grande
partie du ligand [6,33].
Pour le placement du ligand dans le site actif de la protine,
les interactions du 3me niveau sont utilises en premier, ensuite
celles du 2me niveau, et enfin celles du 1er niveau.
4.1.2.1. La modlisation de linteraction
Le modle qui dcrit les interactions protine-ligand est inspir de
celui de Bhm (1992) et Klebe (1994) [25,34]. Ce modle est bas sur
les surfaces sphriques, pour chaque groupe ou atome il y a un type
dinteraction et une gomtrie correspondante [6]. Le tableau 1
suivant dfinit les diffrents types dinteraction rencontrs lors de
la formation dun complexe protine-ligand. Ces types dinteraction
sont diviss en groupes et contre groupes. Si le contre groupe nest
pas dfini le groupe et le contre groupe sont identiques.
Tab 1 : Diffrents types dinteraction dun complexe
protine-ligand.
Groupe Contre-groupe Niveau H-accepteur
H-donneur 3
Mtal accepteur Mtal 3 Atome dun cycle Aromatique Mthyle
Amide
Centre dun cycle aromatique 2
Carbone aliphatique Carbone aromatique Sulfure
1
-
18
La gomtrie de linteraction consiste en un centre et une surface
dinteraction. La surface dinteraction est toujours une surface
sphrique (Sphre, cne, rectangle sphrique, chapeau), ou une
combinaison entre eux (figure 1) [6].
Figure 1.la gomtrie de linteraction. a : cne, b : chapeau, c :
rectangle sphrique La gomtrie de linteraction est dfinie par les
rgles de Bhm, lesquelles sont prises en compte dans la technique
utilise et gnrent les positions des atomes du ligand dans le site
actif de la protine. Le tableau 2 rsume quelques groupes
fonctionnels avec leurs gomtries. Tab 2 : Groupes fonctionnels avec
leurs gomtries.
Groupe fonctionnel Site dinteraction Les paramtres gomtriques
C=O
D-X
RO-D = 1,9 = 110-180o = 0-360o
N-H , O-H
A-Y
RH-A = 1,9 = 150-180o = 0-360o
N-H(charg)
A-X
RH-A = 1,8 = 150-180o = 0-360o
COO-
D-X
RO-D = 1,8 = 100-140o =-50o-50o,130o-230o
=N-
D-X
RN-D = 1,9 = 150-180o 0-360o
R-O-R(SP2)
D-X
RO-D = 1,9 = 100-140o
-
19
= -60o-60o R-O-R(SP3)
D-X
RO-D = 1,9 = 90-130o = -70o-70o
Les paramtres R, , sont reprsents sur les schmas 1, 2 ,3
suivants :
R
N
O
HN
wR
a
R
O
HN
wR
a
H
R
N
R
H
R
wa
N
Schmas 1, 2 ,3 : dfinition des paramtres R, ,
La gomtrie de linteraction contient le centre de linteraction,
le rayon de linteraction, et la surface de linteraction. Les
interactions considres sont celles o : - les types dinteraction des
deux groupes A et B sont compatibles - le centre dinteraction de A
est li approximativement la surface dinteraction de B et vice versa
(figure 2)
-
20
Figure 2. interaction entre A et B
4.1.2.2. Les diffrentes tapes de docking Lalgorithme de docking
est bas sur la stratgie de la construction incrmentielle, elle
consiste en trois phases essentielles : Slection du fragment de
base [6,33] La premire tape du docking est de choisir une partie du
ligand qui va interagir en premier avec la protine, cette partie
est appele le fragment de base . La technique de la slection du
fragment de base est la suivante :
- la premire tape est la division du ligand en plusieurs
composants par louverture des liaisons simples acycliques non
terminales. Par dfinition un fragment est dit valide lorsquil
constitue la partie qui va se connecter la protine, et nayant pas
plus de 30 conformations [6,15].
- la deuxime tape consiste au classement des fragments valides.
Placement de base
Les algorithmes de placement sont bass sur la technique de
geometric hashing [33,35-37]. Ces algorithmes sont le triangle
algorithme (triplet) et le line algorithme (paire). Le premier
algorithme est utilis lorsquil y a trois interactions compatibles
entre le ligand et le rcepteur, il sagit dun triplet (sous forme de
triangle) (figure 3) ; le second est utilis lorsquil y a deux
interactions compatibles, dans ce cas il sagit dune paire.
Pour des raisons gomtriques les surfaces dinteractions du site
actif sont prsentes par des points (cette ide est similaire celle
dveloppe par Bhm en 1992) [38].
La premire tape de cette technique est de gnrer tous ces points
dinteraction dans des cercles o la distance point-point est fixe.
Sachant que la distance de la liaison hydrogne et les sels ponts
est gale 1.2 et que celle des interactions
hydrophobiques est gale 1.6 . La technique geometric hashing
traite toutes les paires de points qui ont une
distance dans lintervalle de 0.5 10 comme suit : le type
dinteraction du 1rpoint, le
-
21
type dinteraction du 2me point et la distance. Elle gnre tous
les triplets (ou paires) des centres dinteraction du fragment et
dfinit tous les triplets compatibles. On dit que les deux triangles
dfinis prcdemment sont compatibles seulement sils ont les mmes
longueurs dartes et que leurs sommets ont des types dinteraction
compatibles [6] (figure 3).
Figure 3. Technique utilise pour placer le fragment. Les trois
centres dinteraction du ligand (en gris).
Les trois points dinteractions du site actif (en noir).
La deuxime tape est lajustement du placement en considrant : -
Les contraintes angulaires ou gomtriques (le centre dinteraction du
ligand
concide avec la surface dinteraction du rcepteur et vice-versa).
- Le ligand et la protine (rcepteur) ne doivent pas se chevaucher.
La liste des
placements (positions) obtenus par cette tape contient plusieurs
interactions similaires pour deux raisons :
Changer un point par un autre proche dans la mme surface
dinteraction change lgrement linteraction. Le fragment peut faire
plus de trois interactions simultanment.
La troisime tape sert regrouper tous les placements qui ont un
rms de dviation minimale, (rms : root mean square=0.7). Ces
placements vont converger vers une seule solution, celle qui
correspondra lorientation finale du ligand [6,39,40].
La dernire tape est un test de chevauchement (lalgorithme ne
prend en compte que les placements qui ne se chevauchent pas).
Dans le cas dun petit fragment de base, il se trouve que les
triplets dinteractions soient trs rares ou mme inexistants, les
paires dinteractions vont alors tre prises en compte au lieu des
triplets. Linteraction va tre entre les paires des centres
dinteractions du ligand et les paires de points dinteractions du
site actif. Le degr de libert qui reste (la rotation autour de laxe
dfini par la paire de points dinteractions) peut tre fix en
tournant le ligand de telle sorte que les deux centres
dinteractions du rcepteur lient approximativement les deux centres
dinteractions du ligand.
Pour rduire le nombre de placements ou positions gnrs, il suffit
de diffrencier les interactions actives des moins actives (active
veut dire quelle peut tre utilise par lalgorithme de placement).
Pour cela le mode dactivit suivant est considr : Mode dactivit
-
22
Niveau dinteraction Condition 3 2 1
n3>1 & n2>2 A 1 I n3>1 & n22 A 1 1 n31 &
n2>2 A a 1 n31 & n22 A a A
n3, n2 : nombre datomes interagissant du 3me et 2me niveau ; a :
active ; 1 : moins active ; i : non active. Construction du
complexe
Le processus de la construction incrmentielle commence juste
aprs avoir plac le fragment de base [6].
Cette technique est reprsente par un arbre technique
arborescente (figure 4) o chaque point reprsente une position ou un
placement dune partie du ligand [6]. Dans le premier niveau de cet
arbre, on trouve les diffrentes positions du fragment de base,
chaque niveau suivant contient des positions alternatives pour les
autres fragments du ligand.
Lordre selon lequel sont ajouts les fragments reste constant
durant toute la construction. Sil y a plusieurs possibilits, le
fragment qui forme une liaison hydrogne ou ionique est ajout en
premier puisquelles sont les plus restrictives gomtriquement. Le
but de cette technique est de trouver toutes les positions
(placements) qui ont une nergie libre favorable telle quelle est
estime par la fonction de score. La taille de cet arbre augmente
exponentiellement avec le degr de libert du ligand. Cette approche
est utilise car elle vite les minima locaux.
Figure 4. Construction incrmentielle du complexe protine-ligand.
Les placements qui vont tre pris en considration dans la
prochaine
itration sont reprsents en noir.
-
23
4.1.3. Fonction de score 4.1.3.1. Gnralits La prdiction de la
conformation du ligand dans le site actif de la protine est le plus
grand dfi du design des drogues bas sur la structure. Le rle des
algorithmes de docking dsigns excuter cette tche est divis en deux
parties essentielles :
- Trouver toutes les conformations, translations, rotations du
ligand dans le site actif de la protine en un temps dexcution trs
petit.
- Calculer lnergie utilise pour valuer les interactions entre la
protine et le ligand, et classer les solutions [41,42,43,44].
Donc le dfi est de trouver une fonction qui peut incorporer
toutes les contributions de lattachement.
Dans ce domaine plusieurs mthodes ont t dveloppes. Les mthodes
de champ de force calculent lnergie libre G dun complexe
protine-ligand en utilisant les fonctions dveloppes pour
laffinement de la structure 3D et les mthodes de la dynamique
molculaire.
Parmi ces mthodes :
- La mthode de perturbation de lnergie libre (FEP) [45,46]. -
Lapproximation des rponses linaires (LRA) avec FEP ou les mthodes
semi microscopiques [47,48]. - Discretized continuum (DC) [49].
Toutes ces mthodes sont capables de calculer lnergie libre avec
une erreur de lordre de 1 4 logKi . Ces mthodes ne peuvent pas
donner une prdiction exacte puisquelles dpendent de plusieurs
paramtres :
- La constante dilectrique dans DC. - Les coefficients massiques
de Van Der Waals dans LRA.
Cest pour cela que des fonctions empiriques scoring function
sont utilises [6,38,39,50].
4.1.3.2. La fonction de score
Les fonctions de score sont bases sur le modle qui inclue toutes
les proprits physico-chimiques de linteraction protine-ligand et
les convertit en termes calculables pour trouver la constante
daffinit du complexe protineligand (la structure du complexe 3D
tant connue). La fonction utilise dans FlexX est celle de Hans
Joachim Bhm modifie [6,38,51].
Cette fonction contient des termes additifs des nergies des
liaisons hydrogne, des interactions ioniques, des contacts
lipophiliques et dentropie du ligand (la flexibilit du ligand), le
score est une estimation directe du G : lnergie libre du complexe
protine-ligand [6,51,52].
Cette approche a prsent beaucoup davantages par rapport aux
autres fonctions :
-
24
- Elle peut tre applique mme dans le cas o il y a des
incertitudes dans la
structure cristalline de la protine. - Elle reprsente toutes les
contributions entropiques de laffinit de la liaison.
Lquation utilise est la suivante : Equation 1
G=G0+GrotNrot+Ghbliaison H f(R,)+Giocontact ionique f(R,)
+Garof(R,)+Glipocont lipo f*(R)
Le terme f(R,) est une fonction de pnalit qui sert calculer la
dviation de la gomtrie par rapport la gomtrie idale.
Dans le cas de la liaison hydrogne, R est la variation de la
distance de la liaison H---O/N par rapport sa valeur idale qui est
gale 1.9 A. est la dviation de langle N/O-H-----O/N de sa valeur
qui est de 180. En gnral cette dviation est ajuste par les valeurs
suivantes :
f(R,)=f1(R)f2()
1 R0.2 f1(R)= 1-(R-0.2)/0.4 R0.6
0 R>0.6
1 30
f2()= 1-(-30)/50 80
0 >80
f*(R) est un terme en plus dans la fonction que nous avons
utilis. Il ajuste les contacts dont les distances diffrent de la
distance idale. R= R-R0 dont R est la distance entre deux centres
dinteraction. R0 est la distance idale (cest la somme des rayons de
Van Der Waals des deux atomes) [6]. 0 R>0.6 1-(R-0.2)/0.4
0.2A
-
25
f*(R)= 1 -0.2A
-
26
la diffrence de la recherche incrmentale de Dock il ny a pas de
recherche systmatique des angles de torsion mais une tape de
minimisation entre chaque ajout de fragment.
- la deuxime mthode dite molcule entire reprend la mme tape de
fractionnement que prcdemment. Le changement se fait au niveau des
fragments du ligand conservs. Dans la mthode Hammerhead ne sont
conservs pour ltape de Docking que les meilleurs fragments qui
salignent avec ceux de la pseudo-molcule. Ici tous les fragments
sont pris en compte pour la recherche de configuration optimale du
ligand.
Ainsi le rsultat des configurations retenues pour sapparier avec
le ligand contient des molcules proches de lalignement initial du
ligand qui ont t localement modifies par le processus de
fragmentation. Les fragments de ces configurations sont valus puis
une tape de slection et de fusion des meilleurs fragments entre
configurations permet dobtenir un conformre global. Cette deuxime
mthode se montre beaucoup plus rapide que la mthode Hammerhead pour
des rsultats au moins quivalents.
Dans la version de Surflex que nous avons utilise (version 1.3),
il sagit de la mthode par dfaut.
Pour lutilisateur, lemploi du logiciel passe par trois tapes
:
- Choisir de quelle manire dfinir le site actif, soit partir dun
ligand soit partir du rcepteur.
- Construire la pseudo-molcule qui sera la cible de la recherche
de similarit.
- Enfin lancer le processus de Docking.
Le rsultat est donn sous la forme des 10 meilleurs conformres au
format mol2. Chaque fichier possde trois scores : le premier
daffinit ; le second correspond au degr de pntration impropre du
ligand dans la protine appelcrash score, plus ce score est proche
de 0 plus linteraction est favorable et le troisime ou polar score
correspond au niveau de contribution des interactions polaires.
Plusieurs options, rentrer en ligne de commande, permettent
dadapter le calcul suivant le nombre de torsions ou suivant lespace
conformationnel reprsenter avec la pseudo-molcule .
- CHAPITRE 2
METHODES DE SCORE OU ESTIMATION DE LENTHALPIE LIBRE
DINTERACTION
-
27
Les calculs sont effectus par la mthode de perturbation de
lenthalpie libre et celle de lintgration thermodynamique. Elles
utilisent toutes les deux un concept qui consiste perturber
lgrement le complexe et calculer la diffrence dnergie pas pas. Mais
dans la ralit, ce processus est trs coteux en temps de calcul.
Le besoin au cours dune simulation de Docking dobtenir un
rsultat rapide sans trop de perte de qualit conduit utiliser
dautres fonctions de score. Ces dernires doivent pour le moins
permettre de classer les diffrentes configurations ou ligands les
uns par rapport aux autres. Elles doivent, aussi, nous donner un
aperu du mode de fixation du ligand au rcepteur.
En comparant les scores calculs dans les mmes conditions il doit
tre possible de les utiliser pour comparer laffinit du ligand pour
diffrentes cibles [55]. Pour tre rapide les fonctions de score ne
peuvent calculer tous les termes entrant en jeu lors dinteractions
lectrostatiques. Le plus souvent ce sont les termes se rapportant
lentropie qui sont ngligs. Elles doivent, de plus, tre tolrantes
vis--vis des imprcisions engendres par le calcul. Toutes ces
restrictions expliquent le nombre lev de fonctions de score
disponibles [56-60]. Il nest pas actuellement possible de prvoir
quelle fonction de score employer en fonction du travail exig et
des molcules, seule lexprimentation permet de faire un choix
[60,61].
Les fonctions de score utilises peuvent tre classes en quatre
grandes catgories, nommes mthode semi-empirique, mthode empirique,
potentiels bass sur des donnes (knowledge-based), mthode base sur
le premier principe de la thermodynamique [62].
1. METHODES SEMI-EMPIRIQUES Les fonctions de score qui entrent
dans cette catgorie adoptent lide quil est
possible de faire une approximation de lnergie dinteraction sous
la forme dune combinaison linaire de termes empiriques et
quantiques. Il sagit le plus souvent dune approximation correcte
pourtant toutes les forces impliques dans la formation du complexe
ne sont pas additives.
La fonction de score du programme GOLD comporte trois termes :
un terme pour les liaisons hydrogne, un autre pour les interactions
de Van Der Waals, le dernier pour lnergie interne.
A lorigine cest un potentiel 6-12 qui a t utilis pour les
interactions de Van Der Waals et pour lnergie interne du ligand
[63].
Plus tard ce systme a volu pour attribuer un potentiel 4-8 aux
interactions de Van Der Waals [64].
Le terme de liaison hydrogne est bas sur des valeurs empiriques
obtenues partir de la force des liaisons entre diffrents types
datomes. Les valeurs des liaisons sont pondres en fonction de
langle et de la distance entre les atomes accepteurs et donneurs.
Lnergie totale calcule est une pondration de ces trois termes
[63].
2. METHODES EMPIRIQUES Les mthodes empiriques essaient destimer
lnergie dinteraction en runissant
de manire intuitive les termes que lexprience a dfini comme
fondamentaux. Classiquement ces termes regroupent les liaisons
hydrogne, les interactions
ioniques, la surface de contact ligand-rcepteur et les
contributions entropiques. Ces fonctions doivent autant que
possible quilibrer linfluence des deux forces principales que
-
28
sont les interactions ioniques et hydrophobes pour pouvoir
sappliquer au plus grand nombre.
Les diffrents termes sont pondrs par des valeurs obtenues par
ltude exprimentale de laffinit de structures ligand-rcepteur au
sein dun ensemble dapprentissage. La dcomposition de lnergie en
diffrents termes, bien que cela nait pas de base thorique, permet
un calcul rapide sans trop de perte de prcision. Nanmoins il existe
plusieurs dsavantages. En premier, il est difficile de savoir quel
terme est prendre en compte exactement suivant le modle, et
comprendre do peuvent survenir les erreurs. Deuximement, la
prdiction de lenthalpie libre est correcte si les molcules en jeu
suivent un processus dinteraction semblable celui de lensemble
dapprentissage. Il y a une dpendance vis--vis du modle au niveau
des valeurs de pondration. Troisimement, le pH, la concentration en
sel et la temprature peuvent influencer la mesure de la constante
daffinit de manire consquente. Pourtant ces conditions sont le plus
souvent ignores lors du calcul de lenthalpie libre partir de donnes
exprimentales. Ceci limite la prcision des prdictions faites partir
de ces valeurs. Afin dacclrer le calcul du score, des grilles de
score sont souvent prcalcules. La grille est applique sur le
rcepteur et chaque maille contient la rsultante des atomes
voisins.
La premire fonction de score dveloppe pour ltude de lenthalpie
libre dinteraction a t implmente dans LUDI [62]. Elle provient de
ltude de lenthalpie libre dinteraction sur 45 complexes dont la
constante daffinit a t publie. Lenthalpie libre est modlise partir
de lutilisation des ponts hydrogne, des ponts salin, de leffet
hydrophobe et dun terme reprsentant lentropie du solut (Equation
3).
Les termes des ponts hydrognes et salins sont accompagns dune
fonction de pnalit f(R,) pour tenir compte des importantes
dviations autour des valeurs idales de longueurs et dangles de ces
ponts.
Les interactions hydrophobes sont bases sur la surface
dinteraction hydrophobe entre le ligand et le rcepteur.
Le calcul de la perte dentropie du ligand lors de la formation
du complexe est bas sur le nombre dangles de torsion NROT.
Le terme Go prend en compte les pertes dentropie lies aux
translations et rotations. Le modle prsent ici a t amlior par la
suite pour mieux prendre en compte les ponts hydrognes et
salins.
Dautres termes ont t ajouts pour les rpulsions lectrostatiques
longue distance, les interactions - dans les cycles aromatiques
[27]. Cest le type de fonction utilise par FlexX.
3. POTENTIELS BASES SUR DES CONNAISSANCES
Ils drivent de donnes statistiques obtenues par lanalyse
exprimentale des
frquences dinteraction entre atomes au sein de complexes
protine-ligand. Cette drivation de fonctions dnergie depuis des
donnes exprimentales en
utilisant les concepts de la mcanique statistique est base sur
deux principes fondamentaux.
-
29
En premier il est admis que le complexe protine-ligand est dans
un tat thermodynamique dquilibre et que cet tat reprsente le
minimum global denthalpie libre du complexe.
Deuximement, la distribution des molcules ltat microscopique
obit la loi de Boltzmann. Il existe donc une corrlation entre
lnergie potentielle dun systme et la probabilit de trouver une
molcule ou un complexe dans un tat microscopique donn. Si ces
frquences sont converties en enthalpie libre grce une distribution
de Boltzmann, les potentiels sont nomms potentiels de force moyenne
(potential of mean force : PMF).
Le PMF a t en premier employ pour les simulations de repliements
de protines et ensuite pour celles dinteractions protine-ligand
[65,66]. Mais, alors que pour les processus de repliement seul un
ou deux points par aminoacide sont pris en compte, les simulations
dinteraction requirent le calcul de tous les atomes.
La principale diffrence avec les potentiels empiriques est
quaucune donne dinteraction de type pont hydrogne, lectrostatique
ou de solvatation nest ncessaire : les forces mises en jeu sont
incorpores de manire implicite. Ce type de fonction est gnralement
plus tolrant pour les imprcisions des complexes. Pour la
construction du PMF il y a deux aspects importants. En premier
lieu, la dfinition de ltat de rfrence. Celui-ci correspond ltat
dans lequel la protine et le ligand ninteragissent pas entre eux.
Des approximations sont souvent faites ce niveau car il nest pas
toujours possible dobtenir des structures non lies des complexes
qui servent de rfrence. Dans ce cas ltat de rfrence est donn partir
dune valeur spcifique empirique ou dun potentiel moyen calcul
partir de toutes les donnes disponibles et avec une correction
approprie. Le deuxime point important est la manire dont sont
collectes les statistiques dinteraction. Le plus souvent elles
doivent tre dpendantes de la distance et permettre de bien
dissocier ltat entre deux atomes o linteraction existe et ltat o
elle nexiste pas ou plus. Il est possible de distinguer deux types
dapproche pour la prise en compte des distances et des
interactions. Une approche grossire, rudimentaire consiste prendre
une distance limite et considrer quen dessous de cette distance il
y a interaction et au-del quil ny a plus dinteraction. Une approche
fine value le potentiel de manire continue sur la distance
interatomique ; pour rduire ces calculs il peut exister une
distance limite au-del de laquelle les interactions sont considres
comme ngligeables. Le fait que les forces soient incluses de manire
implicite dans le potentiel rend difficile lidentification des
problmes dus une mauvaise reproduction des valeurs exprimentales.
Nanmoins pour le PMF il apparat quil minimise les effets du
solvant.
Comme dans le cas empirique ces fonctions sont dpendantes de
leurs groupes dapprentissage. Elles ne peuvent modliser que les
interactions qui existent dans les exemples fournis pour leur
laboration. Et pour ces interactions elles ne reconnaissent que
celles qui ne dvient pas trop de leur modle.
Les diffrents potentiels varient suivant les types datomes
dfinis, la nature et la taille des donnes exprimentales utilises,
lchelle des distances inter atomiques parcourues et la varit de
celles-ci.
Lun des potentiels les plus simples est le PLP (Piecewise Linear
Potential) [67]. Il est bas sur la dfinition de quatre types
datomes et prend en compte les interactions striques et les ponts
hydrogne. Un potentiel de torsion calcule lnergie interne du
ligand. Le terme des ponts hydrogne a t ensuite modifi pour y
inclure une valeur dangle [68].
SMoG96 (Small Molecule Growth) est un PMF utilis pour la
conception de novo de ligand [69]. Il a t obtenu partir de 126
structures issues de la PDB avec comme but un rsultat rapide. De ce
fait son potentiel est assez grossier. Les distances atomiques sont
prises en compte en dessous de 5 angstrms. Ltat de rfrence est
dfini comme
-
30
un complexe entre le ligand et la protine placs au hasard et qui
ninteragissent pas. Le potentiel de rfrence est une moyenne des
potentiels de chaque type datome. Une mise jour, nomme SMoG2001 a t
faite partir de 725 complexes en modifiant la procdure de
traitement des paires datomes. Dans la dernire version, chaque
paire datomes conduit deux potentiels de distance diffrents
[70].
BLEEP (Biomolecular Ligand Energy Evaluation Protocol) comporte
2 potentiels (BLEEP-1 et BLEEP-2) [71]. BLEEP-1 est driv dun
ensemble de 351 structures de complexes non-homologues issus de la
PDB et ne contient pas de terme pour les interactions
ligand-solvant. BLEEP-2 est driv de 188 structures de la PDB et
prend en compte les interactions avec leau. Dans les deux cas, il
sagit de potentiels fins dont la distance limite des interactions
est de 8 angstrms. De plus, des potentiels pour les paires datomes
mtalliques ont t drivs de ltude de 198 structures de la PDB. A
linverse de beaucoup de potentiels bass sur des donnes, BLEEP ne
fait pas de distinction entre les types datomes du ligand et de la
protine. Il faut noter que BLEEP-2 se montre plus performant que
BLEEP-1 [72].
4. POTENTIELS BASES SUR LE PREMIER PRINCIPE DE LA
THERMODYNAMIQUE
Dans ce cas lentropie est considre comme ngligeable. Ces mthodes
estiment
la diffrence denthalpie dinteraction dun complexe en
additionnant les contributions individuelles des diffrents types
dinteractions.
Chaque terme est driv de la chimie ou de la physique thorique et
non pas comme prcdemment dune adaptation de donnes
exprimentales.
Les potentiels obissant au premier principe de la
thermodynamique se basent sur les termes des fonctions des champs
de forces. Dans la plupart des cas lnergie interne du ligand nest
pas prise en compte. Ce manque conduit la plupart des fonctions
surestimer la diffrence denthalpie quelles calculent par rapport
aux rsultats exprimentaux. Le calcul des interactions solvant-solut
seffectue laide dun solvant implicite. Dock et AutoDock possdent
des fonctions de score qui utilisent les termes de Coulomb et de
Van Der Waals du champ de forces AMBER [73].
- CHAPITRE 3 -
LA PEPTIDE DEFORMYLASE
1. GENERALITES
-
31
La disponibilit des squences du gnome microbien, dbutant en
1995, a jou un rle important dans le programme de dcouverte de
mdicaments antibactriens en industrie pharmaceutique. Bien que les
gnomes microbiens aient rvl une abondance de cibles potentiellement
intressantes, peu ont rsult de ce grand effort. Au contraire, la
plupart des agents antibactriens rcemment dcouverts et ciblant des
enzymes connues ont t identifis par des mthodes biologiques
traditionnelles. Par exemple, il y a quelques annes une cible a
retenu lattention des chercheurs, cest la peptide dformylase
bactrienne (PDF, EC 3.5.1.31) [42me et 44me meetings de lICAAC
(Interscience Conference on Antimicrobial Agents and Chemotherapy )
aux USA].
Effectivement, les inhibiteurs de la peptide dformylase
bactrienne occupent une place trs importante dans la recherche de
nouveaux agents antibactriens pendant trois annes conscutives. Le
processus de la synthse protique chez les bactries et chez les
mammifres est semblable. Les deux utilisent les mmes aminoacides et
codons et ont le mme mcanisme pour llongation. Lunique diffrence
entre la synthse protique bactrienne et la synthse protique
cytoplasmique chez les mammifres est lutilisation du
N-formylmethionine comme initiateur pour le processus bactrien
(figure 5) [74,75].
Tandis que la synthse cytosolique chez les mammifres est initie
par une mthionine. Le N-formylmethionine est gnr par
transformylation enzymatique du methionyl-tRNA par la
formylmethionine tRNA transfrase (FMT) [76,77]. Le
N-formylmethionine des protines bactriennes naissantes est limin
par la suite par laction squentielle de la peptide dformylase et de
la mthionine aminopeptidase (MAP) pour fournir la protine mature
[76,78]. Ce cycle formylation-dformylation est retrouv chez toutes
les espces bactriennes tudies.
Figure 5. Synthse protique chez les bactries.
Bien que des squences homologues la PDF bactrienne aient t
identifies chez les Eucaryotes [79-82], la fonction exacte de ces
homologues nest pas claire et les donnes actuelles suggrent que
linhibition de ce processus chez les mammifres est trs faible sauf
si linhibiteur est utilis des concentrations trs leves, lequel
probablement guide vers dautres actions non spcifiques en plus de
linhibition de la PDF.
-
32
Les inhibiteurs spcifiques de la PDF nexhibent aucune
interfrence avec la croissance cellulaire chez les mammifres [83].
Cet effet spcifique bactrien de linhibition de la PDF dans la
synthse protique pourvoit une base rationnelle de slectivit,
faisant delle une cible attrayante pour la dcouverte de mdicaments
antibactriens.
Lactivit de la PDF a t rapporte pour la premire fois par Adams
en 1968 [84]. La PDF na t entirement caractrise quau dbut des annes
1990, quand le gne codant pour la PDF, le def a t clon [85] et la
PDF surproduite chez Escherichia coli [85,86]. La PDF bactrienne
utilise le Fe2+ comme lion mtallique catalytique [87-89].
Cependant, lion ferreux de la PDF est trs instable et, il est
rapidement et irrversiblement oxyd en ion ferrique lair libre,
rendant ainsi lenzyme inactive [90].
Heureusement, le fer peut tre remplac par le nickel in vitro,
entrainant ainsi une trs grande stabilit de lenzyme avec une faible
diminution de lactivit enzymatique [88]. Dans une synthse
bibliographique rcente, Giglione et al. [91] et Yuan et al. [92]
font ressortir les caractristiques biologiques de la PDF et son
aptitude comme cible pour la dcouverte de nouveaux mdicaments
antibactriens.
Clement et al. [93] ont pass en revue le potentiel des
inhibiteurs de la PDF constituer une nouvelle classe dantibiotiques
large spectre.
2. SOURCES DE LA PDF
2.1. PDFs bactriennes
Bien que lactivit de la PDF bactrienne ait t dcrite en premier
en 1968 [84], lincapacit de purifier cette enzyme a empch les
tentatives de sa caractrisation jusquau clonage du gne codant la
PDF, le def, en 1993 [78]. Depuis, les gnes def de plusieurs espces
bactriennes ont t clons et dans de nombreux cas surproduits. Le
tableau 3 rsume les premiers travaux sur les PDF des diffrentes
bactries.
Tableau 3. Les PDFs des diffrentes bactries daprs R. Jain et al.
(2005). 1st Author (Year) Bacteria Comments
Meinnel [96] (1995) E. coli Zn-PDF: First reported purified
bacterial PDF with
-
33
Zinc as catalytic metal ion
Rajagopalan [87] (1997) E. coli
Fe-PDF: First reported purified ferrous-containing PDF, with
much improved specific activity
Groche [88] (1998) E. coli
Ni-PDF: Identification of nickel ion as the surrogate for highly
active, and stable enzyme
Leiting [102] (1998) B. subtilis PDF overexpressed, no detailed
enzyme properties Reported
Rajagopalan [99] (2000) E. coli Co-PDF was suggested as the
surrogate for Fe2+-PDF
Margolis [103] (2001) S. pneumoniae Ni-PDF overexpressed, no
detailed enzyme properties reported
Baldwin [100] (2002) S. aureus Ni-PDF overexpressed, no detailed
enzyme properties reported
Li [104] (2002) L. interrogans Zn-PDF was purified
Guilloteau [101] (2002) B. stearothermophilus and P.
Aeruginosa
Ni-PDF overexpressed, no detailed enzyme properties reported
Smith [105] (2003) H. influenzae Ni-PDF purified
Les mthodes pour comparer lactivit des enzymes purifies sont
quelque peu confuses, particulirement, en termes de substrats
utiliss. La mthode la plus communment utilise est lessai du couple
enzymatique PDF/FDH [94] avec le formyl-Met-Ala-Ser (fMAS) comme
substrat, le formate libr sous laction de la PDF est oxyd par la
formate dshydrognase (FDH). Ceci rsulte de la rduction
stchiomtrique dune molcule de NAD+ en NADH, qui provoque
successivement une augmentation de labsorption 340 nm. Dans de
nombreux exemples, le formyl-Met-Ala (fMA) est utilis comme
substrat avec le couple PDF/FDH. Un autre substrat, le
formyl-Met-Leu-p-nitroanilide est utilis avec le couple enzymatique
PDF/aminopeptidase [95].
En 1993, le gne def de E.coli a t produit en quantit sufisante
pour la premire fois (chez E.coli) et la protine obtenue purifie
par une combinaison de mthodes chromatographiques : gel filtration,
changeuse danions,[78,96]. La protine purifie peut facilement
liminer le groupe formyle des diffrents substrats. Il a t trouv que
lactivit de lenzyme purifie tait sensible aux chlateurs du mtal
tels que la 1,10-phnanthroline et lacide thylne diamine ttraactique
(EDTA), et que la protine purifie contenait un ion Zn par
polypeptide.
La squence de la PDF de E.coli a t dtermine et un motif de
liaison au Zinc caractristique des mtallopeptidases reconnu, HEXXH.
Meinnel et al (1995) ont conclu que la PDF appartenait la
superfamille des Zinc hydrolases [96]. Cependant lenzyme purifie
avait une activit relativement faible avec un rapport kcat / Km =
83 M-1 sec-1 en utilisant le fMAS comme substrat.
La PDF Zinc de E.coli a t galement purifie, elle prsentait une
plus grande activit avec le mme substrat (kcat / Km = 294 M-1
sec-1) [97]. En 1997, Rajagopalan et al.
-
34
taient les premiers rapporter que la PDF de E.coli contenant le
fer pouvait tre la forme de lenzyme physiologiquement la plus
intressante. Lenzyme fer purifie est instable et perd rapidement
son activit au contact de lair par loxydation de son fer en ion
ferrique [90]. Lenzyme fer est environ 100 fois plus active que
celle zinc. Cependant la PDF-Fe de E.coli sest avre trs difficile
utiliser en routine pour la caractrisation de lenzyme.
Plus tard le nickel a t utilis pour remplacer le fer afin de
produire une enzyme hautement active et stable [88,98].
Alternativement, la PDF cobalt a galement t utilise comme substitut
actif et stable de lenzyme [99]. Cependant, des tudes rcentes ont
montr que la PDF fer de S. aureus peut maintenir son activit
pendant plusieurs mois [100].
Actuellement, la PDF nickel est utilise pour des tudes
structurales et lvaluation du potentiel de divers inhibiteurs.
Depuis la dcouverte que les PDF, dont le fer a t substitu par le
nickel ou le cobalt, avaient une activit quivalente celle de
lenzyme naissante, plusieurs laboratoires ont utilis ces
substitutions pour une surproduction et une purification des
protines dformylases. Actuellement, les dformylases ont t
surproduites et purifies partir de sept diffrentes espces
bactriennes au moins. Sur la base des squences publies du gnome
bactrien, deux types de protines PDF ont t dfinis : Type I et Type
II [101]. Les gnes def de Escherichia coli et Pseudomonas
aeruginosa, qui codent pour les PDF de Type I, et ceux de
Staphylococcus aureus et Bacillus stearothermophilus, qui codent
pour les PDF de Type II, ont t clons et surexprims pour une tude
comparative de la structure des deux types de PDF.
2.2. PDFs des parasites
Peu de travaux sur les PDFs des parasites ont t effectus. Six
maladies tropicales majeures, malaria, filariasis, schistosomiasis,
trypanosomiasis Aftricaine, maladie des Chagas et leishmaniasis,
entranent ensemble plus dun million de morts chaque anne et causent
dnormes souffrances plusieurs centaines de millions de personnes
[106-108]web. La rsistance aux traitements actuellement utiliss
contre la plupart des agents causant ces maladies est manifestement
en augmentation et de nouveaux remdes sont requis sous peu. La PDF
est indispensable chez les eubactries mais pas chez les humains.
Sachant que la plupart des organismes responsables de ces maladies
possdent la PDF, la recherche des inhibiteurs de cette enzyme
constitue une voie trs prometteuse pour lavenir.
- Apicomplexa
A ce jour, Plasmodium falciparum est la seule espce du groupe
dont la PDF a t dcrite [109]. Connaissant la grande conservation
des squences de lapicoplaste, il existe probablement une squence
unique pour toutes les PDF des Apicomplexa. Aucune preuve directe
na t fournie concernant la localisation de la PDF de P. falciparum
dans lapicoplaste. Cependant, la squence en aminoacides de cette
PDF ressemble celle de la PDF des chloroplastes et elle est classe
dans la mme branche que les PDF des chloroplastes des plantes dans
larbre phylogntique des PDFs (Fig 2). Une dmonstration rcente que
les PDFs des chloroplastes sont systmatiquement cibles au niveau
des plastes des plantes suggre fortement que la PDF de P.
falciparum est situe au niveau de lapicoplaste [110].
-
35
- Trypanosomes
Les trypanosomes causent de nombreuses maladies parasitaires
graves. La plus clbre est la trypanosomiase Africaine ou la maladie
du sommeil, qui est transmise par la mouche Tsts. Cette maladie est
rapparue et constitue le problme de sant majeur dans lAfrique
sub-saharienne. La maladie du sommeil recouvre actuellement deux
maladies distinctes avec des signes cliniques diffrents chez les
humains selon la rgion de lpidmie. Deux trypanosomes diffrents en
sont responsables :Trypanosoma brucei gambiense (nord ouest de
lAfrique) et T. brucei rhodesiense (sud est de lAfrique). La
maladie de Chaga est une autre maladie majeure cause par un
trypanosome, Trypanosoma cruzi, dans le sud de lAmrique. La
Leishmaniose est cause par Leishmania major et transmise par les
phlbotomes. Lorigine, la localisation et la fonction des deux PDFs
des trypanosomes sont inconnues. Il a t dmontr que la N-formylation
des protines est strictement requise dans les deux types
dorganites, les plastes (Leishmania) et les mitochondries (L. major
and Trypanosoma). Certains de ces protistes sont photosynthtiques
(Euglena gracilis) et dautres non (Astasia longa) [111].
- Autres parasites
Lamibe D. discoideum possde une PDF qui est vraisemblablement
situe dans sa mitochondrie [110]. Le gnome mitochondrial de cette
espce code un grand nombre de protines (> 40). A cet gard, il
ressemble troitement au gnome des mitochondries des plantes, dans
lesquelles la PDF est connue pour tre fonctionnelle. Le gnome
mitochondrial de Acanthamoeba castellanii [112] code un nombre
similaire de gnes et, sur la base du mme raisonnement dcrit plus
haut, possde vraisemblablement une PDF. Cette amibe est responsable
de plusieurs infections opportunistes chez lhomme. Il est galement
possible que dautres parasites humains troitement apparents, telle
lespce Entamoeba (responsable de plusieurs maladies intestinales),
possdent une PDF qui serait sensible aux mdicaments anti-PDF.
Aucune squence de PDF na t dtecte dans le gnome du nmatode C.
elegans. Ceci suggre que les nmatodes responsables de la filariose,
comme Brugia malayi, ne soient pas sensibles aux drogues anti-PDF.
De la mme faon, bien que lon connaisse peu de choses sur le nombre
de gnes des mitochondries de lespce Shistosoma [113,114], le gnome
mitochondrial dun autre membre apparent des Platyhelminthes, le
turbellari Echinococcus multilocularis [115]web, contient un nombre
similaire de gnes que C. elegans. Cest pourquoi, ces parasites ne
sont probablement pas sensibles aux mdicaments anti-PDF.
3. STRUCTURE DE LA PEPTIDE DEFORMYLASE BACTERIENNE La plupart
des structures obtenues sont disponibles via la Protein Data
Bank
[15], le nombre de structures dune mme molcule avec ou sans
ligand permet davoir une information pertinente. Nanmoins certains
cas restent difficiles.
-
36
La structure tridimensionnelle de la PDF despces bactriennes
varies a t dtermine. En plus des structures de lenzyme libre,
plusieurs structures de complexes enzyme-inhibiteur ont t rsolues.
Nous retrouvons dans le tableau 4 la liste des diffrentes
structures publies ; Sans aucun doute cette liste continuera
croitre.
La structure de la PDF de E. coli contenant du zinc a t
initialement rsolue par la RMN en 1996 [116] et par
cristallographie aux rayons X en 1997 [117]. La ralisation que la
PDF contenant du fer est la forme physiologique de lenzyme, a dirig
leffort rsoudre la structure 3-D de la Fe-PDF dans lespoir
didentifier les facteurs qui font que cette forme de lenzyme est
plus active que celle contenant du zinc. La premire structure
cristalline de la PDF contenant du nickel (Ni-PDF) de E. coli a t
rsolue immdiatement aprs la dcouverte que le nickel peut remplacer
le fer tout en maintenant intacte lactivit de lenzyme [118].
Ultrieurement, les structures de la PDF de E. coli comportant
divers mtaux ont t rsolues par RMN [119] ou par cristallographie
aux rayons X [98]. Des structures de la PDF de E. coli
cocristallises avec les produits de la raction du tripeptide
Met-Ala-Ser [98] et linhibiteur actinonin [120] ont t, galement,
rsolues.
Plusieurs laboratoires ont publi des Ni-PDF de E. coli
cocristallises avec des inhibiteurs synthtiques de la PDF tels que
le N-alkyl hydroxamate dure [121], le sulfonylhydroxamique acide
[122], les N-formyl hydroxylamine peptidiques [120] et les
inhibiteurs non peptidiques de la PDF [105].
Rcemment, les structures des PDFs de S. aureus [100,101], B.
stearothermophilus [101], et P. aeruginosa [101] complexes
linhibiteur naturel, lactinonin, ont t rsolues. Ces structures, en
mme temps que la modlisation, fournissent une plateforme trs utile
pour la conception des inhibiteurs futurs de la PDF.
Tableau 4. Travaux raliss sur les structures tridimensionnelles
de diverses PDFs daprs R. Jain et al. (2005)
-
37
Une vue gnrale de la structure tridimensionnelle de la PDF de E.
coli est
prsente dans la figure 6.
1st Author (Year) Type of PDF Used in the study Comments
Meinnel [116] (1996) E. coli Zn-PDF First attempt to solve PDF
structure by solution NMR.
Chan [117] (1997) E. coli Zn-PDF First published 3-D PDF
structure solved by X-ray crystallography.
Becker [118] (1998) E. coli Ni-PDF, crystal structure First
Ni-PDF structure.
Becker [98] (1998) E. coli Fe-, Ni-, and Zn-PDF or with MAS.
Defined S1 pocket
Dardel [119] (1998) E. coli Ni-PDF.
Solution structures of Zn- and Ni-PDF, suggesting that the
difference in catalytic Power resulting from the nature of the
metal.
Apfel [122] (2000) E. coli Ni-PDF with beta-sulfonylhydroxamic
acid Structure of PDF-synthetic inhibitor complex
Clements [120] (2001) E. coli Ni-PDF, with inhibitors
Structures of PDF complexes with actinonin and N-formyl
hydroxylamine inhibitor BB-3479
Hackbarth [121] (2002) E. coli Ni-PDF complexed with
inhibitors
Structure of PDF complexes with VRC4307, an N-alkyl urea
hydroxamate inhibitor.
Guilloteau [101] (2002)
PDFs from E. coli, S. aureus, B. stearothermophilus, and P.
aeruginosa.
Extensive comparison of these PDFs and their complexes with
actinonin.
Baldwin [100] (2002) S. aureus His-tagged Fe-PDF X-ray crystal
structure of S. aureus ferrous-PDF
Smith [105] (2003) PDFs from E. coli, S. aureus, H. influenzae
and S. pneunominae.
X-ray crystal structures of PDF from these organisms. It also
describes complex Structure of nonpeptidic inhibitor with PDFs from
E. coli and S. pneunominae .
-
38
Figure 6. Figure en ruban de la structure de la peptide
dformylase de E. coli. Les rgions de lhlice sont montres en bleu,
les feuillets- en rouge, et le reste en vert. Les atomes au niveau
du centre du mtal sont colors par lment, avec le carbone en gris,
lazote en bleu, loxygne en rouge, le soufre en jaune, le phosphore
en magenta et lion mtallique en vert ; daprs M. K. Chan et al.
(1997).
En rsum, La PDF de E. coli contient trois -hlices, trois
feuillets et une hlice 3-10 critique. Le mtal du site actif est li
de manire ttradrique Cys-90, His-132, His-136 et une molcule deau
[116,117], mais la gomtrie globale du ttradre nest pas rgulire
[98]. Lanalyse structurale des PDFs dautres espces rvle quelles
adoptent, elles aussi, la mme conformation [101]. Lenvironnement
autour du mtal au niveau du site actif prsente de grandes
similitudes chimiques et gomtriques que les protases de la famille
des thermolysines [117,119]. Cependant, la PDF est manifestement
diffrente des autres protases zinc qui possdent le motif conserv de
liaison au mtal HEXXH. La distinction la plus saisissante est que
le troisime ligand du mtal est une cystine, au lieu dun glutamate
ou dune histidine comme dans la thermolysine et les mtalloprotases
de la matrice. Le Glutamate-133, proche de la liaison mtal-eau,
joue probablement un rle crucial dans la protonation et la
dprotonation des intermdiaires de la raction durant la catalyse
[98,117]. Ce mcanisme catalytique est suppos ressembler celui de la
famille des thermolysines. Une autre caractristique importante de
la structure de la PDF est que laminoacide Gln-50, lequel est
conserv dans les diffrentes PDFs comme rsidu central dans lhlice
3-10, est impliqu dans une liaison hydrogne avec leau lie au mtal.
Ce rsidu glutamine peut galement jouer un rle important dans la
protonation-dprotonation des intermdiaires de la raction durant
lhydrolyse du groupement N-formyle [117]. La comparaison des
liaisons de la PDF avec des ions mtalliques varis rvle que les
structures des Ni-PDF et Fe-PDF sont trs similaires celle de la
Zn-PDF. Par exemple, dans la Ni-PDF, lion nickel du site actif est
li His-132, His-136, Cys-90, et une molcule deau en formant un
ttradre, tel quobserv dans lenzyme zinc. Un ensemble de liaisons
hydrogne impliquant les aminoacides conservs des PDFs est
manifestement identifi et est apparemment partag par les trois
formes de lenzyme. Malheureusement, la comparaison entre ces trois
formes de PDF, lenzyme pure [119], lenzyme complexe avec le MAS
(Met-Ala-Ser) [98] ou avec
-
39
lactinonin [101], ne rvle pas dexplication claire concernant la
diffrence dans lefficacit catalytique de la fer-PDF ou de la
nickel-PDF par rapport la zinc-PDF. Labsence dune quelconque
diffrence structurale de ces diverses formes de PDF suggre que la
diffrence dans lefficacit de lenzyme est vraisemblablement due la
nature chimique des ions mtalliques [119].
Guilloteau et al. (2002) ont montr, tandis que toutes les
structures du site actif des PDFs de diffrentes bactries taient
similaires, qu il y a quelques distinctions structurales entre les
PDFs de type I et de type II [101]. En gnral, les PDFs de type I de
E. coli et P. aeruginosa se ressemblent beaucoup entre-elles, tout
comme les PDFs de type II de S. aureus et B. stearothermophilus.
Cependant, le C-terminal de lhlice trouv dans les PDF de type I est
remplac dans le type II par une boucle, suivie dun petit brin . La
signification de cette diffrence nest pas claire, du moment que les
quatre protines catalysent la mme raction avec une efficacit
similaire, et leur liaison lactinonin est quasiment identique.
Baldwin et al. ont observ que la Fe-PDF de type II (S. aureus)
pouvait retenir son activit catalytique pendant plusieurs mois,
tandis que celle de type I (E. coli ) qui lui correspond tait
extrmement instable [100]. Il ny a pas dexplication structurale
pour cette diffrence dans la stabilit.
La structure du complexe enzyme-MAS rvle que la chane du
substrat, du ct de la mthionine, sincruste soigneusement dans la
poche S1, qui est une poche hydrophobe forme par Ile-44, Ile-86,
Glu-88, Leu-125, Ile-128, Cys-129 et His-132 [98]. Des tudes de
modlisation molculaire suggrent que la phnylalanine peut galement
sajuster dans cette poche hydrophobe S1. La comparaison des
structures des PDFs de diffrentes espces bactriennes [101] suggre
que la poche S1 garde la mme forme dans toutes les enzymes, bien
que diffrents rsidus revtissent la poche dans chaque cas. Les PDF
de toutes les espces bactriennes ayant besoin dliminer le
groupement formyle, il ny a pas de surprise ce que toutes ces
enzymes aient une poche similaire pour recevoir la chane latrale de
la mthionine. La composition de la poche S1 a t confirme davantage
par les structures des complexes PDFs-inhibiteurs
[116,123,124].
Les poches S2 et S3 ne sont pas bien dfinies. Toutes les PDFs
ont en commun les rsidus Glu-88 et Gly-89 au niveau du site S2
[101], mais dans les structures 3-D, la poche S2 des PDF de type I
est lgrement plus vaste que celle des PDF de type II. Les rsidus
daminoacides formant le revtement de la cavit S2 diffrent selon les
espces, mais la nature chimique de la totalit de la cavit demeure
la mme pour toutes les PDs. Au contraire, les cavits S3 des PDF de
diffrentes espces, prsentent une grande variation avec des
diffrences qui altrent la forme et la nature chimique de la poche
[101]. Le degr variable de conservation de la structure au niveau
des poches de liaison avec le substrat peut permettre la
diffrenciation entre les inhibiteurs spcifiques et les inhibiteurs
large spectre. Il est probable que les inhibiteurs large spectre
pourraient tre dsigns condition que lnergie de liaison provienne
principalement des interactions avec des sites invariables des
poches de liaison, tandis que les inhibiteurs spcifiques certaines
espces pourraient rsulter dune focalisation sur les interactions
avec des domaines variables. Une autre considration dans la
conception des inhibiteurs de la PDF est le problme de
rsistance.
Les structures 3-D des PDFs complexes avec des inhibiteurs
synthtiques fournissent dimportants renseignements. Comme prvu,
lion mtallique du site actif forme cinq liaisons avec les
inhibiteurs [120-122]. Le groupement hydroxamate forme des liaisons
hydrogne avec les chanes latrales de Glu-133 et Gln-50, confirmant
lhypothse que ces deux aminoacides sont impliqus dans la catalyse
[117]. La fonction NH de lIle-44 forme une liaison H avec le
carbonyle P2 des inhibiteurs [120,121]. Pour les inhibiteurs
peptidiques de la PDF, la chane latrale du rsidu P2 est
principalement
-
40
expose au solvant mais ralise galement des interactions de Van
Der Waals avec les chanes latrales des aminoacides de la cavit S2.
La partie P3 de linhibiteur est principalement accessible au
solvant [120].
Le centre actif de la PDF est plutt similaire celui des matrices
des mtalloprotines (MMPs) [119]. Cette similarit est davantage
confirme par le manque de slectivit de certains inhibiteurs de la
PDF [122]. Les acides -sulfonylhydroxamiques, composs possdant une
inhibition apprciable de la dformylase, inhibent galement les MMPs
avec la mme puissance. Au contraire, certains inhibiteurs nont
aucune action sur plusieurs autres types de mtalloprotases, telles
que les endopeptidases neutres. Cette similitude structurale avec
les MMPs implique une toxicit potentielle due une inhibition
indsirable de MMPs lors de lutilisation des inhibiteurs de la PDF
comme mdicaments antibactriens.
Cependant, depuis peu des diffrences significatives entre les
MMPs et les PDFs ont t dmontres, il serait donc possible de
concevoir des inhibiteurs de la PDF nayant aucun effet sur les MMPs
[121].
Finalement, les structures tridimensionnelles des PDFs seules et
de PDFs en complexes avec des inhibiteurs nous apprennent que la
conception des inhibiteurs de la PDF ncessite une maximisation de
la formation dun chlate avec le mtal du site actif et des
interactions de Van Der Waals au niveau de la cavit S1. Les poches
S2 et S3 de lenzyme sont relativement flexibles. Bien que ces sites
puissent encore fournir une nergie de liaison additionnelle, il
nest pas judicieux de fonder la majeure partie de lnergie autant de
sites, car ils sont sujets des mutations qui nentranent pas
forcment une diminution de lactivit enzymatique, laquelle pourrait
rsulter dune frquence de rsistance leve. Cependant, les ensembles
occupant les cavits S2 et S3 pourraient tre de bons endroits pour
gnrer des proprits physico-chimiques convenables dans les
inhibiteurs afin daccrotre leur pntration travers la membrane des
cellules bactriennes, pour fournir des proprits pharmacocintiques
correctes in vivo et rduire les problmes potentiels de toxicit.
Les inhibiteurs de la PDF, tels lactinonin, sont de puissants
inhibiteurs avec des valeurs de Ki de lordre du nanomolaire.
Nanmoins, la liaison de ces inhibiteurs avec la PDF ne provoque pas
un changement apprciable de la conformation dans la structure de la
protine [101,120].
4. CLASSIFICATION DES PDFS (ARBRE PHYLOGENETIQUE DES PDFs) A
partir des donnes de squences obtenues chez les bactries et partir
des
analyses des ensembles de dltions et dinsertions (appeles I1 et
I2 dans la figure 7) localises entre des lments de structures
secondaires identifis, il a t conclu que les PDFs peuvent tre
divises en deux classes majeures [93].
La classe I est reprsente par lenzyme de E. coli et
systmatiquement par les
PDFs de toutes les bactries Gram-ngatives (figure 8). La classe
II est reprsente par la PDF de Bacillus stearothermophilus et
contient
les PDFs des Mycoplasma et des bactries Gram-positives avec un
faible taux de G+C (GC %) (figure 8).
Cependant, si deux PDFs apparaissent dans une bactrie
Gram-positive, la seconde est souvent une enzyme appartenant la
classe I. Des PDFs homologues significativement diffrentes de ces
deux classes ont t trouves chez les bactries Gram-positives, ainsi
que chez des bactries Gram-positives faible GC %, tel que
-
41
Clostridium beijerinckii. Finalement, la squence complte du
gnome de lactinomycte Streptomyces coelicolor a rvl la prsence de
quatre gnes def. Ceci correspond au plus grand nombre de gnes de
PDF dtect chez le genre Eubactrium ce jour. Il est intressant de
remarquer quune des quatre PDFs de cet actinomycte (S. coelicolor
1/4 dans la figure 8) diverge de toutes les autres PDFs
connues.
Il a t rapport que les actinomyctes produisent naturellement une
molcule avec une activit anti-PDF, lactinonin. Nanmoins, les
actinomyctes sont eux-mmes rsistants lactinonin, probablement due
lacquisition dune PDF rsistante lactinonin. Ce qui pourrait
expliquer la prsence de ces diverses PDFs chez les actinomyctes.
Alternativement, une fonction autre que la dformylation classique
des polypeptides naissants peut expliquer lexistence dune PDF peu
ordinaire et la duplication des gnes def chez S. coelicolor.
-
42
Figure 7. Alignement des PDFs des protistes eucaryotes.
-
43
4.1. Les PDFs des Eucaryotes suprieurs
Lanalyse des squences produites, rcemment, de gnomes complets
de
plusieurs eucaryotes a tonnement rvl la prsence de PDFs
orthologues [93]. Par exemple, deux PDFs de la classe I ont t
identifies dans le gnome nuclaire de deux plantes monocotyldones et
dicotyldones en pleine floraison [110]. Une squence de la PDF a t
galement identifie dans le gnome de liverwort Marchantia
polymorpha. Ceci indique que les PDFs sont prsentes dans toutes les
plantes suprieures (Embryophyta). Ces enzymes diffrent des enzymes
eubactriennes car elles possdent des pr-squences N-terminales qui
ciblent des domaines catalytiques correspondant divers
compartiments de la cellule. Par consquent, les PDFs
mitochondriales des plantes (mPDFs) sont prises pour cibles au
niveau des mitochondries seulement, tandis que les PDFs des
chloroplastes (cpPDFs) sont les seules PDFs trouves dans les
plastes (figure 8) [110]. Les cpPDFs sont troitement apparentes aux
PDFs des cyanobactries (figure 8). Des orthologues des mPDFs ont t
identifies chez les insectes et dans les tissus de divers vertbrs
[110]. Tous les orthologues des PDFs danimaux ont des squences trs
similaires celles des mPDFs et drivent manifestement de la mme
branche de larbre phylogntique des PDFs (figure 8). La squence
bactrienne qui ressemble le plus celles des diverses mPDFs est la
PDF divergente de S.coelicolor (figure8).
4.2. Les PDFs des Eukaryotes infrieurs
Des PDFs ont t galement trouves dans les gnomes de protistes
varis. Une cpPDF (PDF des plastes) a t identifie chez lagent de la
malaria Plasmodium falciparum et semble tre prsente au niveau de
lapicoplaste [109,110]. Une PDF a t galement retrouve chez lamibe
Dictyostelium discoideum [110]. Cette PDF, probablement situe au
niveau de la mitochondrie, prsente beaucoup de ressemblance aux
PDFs de la classe II (Figure 8). Enfin, deux orthologues de PDFs
diffrents ont t trouvs chez les kinetoplastes, Trypanosoma sp. et
Leishmania major (Figure 8) [109]. Ces PDFs sont manifestement
diffrentes des PDFs de classe I et II et sont proposes pour tre
classes dans une nouvelle classe, la classe III.
4.3. Les PDFs orthologues des Archae
PSI-BLAST [125] est actuellement reconnu pour tre un outil
puissant pour lidentification de squences biologiquement
similaires. Ce programme a permis rcemment didentifier pour la
premire fois deux nouvelles squences chez les Archaea prsentant une
grande similitude aux PDFs (figure7 et 8).
-
44
Figure 8. Arbre phylogntique des PDF daprs Giglione et Meinnel
(2001) Figure 8. Arbre phylogntique des PDF daprs Giglione et
Meinnel (2001)
Ces PDFs des Archaea ont t trouves chez les euryarchaeota
Methanothermobacter thermoautotrophicus (Genbank numro daccession
AE000809) et Methanothermus fervidus (Genbank numro daccession
CAA70987). Ces deux squences sapparentent troitement aux squences
trouves dans les kinetoplastes (les PDFs de la Classe III). Une
caractristique spcifique des PDFs des Archeae est lapparition dune
insertion distale entre les motifs 2 et 3 (Figure 8). Etant donne
lalternance des rsidus hydrophobiques et polaires dans cette
insertion, son seul effet est probablement une faible extension du
feuillet antiparallle loin du site actif. Nanmoins, il faut
souligner que le motif 1 est le seul faiblement conserv chez cette
espce.
Ainsi, il est clair que, contrairement ce qui est cru jusqu trs
rcemment, les orthologues des PDFs ne sont pas spcifiques aux
Eubactries, mais au contraire
-
45
apparaissent dans la plupart des branches de larbre phylogntique
des organismes vivants. Cependant certains organismes, tels que les
nmatodes, les moisissures et certaines Archeae, ne possdent pas
dorthologues de PDFs. Bien entendu, il est possible que ces
organismes aient une PDF avec un taux dhomologie en dessous du
seuil tolr par le programme BLAST, mais il est peu probable. En
effet, des recherches dans des bases de donnes diverses ont t
accomplies sans succs. Depuis, de nouvelles squences de gnomes
entiers seront disponibles dans les toutes prochaines annes, et il
serait intressant didentifier ces organismes qui ne contiennent pas
de PDF.
A partir de plus de 120 squences dorthologues de PDFs
disponibles dans les bases de donnes, 56 squences de PDFs ont t
slectionnes pour reprsenter la diversit des squences de cette
enzyme. Les squences ont t alignes laide du logiciel "ClustalX" et
larbre gnalogique construit par "Tree-View1.6". Le nombre (1,2 ou
4) indique que la squence est une des deux (ou des quatre) espces
de PDF de cet organisme. cpPDF = pdf des plastes , mPDF = PDF des
mitochondries.
-
46
- CHAPITRE 4 -
INHIBITEURS DE LA PDF BACTERIENNE
1. RECHERCHE DE NOUVEAUX ANTIBACTERIENS
Bien que le nombre dantibiotiques soit trs grand, la diversit
des classes
chimiques quil reprsente est, cependant, limite et les mcanismes
de rsistance sont le plus souvent lis chaque classe dantibiotique.
Les nouvelles approches lgard de la recherche de nouveaux
antibiotiques prennent avantage pour de nouvelles cibles impliques
dans de nouveaux mcanismes dj explors dans la dcouverte de nouveaux
mdicaments et pour lesquels les mcanismes de rsistance ne se sont
pas largement dvelopps parmi les populations bactriennes.
Ainsi, parmi la plthore de nouvelles cibles potentielles,
plusieurs semblent mieux convenir au processus de dcouverte de
mdicaments, dans lequel elles rpondent des critres bien dfinis,
telle leur capacit des essais dactivit in vitro. Aujourdhui, la
recherche pharmaceutique de nouveaux antibiotiques implique une
purification prliminaire de la cible in vitro, lisolement
dinhibiteurs de plus ou moins faible affinit