Chikhi abdelouahab

1

Rpublique Algrienne Dmocratique et Populaire

MINISTERE DE LENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE

UNIVERSITE MENTOURI CONSTANTINE

FACULTE DES SCIENCES DE LA NATURE ET DE LA VIE

N dOrdre : 183/T.E/2007 N de Srie : 10/S.N/2007

THESE

EN VUE DE LOBTENTION DU DOPLME DE

DOCTORAT DETAT EN MICROBIOLOGIE

THEME

Prsente par CHIKHI ABDELOUAHAB

Soutenue le 30 Dcembre 2007 Devant le jury : Prsident : Mr DOUADI. KHELIFI Professeur Universit de Constantine Rapporteur : Mr MUSTAPHA BENCHARIF Professeur Universit de Constantine Examinateurs : Mr HAMID AIT AMAR Professeur U.S.T.H.B. Alger Mr ABDELHADI GUECHI Professeur Universit F. Abbas Stif Mr MESBAH LAHOUEL Matre de confrences Universit de Jijel

CALCULS ET MODELISATIONS DES INTERACTIONS PEPTIDE DEFORMYLASE

SUBSTANCES ANTIBACTERIENNES A LAIDE DE TECHNIQUES DE DOCKING

(ARRIMAGE) MOLECULAIRE

2

A ma mre

A mon pouse et mes enfants

toute ma famille

A mes amis

A la mmoire de mon regrett pre

3

Je tiens remercier :

_ Monsieur le Professeur Bencharif mustapha pour avoir dirig mes travaux, pour mavoir

accueilli dans son laboratoire et pour toute laide quil ma accorde.

_ Monsieur le Professeur Boulahrouf Abderrahmane pour son aide dans ce travail, ses

prcieux conseils et sa grande disponibilit.

_ Monsieur le Professeur Khelifi Douadi pour avoir accept la charge de prsider mon

jury.

_ Monsieur le Professeur At Amar Hamid qui ma fait lhonneur de participer mon jury.

_Monsieur le Professeur Guechi Abdelhadi qui a accept de juger mes travaux en

participant mon jury.

_Monsieur le Docteur Lahouel Mesbah qui ma fait lhonneur dassister mon jury et juger

mes travaux.

_ Monsieur le Professeur David Perahia pour laccueil quil ma rserv et pour le temps

quil ma consacr au niveau du laboratoire de biochimie et de biophysique molculaire et

cellulaire (Universit dOrsay, Paris-sud).

4

SOMMAIRE

- INTRODUCTION..8 - Chapitre 1 : Docking molculaire12

1. Principes12

1.1. Approche combinatoire12 1.2. Approche stochastique....12 1.3. Approche dterministe.13 2. Obtention des structures.14 3. Applications...14 4. Programmes utiliss....15 4.1. FlexX..15 4.1.1. Flexibilit conformationnelle du ligand...16 4.1.2. Interaction protine-ligand .17 4.1.2.1. La modlisation de linteraction..17 4.1.2.2. Les diffrentes tapes de docking..19 4.1.3. Fonction de score..22 4.1.3.1. Gnralits.22 4.1.3.2. La fonction de score..23 4.2. Surflex....24

- Chapitre 2 : Mthodes de score ou estimation de lenthalpie libre dinteraction26

1. Mthodes semi-empiriques...26 2. Mthodes empiriques....27 3. Potentiels bass sur des connaissances...28 4. bas sur le premier principe de la thermodynamique..29

- Chapitre 3 : La peptide dformylase30

1. Gnralits.30

2. Sources de la PDF...31 2.1. PDFs bactriennes.. 31

5

2.2. PDFs des parasites.........33 3. Structure de la peptide dformylase bactrienne..35 4. Classification des PDFs (arbre phylogntique des PDFs)39 4.1. Les PDFs des Eucaryotes suprieurs..42

4.2. Les PDFs des Eukaryotes infrieurs.42 4.3. Les PDFs orthologues des Archae42

- Chapitre 4 : Les inhibiteurs de la peptide dformylase.45

1. Recherche de nouveaux antibactriens..45 2. Les diffrentes classes dinhibiteurs.46

2.1. Gnralits.46 2.2. Inhibiteurs faible ou sans activit antibactrienne (Classe I)..47 2.3. Inhibiteurs possdant une activit antibactrienne (Classe II)..48 2.4. Inhibiteurs de la PDF actifs in vivo (Classe III)............49 2.5. Autres inhibiteurs de la PDF49

- Chapitre 5 : Matriel et mthodes.52 1. Banque de donnes des protines..........52 2. Tests dvaluation des programmes utiliss52 2.1. Prparation des molcules larrimage ...........52

2.2. Programmes utiliss..........52 2.2.1. Arguslab ...52 2.2.2. FlexX..53 2.2.3. Surflex54

3. Inhibition de la 1bsj ..55 3.1. Choix de la 1bsj..55 3.2. Rgle de Christopher A. Lipinski ...........55 3.3. Inhibition de la 1BSJ par divers inhibiteurs connus 56 4. Essais de modlisation56 4.1. Les Ligands et leurs similaires ..........56

4.2. Les mono et bi substitutions de lactinonin58 5. Etude comparative de lactivit inhibitrice de deux nouvelles classes de molcules non peptidiques, testes in vitro, avec lactinonin............59

5.1. Drivs de lacide isoxazole-3-hydroxamique...59 5.2. Composs agissant spcifiquement sur les PDF bactriennes (noyau indole et ses drivs)60

6

- Chapitre 6 : Rsultats ..65 1. Fiabilit des programmes utiliss.65 2. Inhibition de la 1bsj ....68

2.1. Rgle de Lipinski ...68 2.2. Inhibition de la PDF par les 5 composs connus.............68

3. Essais de modlisation.............73 3.1. Ligands et similaires..73

3.2. Substitutions effectues sur lactinonin...79 3.2.1. Mono substitutions.....79 3.2.2. Bi substitutions83

4. Etude comparative par Surflex de lactivit inhibitrice de deux nouvelles classes de molcules non peptidiques testes in vitro ....88

4.1 Drivs de lacide isoxazole-3-hydroxamique....88 4.2 Composs agissant spcifiquement sur les PDFs bactriennes....90

- DISCUSSION92 - CONCLUSION...95 - REFERENCES BIBLIOGRAPHIQUES ....98 - ANNEXES.111

7

THEME

Calculs et Modlisations des interactions peptide dformylase-substances

antibactriennes laide de technique de docking (arrimage) molculaire.

8

INTRODUCTION

9

La recherche en biologie ne peut, actuellement, se passer des outils informatiques pour traiter le flot de donnes produites et optimiser ses avances. Lun de ces outils est la modlisation molculaire et plus prcisment larrimage molculaire (plus souvent connu sous le terme anglo-saxon "docking"). Lemploi initial du "docking" molculaire a t de prdire et reproduire des complexes protine-ligand [1,2].

Les succs dans ce domaine et lessor des techniques de chimie combinatoire

ainsi que lexploitation systmatique de la diversit chimique provenant dautres cibles ont largi son utilisation loptimisation de molcule et au criblage de bases de donnes. Ainsi cette mthode, permettant de cribler des milliers de composs pour une protine cible, est couramment utilise en pharmacochimie pour lobtention de nouveaux mdicaments. Une telle approche serait difficilement ralisable en biologie traditionnelle o le rcepteur est classiquement une protine ou un oligomre de protine et le ligand est une petite molcule.

Tous les programmes de "docking" peuvent se dcomposer en deux tapes, la

partie de recherche des conformations possibles du ligand et la partie dvaluation de ces conformations ou fonction de score. Celle-ci doit permettre dattribuer le meilleur score au complexe le plus raliste dtermin exprimentalement. Pour effectuer ce choix la fonction de score est base classiquement sur la complmentarit strique des fonctions et des groupements chimiques. Il existe de nombreuses fonctions de score mais envisager tous les paramtres physico-chimiques qui entrent en jeu dans les interactions intermolculaires est pour linstant irralisable.

Cependant, parmi les forces en jeu, certaines sont plus importantes que dautres.

Ainsi les liaisons hydrogne constituent une des composantes jouant un rle primordial dans les interactions intermolculaires. Ceci est d principalement lubiquit des groupements polaires dans les macromolcules biologiques.

Le premier objectif de ce travail est dvaluer les programmes disponibles pour

effectuer un "docking" molculaire entre une protine enzymatique et des ligands divers. Pour cela, trois programmes parmi les plus utiliss actuellement ont t choisis : Arguslab, FlexX et Surflex. Il sagit l dune approche " in silico" de la biologie traditionnelle qui complte les approches classiques "in situ " (dans le milieu naturel), "in vivo " (dans l'organisme vivant) et "in vitro " (en prouvette).

Dans ltude ralise ici la protine est la peptide dformylase (PDF), enzyme

essentielle chez une grande varit de microorganismes pathognes mais qui nest pas requise pour la synthse protique cytoplasmique chez les eucaryotes et constitue ainsi une cible potentielle intressante pour les agents antimicrobiens [3]. Les ligands sont des composs organiques divers pouvant jouer le rle dinhibiteur de lenzyme.

10

Ces dix dernires annes, une partie substantielle du programme de dcouverte de mdicaments antimicrobiens de lindustrie pharmaceutique a t consacre lidentification de nouvelles classes de molcules antibactriennes, par opposition lamlioration du pouvoir ou du spectre daction des classes existantes. Ce changement de stratgie a t men en raison de limportance du problme de la rsistance et du besoin consquent de nouveaux mdicaments prsentant des mcanismes diffrents et insensibles aux antibactriens existants [4].

En effet, Les maladies infectieuses causes par les bactries, les moisissures et

dautres organismes parasites affectent des centaines de millions de personnes travers le monde et entranent des millions de dcs chaque anne.

Ainsi, le second objectif porte sur ltude de linhibition de la peptide dformylase

par une grande varit de molcules, peptidiques et non peptidiques, dans le but de dcouvrir de nouveaux antibiotiques.

Par cette tude, nous essayons de contribuer d'une part, la comprhension des

mcanismes fondamentaux de la liaison entre une cible protique et son ligand et, d'autre part, la recherche dagents thrapeutiques potentiels par arrimage et criblage virtuel de la peptide dformylase (PDF) laide de simulations sur ordinateur.

De plus, par ce travail, nous souhaitons acqurir des comptences en "docking"

molculaire de faon pouvoir dvelopper cette nouvelle technique luniversit de Constantine.

11

REVUE BIBLIOGRAPHIQUE

12

- CHAPITRE I -

DOCKING MOLECULAIRE

1. PRINCIPES

Le plus important problme pour ltape de Docking est de parcourir le mieux possible lespace conformationnel. La complexit de ce problme est fonction du nombre de degrs de libert, de translation, de rotation en plus des conformations de dpart possibles du ligand. Afin dviter des calculs que les machines ne peuvent rsoudre ou seulement dans des temps bien trop importants, plusieurs approximations sont possibles. Les algorithmes de recherche de la flexibilit du ligand peuvent se classer en trois principes, nomms combinatoire, stochastique, et dterministe.

1.1. Lapproche combinatoire

Cette approche est base sur des grilles de valeurs pour chaque degr de libert, et chacune de ces grilles est explore de manire combinatoire au cours de la recherche. En raison de leffet combinatoire, le nombre dvaluations augmente bien plus rapidement que le nombre de degrs de libert. Pour cela, des critres de fin sont imposs pour viter lalgorithme de parcourir des portions de lespace qui ne mneraient qu de mauvaises solutions.

Dans un premier temps le ligand est dcoup en parties rigides et flexibles. Entre les points o des rotations sont possibles, une ou plusieurs ancres rigides sont dfinies, ensuite une premire partie rigide est mise en interaction avec le rcepteur puis les parties flexibles sont ajoutes de manire successive avec une exploration des angles de torsion. Le plus important est le choix des fragments de base placer en premier dans le site car il est trs difficile pour les algorithmes de compenser une mauvaise position initiale. Les diffrentes implmentations changent par la manire dont le premier segment rigide est plac dans le site et dans les procdures dlimination quand le nombre dangles de rotation augmente. Nous supposons que la position du segment rigide de dpart ou ancre fait partie des n positions de plus basse nergie possible. Le nombre n dtermine la largeur de larbre de recherche. Cette hypothse peut savrer tre un biais dans le cas de petits segments ancres car ceux-ci sont susceptibles de sadapter de nombreux endroits la surface du rcepteur entranant la construction de branches sans intrt. Cette mthode a t incorpore dans plusieurs programmes dont Dock [5] et FlexX [6]. Le programme FlexX positionne lancre partir dune modlisation des interactions chimiques et effectue une slection automatique des fragments de base [7,8]. Les fragments sont ajouts de manire incrmentale. Chaque angle possible est construit et les angles qui produisent des recouvrements avec le rcepteur ou des conflits internes sont rejets. A chaque ajout, le calcul de lnergie est pratiqu et les molcules partiellement construites sont classes. Cette procdure est rpte jusqu la construction complte de la molcule.

13

1.2. Lapproche stochastique

Lapproche stochastique consiste effectuer des changements alatoires dans la structure tridimensionnelle du ligand. Habituellement il sagit de modifier un degr de libert chaque fois. Lun des points faibles de cette mthode est lincertitude de convergence. Pour lviter, il faut multiplier les calculs, indpendamment les uns des autres. Un des principaux algorithmes stochastiques est la mthode de Monte Carlo [9].

Pour la mthode de Monte Carlo le ligand est considr dans son ensemble et les changements seffectuent aussi bien sur les translations, les rotations que sur les torsions. A chaque mouvement, la molcule est minimise et son nergie est calcule. Pour dterminer si une structure doit tre conserve les programmes se servent du critre de Metropolis [10]. Pour les systmes macromolculaires le critre de Metropolis peut sexprimer ainsi : partir dune configuration i, on tire au hasard une configuration j. Cette nouvelle configuration est accepte avec une probabilit , qui est la probabilit que le systme puisse aller dun tat dquilibre i vers un tat j. La diffrence dnergie entre la nouvelle et lancienne configuration est calcule. Si la nouvelle configuration est dnergie plus basse elle est accepte. En revanche si elle est dnergie plus haute, un nombre au hasard entre 0 et 1 est tir, si ce nombre est infrieur la nouvelle configuration est accepte, sinon lancienne configuration est garde. Ce critre est, dans la plupart des cas, trs efficace et simple mettre en uvre.

Pour obtenir la structure la plus stable ou quand il est raisonnable de penser que la structure de dpart est trs loigne de celle de linteraction, il est possible dutiliser le recuit simul. Cette mthode est une variante de la mthode de Monte Carlo qui sapplique particulirement bien aux macromolcules. Elle consiste effectuer plusieurs cycles de calculs avec la particularit que le premier cycle sera simul haute temprature et que dans les cycles suivants ce facteur sera progressivement diminu. Chaque nouveau cycle commence avec la meilleure structure du prcdent.

Une autre modification possible de Monte Carlo moins employe est la recherche Tabou qui consiste en un critre de choix suivant la zone de lespace conformationnel o se situe la structure, avec des zones permises et dautres interdites (tabou), afin de limiter le calcul [11], cette technique se retrouve dans le programme PRO_LEADS.

Le programme ICM [12] utilise des probabilits partielles pour son algorithme de Monte Carlo. Les mouvements de translation et de rotation sont tests par une simulation des mouvements pseudo-brownienne, alors que les mouvements de torsion se basent sur des probabilits partielles. Aprs chaque cycle une minimisation locale est faite, qui est suivie par un calcul de lnergie de solvatation et de lentropie. Le choix se fait selon le critre de Metropolis. Les probabilits partielles sont drives du diagramme de Ramachadran de structures connues.

Le programme Glide [13] utilise lui aussi la mthode de Monte Carlo. Il se sert de caractristiques chimiques pour valuer la pertinence des structures et faire un choix chaque cycle, mais afin de rduire lespace explorer par Monte Carlo il emploie pralablement plusieurs filtres qui permettent dliminer les mauvais contacts notamment polaires ou hydrophobes.

1.3. Lapproche dterministe

Dans lapproche dterministe, ltat initial dtermine les mouvements effectuer pour gnrer ltat suivant. Cet tat devant tre dnergie gale ou infrieure celle de

14

ltat initial. Le problme des systmes dterministes est quils peuvent facilement rester pigs dans un minimum local car leurs capacits surmonter des barrires nergtiques sont faibles. Il sagit de lapproche la plus simple et la plus directe.

Lexemple le plus rpandu est la simulation de dynamique molculaire. Cette mthode est trs rarement employe en Docking du fait des moyens quelle demande et de son biais pour les minima locaux.

Pour simuler les interactions protines-ligands, nous avons choisi trois programmes de docking. Il sagit en premier de deux programmes parmi les plus rpandus, FlexX et Surflex [2], qui utilisent une mthode incrmentielle et Arguslab [14] qui utilise des mthodes mixtes.

2. OBTENTION DES STRUCTURES La majorit des structures protiques sont disponibles via la Protein Data Bank

[15], un grand nombre de structures dune mme molcule avec ou sans ligand permet davoir une information pertinente. Quand la mthode exprimentale nest pas possible ou na pas t encore ralise, la solution envisager en premier est une approche par modlisation comparative [16].

Il sagit de prdire un modle daprs dautres molcules le plus proche possible de celle tudie et dont les structures sont connues exprimentalement. La conformation dune protine tant code par sa squence en aminoacides, la premire tape est deffectuer un alignement de squence pour identifier les molcules similaires. La recherche dhomologues peut seffectuer principalement par trois voies. En premier lieu la mthode dveloppe par Needleman et Wunsch qui utilise un algorithme de programmation dynamique pour raliser un alignement global puis celle de Smith et Waterman, semblable la prcdente mais qui ralise des alignements locaux et enfin au moyen de recherches par heuristique, qui permettent de travailler avec un nombre de squences beaucoup plus grand. Parmi ces mthodes, on peut citer les approches utilises par les logiciels BLAST (Basic Local Alignment Search Tool) [17] et FASTA [18].

Il est possible dobtenir une structure secondaire uniquement partir de la squence de la molcule en tudiant la composition locale des squences et en la comparant des bases de donnes dans lesquelles sont identifies les tendances quont certains acides amins former des structures particulires. Mais pour une simulation de Docking cette structure nest pas suffisante. Une fois ltape dalignement effectue, il est possible de raliser ltape de modlisation comparative qui doit produire une structure reprsentative de la squence fournie, laide dun modle choisi grce aux homologies quil prsente avec cette squence. Plusieurs logiciels existent, nous citons par exemple les programmes Jackal [19] et Modeller [20]. Jackal est compos dune suite de logiciels permettant la construction dune structure base sur une mthode dvolution artificielle. Modeller permet une modlisation comparative par satisfaction des contraintes spatiales. La prcision de la structure obtenue dpend principalement du degr de similarit avec les squences de rfrence slectionnes, ce qui peut poser des problmes pour la structure globale de la protine, le taux de similarit ntant pas constant sur toute la squence. Ces restrictions font que ces modles ne sont pas toujours exploitables en Docking molculaire.

3. APPLICATIONS

15

Il y a deux principales applications au programme de docking. La plus ancienne est la prdiction du mode dinteraction. La seconde consiste optimiser des molcules ayant dj une activit avec le rcepteur. Plusieurs mthodes sont utilises pour valuer les performances des diffrents programmes de docking pour chaque application. Laptitude dun algorithme trouver lemplacement correct du ligand par rapport son rcepteur est habituellement dtermine au moyen de la dviation quadratique moyenne ou RMSD (root-mean-square deviation) du modle conu par le logiciel vis--vis de la structure du cristal. La valeur admise est une diffrence maximale de 2 angstrms au-del de laquelle la prdiction est considre comme non adquate [21,22]. En gnral, les erreurs de docking sont dues un chantillonnage insuffisant ou une fonction de score inadquate. Pour savoir de quel type derreurs il sagit, il faut comparer lnergie la plus basse obtenue par docking avec le score de la structure cristalline. Si le score du complexe de docking est moins favorable celui de la structure cristalline il sagit dun problme de la partie charge de parcourir lespace conformationnel. Lchantillonnage dans ce cas est incomplet et na pas permis de trouver le conformre correspondant au minimum global dnergie potentielle [23]. Dans le cas o le score de docking serait bien plus bas que celui de la structure cristalline il sagit dune erreur de la fonction de score. Pour remdier ces problmes, dans le premier cas il faut augmenter le nombre de conformres valus, dans le deuxime il faut revoir la fonction de score. Il sagit l de cas classiques qui supposent que lespace conformationnel autour de la structure exprimentale est parfaitement parcouru et que la structure cristalline est bien celle correspondant au minimum global dnergie potentielle. Il faut donc ladapter selon son propre calcul.

Pour optimiser les molcules activit pharmacologique, le programme doit tre

capable de ranger correctement des molcules semblables chimiquement. La fonction de score doit tre capable de limiter les faux positifs et les faux ngatifs. Pour vrifier la capacit diffrencier du logiciel, il faut disposer dune banque exprimentale de complexes. Il convient davoir une structure c

16

ristallographique pour au moins un complexe protine-ligand proche des molcules testes.

4. PROGRAMMES UTILISES

4.1. FlexX

FlexX incorpore les concepts de quatre diffrents programmes appliqus dans le design des mdicaments (design bas sur la structure) : La plus importante tape est la stratgie de docking de ligands flexibles par une voie incrmentielle analogue celle de Leach et Kuntz qui t prsente en 1992 [24]. La slection du fragment de base est une tape interactive durant la prdiction du complexe protine-ligand excute par FlexX [6]. Le principe de la modlisation de linteraction protine-ligand est celui de Bhm (1992) utilis dans son programme LUDI [25]. Les positions du ligand sont calcules selon la gomtrie de linteraction, ces positions sont guides par les proprits physico-chimiques du ligand. Pour estimer lnergie libre de la liaison et classer les solutions obtenues, une variante de la fonction de Bhm appele The scoring function a t applique [26]. Pour manipuler la flexibilit du ligand le programme MIMUMBA, dvelopp par Klebe et Metzner en 1994, est utilis [27]. Les conformations sont gnres par un rseau direct, la longueur de la liaison et les angles sont gards invariants. Les conformations retenues sont dtermines pour chaque fragment par une valuation statistique du CSD (Cambridge Structural Database) [28]. Le rcepteur est considr rigide. Le processus de la construction incrmentielle est bas sur une stratgie simple : aprs avoir mis le fragment dans toutes ses conformations possibles et dans tous les placements trouvs dans la premire itration, seuls les K meilleurs placements sont pris en considration dans litration suivante. Cette stratgie est utilise dans le programme Grow dvelopp par Moon et Howe en 1991 pour le design des peptides [29].

FlexX est bas sur trois parties majeures [6] : la flexibilit conformationnelle du ligand, les interactions protine-ligand et la fonction de score utilise pour classer les solutions ou les rsultats gnrs par FlexX.

4.1.1. Flexibilit conformationnelle du ligand Le modle qui dcrit la flexibilit du ligand a t dvelopp en 1994 par Klebe et

Metzner [27] dans leur programme MIMUMBA. Le rle de ce programme est de classer les conformations qui ont une basse nergie. Il utilise les valeurs partir des donnes de la structure en ce qui concerne la longueur et langle de la liaison. Ce programme contient aussi une base de donnes de 900 fragments molculaires qui vont tre affects automatiquement chaque liaison simple par un algorithme appel a subgraph matching algorithm .

4.1.2. Interaction protine-ligand

Pour attacher un ligand une protine (docking) le problme est de prdire la conformation et lorientation du ligand relative au site actif de la protine cible. Le docking est la base de la reconnaissance molculaire et du type de linteraction. chaque protine cible de structure connue le docking se rvle tre la cl dans le design de

17

nouveaux mdicaments [26,30-32]. Le ligand est considr comme une petite molcule organique. Les interactions qui peuvent exister entre cette petite molcule (le ligand) et la protine sont : des interactions polaires (liaisons hydrogne, liaisons ioniques) et des interactions hydrophobiques (contact entre des groupes hydrophobes).

Les interactions entre la protine et le ligand suivent le concept de la complmentarit strique. Rcemment dautres algorithmes, se basant sur le matching of interacting group , ont t dvelopps [33]. Ces algorithmes sont moins performants car ils modlisent les diffrentes interactions de la mme manire. Pour contourner cette carence la technique utilise considre trois niveaux de types dinteraction :

- les interactions du 3me niveau concernent les liaisons hydrogne et les liaisons ioniques, elles sont les plus restrictives gomtriquement cause de leur courte distance H-accepteur -------- H-donneur = 1.9A. - les interactions du 2me niveau sont les interactions hydrophobiques entre le centre dun cycle aromatique et les atomes dun autre cycle, dune amide ou des groupements mthyle. La gomtrie de ce type dinteraction est lgrement moins restrictive, on peut alors le sparer des interactions purement hydrophobiques. Des tudes sur linteraction protine-ligand ont montr que ce type dinteraction est le plus frquent. - les interactions du 1erniveau sont les contacts hydrophobiques non spcifiques entre les atomes de carbone aliphatique ou aromatique. Ces interactions sont gnralement sphriques avec un rayon de 4A et elles couvrent la plus grande partie du ligand [6,33].

Pour le placement du ligand dans le site actif de la protine, les interactions du 3me niveau sont utilises en premier, ensuite celles du 2me niveau, et enfin celles du 1er niveau.

4.1.2.1. La modlisation de linteraction

Le modle qui dcrit les interactions protine-ligand est inspir de celui de Bhm (1992) et Klebe (1994) [25,34]. Ce modle est bas sur les surfaces sphriques, pour chaque groupe ou atome il y a un type dinteraction et une gomtrie correspondante [6]. Le tableau 1 suivant dfinit les diffrents types dinteraction rencontrs lors de la formation dun complexe protine-ligand. Ces types dinteraction sont diviss en groupes et contre groupes. Si le contre groupe nest pas dfini le groupe et le contre groupe sont identiques.

Tab 1 : Diffrents types dinteraction dun complexe protine-ligand.

Groupe Contre-groupe Niveau H-accepteur

H-donneur 3

Mtal accepteur Mtal 3 Atome dun cycle Aromatique Mthyle Amide

Centre dun cycle aromatique 2

Carbone aliphatique Carbone aromatique Sulfure

1

18

La gomtrie de linteraction consiste en un centre et une surface dinteraction. La surface dinteraction est toujours une surface sphrique (Sphre, cne, rectangle sphrique, chapeau), ou une combinaison entre eux (figure 1) [6].

Figure 1.la gomtrie de linteraction. a : cne, b : chapeau, c : rectangle sphrique La gomtrie de linteraction est dfinie par les rgles de Bhm, lesquelles sont prises en compte dans la technique utilise et gnrent les positions des atomes du ligand dans le site actif de la protine. Le tableau 2 rsume quelques groupes fonctionnels avec leurs gomtries. Tab 2 : Groupes fonctionnels avec leurs gomtries.

Groupe fonctionnel Site dinteraction Les paramtres gomtriques C=O

D-X

RO-D = 1,9 = 110-180o = 0-360o

N-H , O-H

A-Y

RH-A = 1,9 = 150-180o = 0-360o

N-H(charg)

A-X

RH-A = 1,8 = 150-180o = 0-360o

COO-

D-X

RO-D = 1,8 = 100-140o =-50o-50o,130o-230o

=N-

D-X

RN-D = 1,9 = 150-180o 0-360o

R-O-R(SP2)

D-X

RO-D = 1,9 = 100-140o

19

= -60o-60o R-O-R(SP3)

D-X

RO-D = 1,9 = 90-130o = -70o-70o

Les paramtres R, , sont reprsents sur les schmas 1, 2 ,3 suivants :

R

N

O

HN

wR

a

R

O

HN

wR

a

H

R

N

R

H

R

wa

N

Schmas 1, 2 ,3 : dfinition des paramtres R, ,

La gomtrie de linteraction contient le centre de linteraction, le rayon de linteraction, et la surface de linteraction. Les interactions considres sont celles o : - les types dinteraction des deux groupes A et B sont compatibles - le centre dinteraction de A est li approximativement la surface dinteraction de B et vice versa (figure 2)

20

Figure 2. interaction entre A et B

4.1.2.2. Les diffrentes tapes de docking Lalgorithme de docking est bas sur la stratgie de la construction incrmentielle, elle consiste en trois phases essentielles : Slection du fragment de base [6,33] La premire tape du docking est de choisir une partie du ligand qui va interagir en premier avec la protine, cette partie est appele le fragment de base . La technique de la slection du fragment de base est la suivante :

- la premire tape est la division du ligand en plusieurs composants par louverture des liaisons simples acycliques non terminales. Par dfinition un fragment est dit valide lorsquil constitue la partie qui va se connecter la protine, et nayant pas plus de 30 conformations [6,15].

- la deuxime tape consiste au classement des fragments valides. Placement de base

Les algorithmes de placement sont bass sur la technique de geometric hashing [33,35-37]. Ces algorithmes sont le triangle algorithme (triplet) et le line algorithme (paire). Le premier algorithme est utilis lorsquil y a trois interactions compatibles entre le ligand et le rcepteur, il sagit dun triplet (sous forme de triangle) (figure 3) ; le second est utilis lorsquil y a deux interactions compatibles, dans ce cas il sagit dune paire.

Pour des raisons gomtriques les surfaces dinteractions du site actif sont prsentes par des points (cette ide est similaire celle dveloppe par Bhm en 1992) [38].

La premire tape de cette technique est de gnrer tous ces points dinteraction dans des cercles o la distance point-point est fixe. Sachant que la distance de la liaison hydrogne et les sels ponts est gale 1.2 et que celle des interactions

hydrophobiques est gale 1.6 . La technique geometric hashing traite toutes les paires de points qui ont une

distance dans lintervalle de 0.5 10 comme suit : le type dinteraction du 1rpoint, le

21

type dinteraction du 2me point et la distance. Elle gnre tous les triplets (ou paires) des centres dinteraction du fragment et dfinit tous les triplets compatibles. On dit que les deux triangles dfinis prcdemment sont compatibles seulement sils ont les mmes longueurs dartes et que leurs sommets ont des types dinteraction compatibles [6] (figure 3).

Figure 3. Technique utilise pour placer le fragment. Les trois centres dinteraction du ligand (en gris).

Les trois points dinteractions du site actif (en noir).

La deuxime tape est lajustement du placement en considrant : - Les contraintes angulaires ou gomtriques (le centre dinteraction du ligand

concide avec la surface dinteraction du rcepteur et vice-versa). - Le ligand et la protine (rcepteur) ne doivent pas se chevaucher. La liste des

placements (positions) obtenus par cette tape contient plusieurs interactions similaires pour deux raisons :

Changer un point par un autre proche dans la mme surface dinteraction change lgrement linteraction. Le fragment peut faire plus de trois interactions simultanment.

La troisime tape sert regrouper tous les placements qui ont un rms de dviation minimale, (rms : root mean square=0.7). Ces placements vont converger vers une seule solution, celle qui correspondra lorientation finale du ligand [6,39,40].

La dernire tape est un test de chevauchement (lalgorithme ne prend en compte que les placements qui ne se chevauchent pas).

Dans le cas dun petit fragment de base, il se trouve que les triplets dinteractions soient trs rares ou mme inexistants, les paires dinteractions vont alors tre prises en compte au lieu des triplets. Linteraction va tre entre les paires des centres dinteractions du ligand et les paires de points dinteractions du site actif. Le degr de libert qui reste (la rotation autour de laxe dfini par la paire de points dinteractions) peut tre fix en tournant le ligand de telle sorte que les deux centres dinteractions du rcepteur lient approximativement les deux centres dinteractions du ligand.

Pour rduire le nombre de placements ou positions gnrs, il suffit de diffrencier les interactions actives des moins actives (active veut dire quelle peut tre utilise par lalgorithme de placement). Pour cela le mode dactivit suivant est considr : Mode dactivit

22

Niveau dinteraction Condition 3 2 1

n3>1 & n2>2 A 1 I n3>1 & n22 A 1 1 n31 & n2>2 A a 1 n31 & n22 A a A

n3, n2 : nombre datomes interagissant du 3me et 2me niveau ; a : active ; 1 : moins active ; i : non active. Construction du complexe

Le processus de la construction incrmentielle commence juste aprs avoir plac le fragment de base [6].

Cette technique est reprsente par un arbre technique arborescente (figure 4) o chaque point reprsente une position ou un placement dune partie du ligand [6]. Dans le premier niveau de cet arbre, on trouve les diffrentes positions du fragment de base, chaque niveau suivant contient des positions alternatives pour les autres fragments du ligand.

Lordre selon lequel sont ajouts les fragments reste constant durant toute la construction. Sil y a plusieurs possibilits, le fragment qui forme une liaison hydrogne ou ionique est ajout en premier puisquelles sont les plus restrictives gomtriquement. Le but de cette technique est de trouver toutes les positions (placements) qui ont une nergie libre favorable telle quelle est estime par la fonction de score. La taille de cet arbre augmente exponentiellement avec le degr de libert du ligand. Cette approche est utilise car elle vite les minima locaux.

Figure 4. Construction incrmentielle du complexe protine-ligand. Les placements qui vont tre pris en considration dans la prochaine

itration sont reprsents en noir.

23

4.1.3. Fonction de score 4.1.3.1. Gnralits La prdiction de la conformation du ligand dans le site actif de la protine est le plus grand dfi du design des drogues bas sur la structure. Le rle des algorithmes de docking dsigns excuter cette tche est divis en deux parties essentielles :

- Trouver toutes les conformations, translations, rotations du ligand dans le site actif de la protine en un temps dexcution trs petit.

- Calculer lnergie utilise pour valuer les interactions entre la protine et le ligand, et classer les solutions [41,42,43,44].

Donc le dfi est de trouver une fonction qui peut incorporer toutes les contributions de lattachement.

Dans ce domaine plusieurs mthodes ont t dveloppes. Les mthodes de champ de force calculent lnergie libre G dun complexe protine-ligand en utilisant les fonctions dveloppes pour laffinement de la structure 3D et les mthodes de la dynamique molculaire.

Parmi ces mthodes :

- La mthode de perturbation de lnergie libre (FEP) [45,46]. - Lapproximation des rponses linaires (LRA) avec FEP ou les mthodes semi microscopiques [47,48]. - Discretized continuum (DC) [49].

Toutes ces mthodes sont capables de calculer lnergie libre avec une erreur de lordre de 1 4 logKi . Ces mthodes ne peuvent pas donner une prdiction exacte puisquelles dpendent de plusieurs paramtres :

- La constante dilectrique dans DC. - Les coefficients massiques de Van Der Waals dans LRA.

Cest pour cela que des fonctions empiriques scoring function sont utilises [6,38,39,50].

4.1.3.2. La fonction de score

Les fonctions de score sont bases sur le modle qui inclue toutes les proprits physico-chimiques de linteraction protine-ligand et les convertit en termes calculables pour trouver la constante daffinit du complexe protineligand (la structure du complexe 3D tant connue). La fonction utilise dans FlexX est celle de Hans Joachim Bhm modifie [6,38,51].

Cette fonction contient des termes additifs des nergies des liaisons hydrogne, des interactions ioniques, des contacts lipophiliques et dentropie du ligand (la flexibilit du ligand), le score est une estimation directe du G : lnergie libre du complexe protine-ligand [6,51,52].

Cette approche a prsent beaucoup davantages par rapport aux autres fonctions :

24

- Elle peut tre applique mme dans le cas o il y a des incertitudes dans la

structure cristalline de la protine. - Elle reprsente toutes les contributions entropiques de laffinit de la liaison.

Lquation utilise est la suivante : Equation 1 G=G0+GrotNrot+Ghbliaison H f(R,)+Giocontact ionique f(R,) +Garof(R,)+Glipocont lipo f*(R)

Le terme f(R,) est une fonction de pnalit qui sert calculer la dviation de la gomtrie par rapport la gomtrie idale.

Dans le cas de la liaison hydrogne, R est la variation de la distance de la liaison H---O/N par rapport sa valeur idale qui est gale 1.9 A. est la dviation de langle N/O-H-----O/N de sa valeur qui est de 180. En gnral cette dviation est ajuste par les valeurs suivantes :

f(R,)=f1(R)f2()

1 R0.2 f1(R)= 1-(R-0.2)/0.4 R0.6

0 R>0.6

1 30

f2()= 1-(-30)/50 80

0 >80

f*(R) est un terme en plus dans la fonction que nous avons utilis. Il ajuste les contacts dont les distances diffrent de la distance idale. R= R-R0 dont R est la distance entre deux centres dinteraction. R0 est la distance idale (cest la somme des rayons de Van Der Waals des deux atomes) [6]. 0 R>0.6 1-(R-0.2)/0.4 0.2A

25

f*(R)= 1 -0.2A

26

la diffrence de la recherche incrmentale de Dock il ny a pas de recherche systmatique des angles de torsion mais une tape de minimisation entre chaque ajout de fragment.

- la deuxime mthode dite molcule entire reprend la mme tape de fractionnement que prcdemment. Le changement se fait au niveau des fragments du ligand conservs. Dans la mthode Hammerhead ne sont conservs pour ltape de Docking que les meilleurs fragments qui salignent avec ceux de la pseudo-molcule. Ici tous les fragments sont pris en compte pour la recherche de configuration optimale du ligand.

Ainsi le rsultat des configurations retenues pour sapparier avec le ligand contient des molcules proches de lalignement initial du ligand qui ont t localement modifies par le processus de fragmentation. Les fragments de ces configurations sont valus puis une tape de slection et de fusion des meilleurs fragments entre configurations permet dobtenir un conformre global. Cette deuxime mthode se montre beaucoup plus rapide que la mthode Hammerhead pour des rsultats au moins quivalents.

Dans la version de Surflex que nous avons utilise (version 1.3), il sagit de la mthode par dfaut.

Pour lutilisateur, lemploi du logiciel passe par trois tapes :

- Choisir de quelle manire dfinir le site actif, soit partir dun ligand soit partir du rcepteur.

- Construire la pseudo-molcule qui sera la cible de la recherche de similarit.

- Enfin lancer le processus de Docking.

Le rsultat est donn sous la forme des 10 meilleurs conformres au format mol2. Chaque fichier possde trois scores : le premier daffinit ; le second correspond au degr de pntration impropre du ligand dans la protine appelcrash score, plus ce score est proche de 0 plus linteraction est favorable et le troisime ou polar score correspond au niveau de contribution des interactions polaires. Plusieurs options, rentrer en ligne de commande, permettent dadapter le calcul suivant le nombre de torsions ou suivant lespace conformationnel reprsenter avec la pseudo-molcule .

- CHAPITRE 2

METHODES DE SCORE OU ESTIMATION DE LENTHALPIE LIBRE DINTERACTION

27

Les calculs sont effectus par la mthode de perturbation de lenthalpie libre et celle de lintgration thermodynamique. Elles utilisent toutes les deux un concept qui consiste perturber lgrement le complexe et calculer la diffrence dnergie pas pas. Mais dans la ralit, ce processus est trs coteux en temps de calcul.

Le besoin au cours dune simulation de Docking dobtenir un rsultat rapide sans trop de perte de qualit conduit utiliser dautres fonctions de score. Ces dernires doivent pour le moins permettre de classer les diffrentes configurations ou ligands les uns par rapport aux autres. Elles doivent, aussi, nous donner un aperu du mode de fixation du ligand au rcepteur.

En comparant les scores calculs dans les mmes conditions il doit tre possible de les utiliser pour comparer laffinit du ligand pour diffrentes cibles [55]. Pour tre rapide les fonctions de score ne peuvent calculer tous les termes entrant en jeu lors dinteractions lectrostatiques. Le plus souvent ce sont les termes se rapportant lentropie qui sont ngligs. Elles doivent, de plus, tre tolrantes vis--vis des imprcisions engendres par le calcul. Toutes ces restrictions expliquent le nombre lev de fonctions de score disponibles [56-60]. Il nest pas actuellement possible de prvoir quelle fonction de score employer en fonction du travail exig et des molcules, seule lexprimentation permet de faire un choix [60,61].

Les fonctions de score utilises peuvent tre classes en quatre grandes catgories, nommes mthode semi-empirique, mthode empirique, potentiels bass sur des donnes (knowledge-based), mthode base sur le premier principe de la thermodynamique [62].

1. METHODES SEMI-EMPIRIQUES Les fonctions de score qui entrent dans cette catgorie adoptent lide quil est

possible de faire une approximation de lnergie dinteraction sous la forme dune combinaison linaire de termes empiriques et quantiques. Il sagit le plus souvent dune approximation correcte pourtant toutes les forces impliques dans la formation du complexe ne sont pas additives.

La fonction de score du programme GOLD comporte trois termes : un terme pour les liaisons hydrogne, un autre pour les interactions de Van Der Waals, le dernier pour lnergie interne.

A lorigine cest un potentiel 6-12 qui a t utilis pour les interactions de Van Der Waals et pour lnergie interne du ligand [63].

Plus tard ce systme a volu pour attribuer un potentiel 4-8 aux interactions de Van Der Waals [64].

Le terme de liaison hydrogne est bas sur des valeurs empiriques obtenues partir de la force des liaisons entre diffrents types datomes. Les valeurs des liaisons sont pondres en fonction de langle et de la distance entre les atomes accepteurs et donneurs. Lnergie totale calcule est une pondration de ces trois termes [63].

2. METHODES EMPIRIQUES Les mthodes empiriques essaient destimer lnergie dinteraction en runissant

de manire intuitive les termes que lexprience a dfini comme fondamentaux. Classiquement ces termes regroupent les liaisons hydrogne, les interactions

ioniques, la surface de contact ligand-rcepteur et les contributions entropiques. Ces fonctions doivent autant que possible quilibrer linfluence des deux forces principales que

28

sont les interactions ioniques et hydrophobes pour pouvoir sappliquer au plus grand nombre.

Les diffrents termes sont pondrs par des valeurs obtenues par ltude exprimentale de laffinit de structures ligand-rcepteur au sein dun ensemble dapprentissage. La dcomposition de lnergie en diffrents termes, bien que cela nait pas de base thorique, permet un calcul rapide sans trop de perte de prcision. Nanmoins il existe plusieurs dsavantages. En premier, il est difficile de savoir quel terme est prendre en compte exactement suivant le modle, et comprendre do peuvent survenir les erreurs. Deuximement, la prdiction de lenthalpie libre est correcte si les molcules en jeu suivent un processus dinteraction semblable celui de lensemble dapprentissage. Il y a une dpendance vis--vis du modle au niveau des valeurs de pondration. Troisimement, le pH, la concentration en sel et la temprature peuvent influencer la mesure de la constante daffinit de manire consquente. Pourtant ces conditions sont le plus souvent ignores lors du calcul de lenthalpie libre partir de donnes exprimentales. Ceci limite la prcision des prdictions faites partir de ces valeurs. Afin dacclrer le calcul du score, des grilles de score sont souvent prcalcules. La grille est applique sur le rcepteur et chaque maille contient la rsultante des atomes voisins.

La premire fonction de score dveloppe pour ltude de lenthalpie libre dinteraction a t implmente dans LUDI [62]. Elle provient de ltude de lenthalpie libre dinteraction sur 45 complexes dont la constante daffinit a t publie. Lenthalpie libre est modlise partir de lutilisation des ponts hydrogne, des ponts salin, de leffet hydrophobe et dun terme reprsentant lentropie du solut (Equation 3).

Les termes des ponts hydrognes et salins sont accompagns dune fonction de pnalit f(R,) pour tenir compte des importantes dviations autour des valeurs idales de longueurs et dangles de ces ponts.

Les interactions hydrophobes sont bases sur la surface dinteraction hydrophobe entre le ligand et le rcepteur.

Le calcul de la perte dentropie du ligand lors de la formation du complexe est bas sur le nombre dangles de torsion NROT.

Le terme Go prend en compte les pertes dentropie lies aux translations et rotations. Le modle prsent ici a t amlior par la suite pour mieux prendre en compte les ponts hydrognes et salins.

Dautres termes ont t ajouts pour les rpulsions lectrostatiques longue distance, les interactions - dans les cycles aromatiques [27]. Cest le type de fonction utilise par FlexX.

3. POTENTIELS BASES SUR DES CONNAISSANCES

Ils drivent de donnes statistiques obtenues par lanalyse exprimentale des

frquences dinteraction entre atomes au sein de complexes protine-ligand. Cette drivation de fonctions dnergie depuis des donnes exprimentales en

utilisant les concepts de la mcanique statistique est base sur deux principes fondamentaux.

29

En premier il est admis que le complexe protine-ligand est dans un tat thermodynamique dquilibre et que cet tat reprsente le minimum global denthalpie libre du complexe.

Deuximement, la distribution des molcules ltat microscopique obit la loi de Boltzmann. Il existe donc une corrlation entre lnergie potentielle dun systme et la probabilit de trouver une molcule ou un complexe dans un tat microscopique donn. Si ces frquences sont converties en enthalpie libre grce une distribution de Boltzmann, les potentiels sont nomms potentiels de force moyenne (potential of mean force : PMF).

Le PMF a t en premier employ pour les simulations de repliements de protines et ensuite pour celles dinteractions protine-ligand [65,66]. Mais, alors que pour les processus de repliement seul un ou deux points par aminoacide sont pris en compte, les simulations dinteraction requirent le calcul de tous les atomes.

La principale diffrence avec les potentiels empiriques est quaucune donne dinteraction de type pont hydrogne, lectrostatique ou de solvatation nest ncessaire : les forces mises en jeu sont incorpores de manire implicite. Ce type de fonction est gnralement plus tolrant pour les imprcisions des complexes. Pour la construction du PMF il y a deux aspects importants. En premier lieu, la dfinition de ltat de rfrence. Celui-ci correspond ltat dans lequel la protine et le ligand ninteragissent pas entre eux. Des approximations sont souvent faites ce niveau car il nest pas toujours possible dobtenir des structures non lies des complexes qui servent de rfrence. Dans ce cas ltat de rfrence est donn partir dune valeur spcifique empirique ou dun potentiel moyen calcul partir de toutes les donnes disponibles et avec une correction approprie. Le deuxime point important est la manire dont sont collectes les statistiques dinteraction. Le plus souvent elles doivent tre dpendantes de la distance et permettre de bien dissocier ltat entre deux atomes o linteraction existe et ltat o elle nexiste pas ou plus. Il est possible de distinguer deux types dapproche pour la prise en compte des distances et des interactions. Une approche grossire, rudimentaire consiste prendre une distance limite et considrer quen dessous de cette distance il y a interaction et au-del quil ny a plus dinteraction. Une approche fine value le potentiel de manire continue sur la distance interatomique ; pour rduire ces calculs il peut exister une distance limite au-del de laquelle les interactions sont considres comme ngligeables. Le fait que les forces soient incluses de manire implicite dans le potentiel rend difficile lidentification des problmes dus une mauvaise reproduction des valeurs exprimentales. Nanmoins pour le PMF il apparat quil minimise les effets du solvant.

Comme dans le cas empirique ces fonctions sont dpendantes de leurs groupes dapprentissage. Elles ne peuvent modliser que les interactions qui existent dans les exemples fournis pour leur laboration. Et pour ces interactions elles ne reconnaissent que celles qui ne dvient pas trop de leur modle.

Les diffrents potentiels varient suivant les types datomes dfinis, la nature et la taille des donnes exprimentales utilises, lchelle des distances inter atomiques parcourues et la varit de celles-ci.

Lun des potentiels les plus simples est le PLP (Piecewise Linear Potential) [67]. Il est bas sur la dfinition de quatre types datomes et prend en compte les interactions striques et les ponts hydrogne. Un potentiel de torsion calcule lnergie interne du ligand. Le terme des ponts hydrogne a t ensuite modifi pour y inclure une valeur dangle [68].

SMoG96 (Small Molecule Growth) est un PMF utilis pour la conception de novo de ligand [69]. Il a t obtenu partir de 126 structures issues de la PDB avec comme but un rsultat rapide. De ce fait son potentiel est assez grossier. Les distances atomiques sont prises en compte en dessous de 5 angstrms. Ltat de rfrence est dfini comme

30

un complexe entre le ligand et la protine placs au hasard et qui ninteragissent pas. Le potentiel de rfrence est une moyenne des potentiels de chaque type datome. Une mise jour, nomme SMoG2001 a t faite partir de 725 complexes en modifiant la procdure de traitement des paires datomes. Dans la dernire version, chaque paire datomes conduit deux potentiels de distance diffrents [70].

BLEEP (Biomolecular Ligand Energy Evaluation Protocol) comporte 2 potentiels (BLEEP-1 et BLEEP-2) [71]. BLEEP-1 est driv dun ensemble de 351 structures de complexes non-homologues issus de la PDB et ne contient pas de terme pour les interactions ligand-solvant. BLEEP-2 est driv de 188 structures de la PDB et prend en compte les interactions avec leau. Dans les deux cas, il sagit de potentiels fins dont la distance limite des interactions est de 8 angstrms. De plus, des potentiels pour les paires datomes mtalliques ont t drivs de ltude de 198 structures de la PDB. A linverse de beaucoup de potentiels bass sur des donnes, BLEEP ne fait pas de distinction entre les types datomes du ligand et de la protine. Il faut noter que BLEEP-2 se montre plus performant que BLEEP-1 [72].

4. POTENTIELS BASES SUR LE PREMIER PRINCIPE DE LA THERMODYNAMIQUE

Dans ce cas lentropie est considre comme ngligeable. Ces mthodes estiment

la diffrence denthalpie dinteraction dun complexe en additionnant les contributions individuelles des diffrents types dinteractions.

Chaque terme est driv de la chimie ou de la physique thorique et non pas comme prcdemment dune adaptation de donnes exprimentales.

Les potentiels obissant au premier principe de la thermodynamique se basent sur les termes des fonctions des champs de forces. Dans la plupart des cas lnergie interne du ligand nest pas prise en compte. Ce manque conduit la plupart des fonctions surestimer la diffrence denthalpie quelles calculent par rapport aux rsultats exprimentaux. Le calcul des interactions solvant-solut seffectue laide dun solvant implicite. Dock et AutoDock possdent des fonctions de score qui utilisent les termes de Coulomb et de Van Der Waals du champ de forces AMBER [73].

- CHAPITRE 3 -

LA PEPTIDE DEFORMYLASE

1. GENERALITES

31

La disponibilit des squences du gnome microbien, dbutant en 1995, a jou un rle important dans le programme de dcouverte de mdicaments antibactriens en industrie pharmaceutique. Bien que les gnomes microbiens aient rvl une abondance de cibles potentiellement intressantes, peu ont rsult de ce grand effort. Au contraire, la plupart des agents antibactriens rcemment dcouverts et ciblant des enzymes connues ont t identifis par des mthodes biologiques traditionnelles. Par exemple, il y a quelques annes une cible a retenu lattention des chercheurs, cest la peptide dformylase bactrienne (PDF, EC 3.5.1.31) [42me et 44me meetings de lICAAC (Interscience Conference on Antimicrobial Agents and Chemotherapy ) aux USA].

Effectivement, les inhibiteurs de la peptide dformylase bactrienne occupent une place trs importante dans la recherche de nouveaux agents antibactriens pendant trois annes conscutives. Le processus de la synthse protique chez les bactries et chez les mammifres est semblable. Les deux utilisent les mmes aminoacides et codons et ont le mme mcanisme pour llongation. Lunique diffrence entre la synthse protique bactrienne et la synthse protique cytoplasmique chez les mammifres est lutilisation du N-formylmethionine comme initiateur pour le processus bactrien (figure 5) [74,75].

Tandis que la synthse cytosolique chez les mammifres est initie par une mthionine. Le N-formylmethionine est gnr par transformylation enzymatique du methionyl-tRNA par la formylmethionine tRNA transfrase (FMT) [76,77]. Le N-formylmethionine des protines bactriennes naissantes est limin par la suite par laction squentielle de la peptide dformylase et de la mthionine aminopeptidase (MAP) pour fournir la protine mature [76,78]. Ce cycle formylation-dformylation est retrouv chez toutes les espces bactriennes tudies.

Figure 5. Synthse protique chez les bactries.

Bien que des squences homologues la PDF bactrienne aient t identifies chez les Eucaryotes [79-82], la fonction exacte de ces homologues nest pas claire et les donnes actuelles suggrent que linhibition de ce processus chez les mammifres est trs faible sauf si linhibiteur est utilis des concentrations trs leves, lequel probablement guide vers dautres actions non spcifiques en plus de linhibition de la PDF.

32

Les inhibiteurs spcifiques de la PDF nexhibent aucune interfrence avec la croissance cellulaire chez les mammifres [83]. Cet effet spcifique bactrien de linhibition de la PDF dans la synthse protique pourvoit une base rationnelle de slectivit, faisant delle une cible attrayante pour la dcouverte de mdicaments antibactriens.

Lactivit de la PDF a t rapporte pour la premire fois par Adams en 1968 [84]. La PDF na t entirement caractrise quau dbut des annes 1990, quand le gne codant pour la PDF, le def a t clon [85] et la PDF surproduite chez Escherichia coli [85,86]. La PDF bactrienne utilise le Fe2+ comme lion mtallique catalytique [87-89]. Cependant, lion ferreux de la PDF est trs instable et, il est rapidement et irrversiblement oxyd en ion ferrique lair libre, rendant ainsi lenzyme inactive [90].

Heureusement, le fer peut tre remplac par le nickel in vitro, entrainant ainsi une trs grande stabilit de lenzyme avec une faible diminution de lactivit enzymatique [88]. Dans une synthse bibliographique rcente, Giglione et al. [91] et Yuan et al. [92] font ressortir les caractristiques biologiques de la PDF et son aptitude comme cible pour la dcouverte de nouveaux mdicaments antibactriens.

Clement et al. [93] ont pass en revue le potentiel des inhibiteurs de la PDF constituer une nouvelle classe dantibiotiques large spectre.

2. SOURCES DE LA PDF

2.1. PDFs bactriennes

Bien que lactivit de la PDF bactrienne ait t dcrite en premier en 1968 [84], lincapacit de purifier cette enzyme a empch les tentatives de sa caractrisation jusquau clonage du gne codant la PDF, le def, en 1993 [78]. Depuis, les gnes def de plusieurs espces bactriennes ont t clons et dans de nombreux cas surproduits. Le tableau 3 rsume les premiers travaux sur les PDF des diffrentes bactries.

Tableau 3. Les PDFs des diffrentes bactries daprs R. Jain et al. (2005). 1st Author (Year) Bacteria Comments

Meinnel [96] (1995) E. coli Zn-PDF: First reported purified bacterial PDF with

33

Zinc as catalytic metal ion

Rajagopalan [87] (1997) E. coli

Fe-PDF: First reported purified ferrous-containing PDF, with much improved specific activity

Groche [88] (1998) E. coli

Ni-PDF: Identification of nickel ion as the surrogate for highly active, and stable enzyme

Leiting [102] (1998) B. subtilis PDF overexpressed, no detailed enzyme properties Reported

Rajagopalan [99] (2000) E. coli Co-PDF was suggested as the surrogate for Fe2+-PDF

Margolis [103] (2001) S. pneumoniae Ni-PDF overexpressed, no detailed enzyme properties reported

Baldwin [100] (2002) S. aureus Ni-PDF overexpressed, no detailed enzyme properties reported

Li [104] (2002) L. interrogans Zn-PDF was purified

Guilloteau [101] (2002) B. stearothermophilus and P. Aeruginosa

Ni-PDF overexpressed, no detailed enzyme properties reported

Smith [105] (2003) H. influenzae Ni-PDF purified

Les mthodes pour comparer lactivit des enzymes purifies sont quelque peu confuses, particulirement, en termes de substrats utiliss. La mthode la plus communment utilise est lessai du couple enzymatique PDF/FDH [94] avec le formyl-Met-Ala-Ser (fMAS) comme substrat, le formate libr sous laction de la PDF est oxyd par la formate dshydrognase (FDH). Ceci rsulte de la rduction stchiomtrique dune molcule de NAD+ en NADH, qui provoque successivement une augmentation de labsorption 340 nm. Dans de nombreux exemples, le formyl-Met-Ala (fMA) est utilis comme substrat avec le couple PDF/FDH. Un autre substrat, le formyl-Met-Leu-p-nitroanilide est utilis avec le couple enzymatique PDF/aminopeptidase [95].

En 1993, le gne def de E.coli a t produit en quantit sufisante pour la premire fois (chez E.coli) et la protine obtenue purifie par une combinaison de mthodes chromatographiques : gel filtration, changeuse danions,[78,96]. La protine purifie peut facilement liminer le groupe formyle des diffrents substrats. Il a t trouv que lactivit de lenzyme purifie tait sensible aux chlateurs du mtal tels que la 1,10-phnanthroline et lacide thylne diamine ttraactique (EDTA), et que la protine purifie contenait un ion Zn par polypeptide.

La squence de la PDF de E.coli a t dtermine et un motif de liaison au Zinc caractristique des mtallopeptidases reconnu, HEXXH. Meinnel et al (1995) ont conclu que la PDF appartenait la superfamille des Zinc hydrolases [96]. Cependant lenzyme purifie avait une activit relativement faible avec un rapport kcat / Km = 83 M-1 sec-1 en utilisant le fMAS comme substrat.

La PDF Zinc de E.coli a t galement purifie, elle prsentait une plus grande activit avec le mme substrat (kcat / Km = 294 M-1 sec-1) [97]. En 1997, Rajagopalan et al.

34

taient les premiers rapporter que la PDF de E.coli contenant le fer pouvait tre la forme de lenzyme physiologiquement la plus intressante. Lenzyme fer purifie est instable et perd rapidement son activit au contact de lair par loxydation de son fer en ion ferrique [90]. Lenzyme fer est environ 100 fois plus active que celle zinc. Cependant la PDF-Fe de E.coli sest avre trs difficile utiliser en routine pour la caractrisation de lenzyme.

Plus tard le nickel a t utilis pour remplacer le fer afin de produire une enzyme hautement active et stable [88,98]. Alternativement, la PDF cobalt a galement t utilise comme substitut actif et stable de lenzyme [99]. Cependant, des tudes rcentes ont montr que la PDF fer de S. aureus peut maintenir son activit pendant plusieurs mois [100].

Actuellement, la PDF nickel est utilise pour des tudes structurales et lvaluation du potentiel de divers inhibiteurs.

Depuis la dcouverte que les PDF, dont le fer a t substitu par le nickel ou le cobalt, avaient une activit quivalente celle de lenzyme naissante, plusieurs laboratoires ont utilis ces substitutions pour une surproduction et une purification des protines dformylases. Actuellement, les dformylases ont t surproduites et purifies partir de sept diffrentes espces bactriennes au moins. Sur la base des squences publies du gnome bactrien, deux types de protines PDF ont t dfinis : Type I et Type II [101]. Les gnes def de Escherichia coli et Pseudomonas aeruginosa, qui codent pour les PDF de Type I, et ceux de Staphylococcus aureus et Bacillus stearothermophilus, qui codent pour les PDF de Type II, ont t clons et surexprims pour une tude comparative de la structure des deux types de PDF.

2.2. PDFs des parasites

Peu de travaux sur les PDFs des parasites ont t effectus. Six maladies tropicales majeures, malaria, filariasis, schistosomiasis, trypanosomiasis Aftricaine, maladie des Chagas et leishmaniasis, entranent ensemble plus dun million de morts chaque anne et causent dnormes souffrances plusieurs centaines de millions de personnes [106-108]web. La rsistance aux traitements actuellement utiliss contre la plupart des agents causant ces maladies est manifestement en augmentation et de nouveaux remdes sont requis sous peu. La PDF est indispensable chez les eubactries mais pas chez les humains. Sachant que la plupart des organismes responsables de ces maladies possdent la PDF, la recherche des inhibiteurs de cette enzyme constitue une voie trs prometteuse pour lavenir.

- Apicomplexa

A ce jour, Plasmodium falciparum est la seule espce du groupe dont la PDF a t dcrite [109]. Connaissant la grande conservation des squences de lapicoplaste, il existe probablement une squence unique pour toutes les PDF des Apicomplexa. Aucune preuve directe na t fournie concernant la localisation de la PDF de P. falciparum dans lapicoplaste. Cependant, la squence en aminoacides de cette PDF ressemble celle de la PDF des chloroplastes et elle est classe dans la mme branche que les PDF des chloroplastes des plantes dans larbre phylogntique des PDFs (Fig 2). Une dmonstration rcente que les PDFs des chloroplastes sont systmatiquement cibles au niveau des plastes des plantes suggre fortement que la PDF de P. falciparum est situe au niveau de lapicoplaste [110].

35

- Trypanosomes

Les trypanosomes causent de nombreuses maladies parasitaires graves. La plus clbre est la trypanosomiase Africaine ou la maladie du sommeil, qui est transmise par la mouche Tsts. Cette maladie est rapparue et constitue le problme de sant majeur dans lAfrique sub-saharienne. La maladie du sommeil recouvre actuellement deux maladies distinctes avec des signes cliniques diffrents chez les humains selon la rgion de lpidmie. Deux trypanosomes diffrents en sont responsables :Trypanosoma brucei gambiense (nord ouest de lAfrique) et T. brucei rhodesiense (sud est de lAfrique). La maladie de Chaga est une autre maladie majeure cause par un trypanosome, Trypanosoma cruzi, dans le sud de lAmrique. La Leishmaniose est cause par Leishmania major et transmise par les phlbotomes. Lorigine, la localisation et la fonction des deux PDFs des trypanosomes sont inconnues. Il a t dmontr que la N-formylation des protines est strictement requise dans les deux types dorganites, les plastes (Leishmania) et les mitochondries (L. major and Trypanosoma). Certains de ces protistes sont photosynthtiques (Euglena gracilis) et dautres non (Astasia longa) [111].

- Autres parasites

Lamibe D. discoideum possde une PDF qui est vraisemblablement situe dans sa mitochondrie [110]. Le gnome mitochondrial de cette espce code un grand nombre de protines (> 40). A cet gard, il ressemble troitement au gnome des mitochondries des plantes, dans lesquelles la PDF est connue pour tre fonctionnelle. Le gnome mitochondrial de Acanthamoeba castellanii [112] code un nombre similaire de gnes et, sur la base du mme raisonnement dcrit plus haut, possde vraisemblablement une PDF. Cette amibe est responsable de plusieurs infections opportunistes chez lhomme. Il est galement possible que dautres parasites humains troitement apparents, telle lespce Entamoeba (responsable de plusieurs maladies intestinales), possdent une PDF qui serait sensible aux mdicaments anti-PDF. Aucune squence de PDF na t dtecte dans le gnome du nmatode C. elegans. Ceci suggre que les nmatodes responsables de la filariose, comme Brugia malayi, ne soient pas sensibles aux drogues anti-PDF. De la mme faon, bien que lon connaisse peu de choses sur le nombre de gnes des mitochondries de lespce Shistosoma [113,114], le gnome mitochondrial dun autre membre apparent des Platyhelminthes, le turbellari Echinococcus multilocularis [115]web, contient un nombre similaire de gnes que C. elegans. Cest pourquoi, ces parasites ne sont probablement pas sensibles aux mdicaments anti-PDF.

3. STRUCTURE DE LA PEPTIDE DEFORMYLASE BACTERIENNE La plupart des structures obtenues sont disponibles via la Protein Data Bank

[15], le nombre de structures dune mme molcule avec ou sans ligand permet davoir une information pertinente. Nanmoins certains cas restent difficiles.

36

La structure tridimensionnelle de la PDF despces bactriennes varies a t dtermine. En plus des structures de lenzyme libre, plusieurs structures de complexes enzyme-inhibiteur ont t rsolues. Nous retrouvons dans le tableau 4 la liste des diffrentes structures publies ; Sans aucun doute cette liste continuera croitre.

La structure de la PDF de E. coli contenant du zinc a t initialement rsolue par la RMN en 1996 [116] et par cristallographie aux rayons X en 1997 [117]. La ralisation que la PDF contenant du fer est la forme physiologique de lenzyme, a dirig leffort rsoudre la structure 3-D de la Fe-PDF dans lespoir didentifier les facteurs qui font que cette forme de lenzyme est plus active que celle contenant du zinc. La premire structure cristalline de la PDF contenant du nickel (Ni-PDF) de E. coli a t rsolue immdiatement aprs la dcouverte que le nickel peut remplacer le fer tout en maintenant intacte lactivit de lenzyme [118].

Ultrieurement, les structures de la PDF de E. coli comportant divers mtaux ont t rsolues par RMN [119] ou par cristallographie aux rayons X [98]. Des structures de la PDF de E. coli cocristallises avec les produits de la raction du tripeptide Met-Ala-Ser [98] et linhibiteur actinonin [120] ont t, galement, rsolues.

Plusieurs laboratoires ont publi des Ni-PDF de E. coli cocristallises avec des inhibiteurs synthtiques de la PDF tels que le N-alkyl hydroxamate dure [121], le sulfonylhydroxamique acide [122], les N-formyl hydroxylamine peptidiques [120] et les inhibiteurs non peptidiques de la PDF [105].

Rcemment, les structures des PDFs de S. aureus [100,101], B. stearothermophilus [101], et P. aeruginosa [101] complexes linhibiteur naturel, lactinonin, ont t rsolues. Ces structures, en mme temps que la modlisation, fournissent une plateforme trs utile pour la conception des inhibiteurs futurs de la PDF.

Tableau 4. Travaux raliss sur les structures tridimensionnelles de diverses PDFs daprs R. Jain et al. (2005)

37

Une vue gnrale de la structure tridimensionnelle de la PDF de E. coli est

prsente dans la figure 6.

1st Author (Year) Type of PDF Used in the study Comments

Meinnel [116] (1996) E. coli Zn-PDF First attempt to solve PDF structure by solution NMR.

Chan [117] (1997) E. coli Zn-PDF First published 3-D PDF structure solved by X-ray crystallography.

Becker [118] (1998) E. coli Ni-PDF, crystal structure First Ni-PDF structure.

Becker [98] (1998) E. coli Fe-, Ni-, and Zn-PDF or with MAS. Defined S1 pocket

Dardel [119] (1998) E. coli Ni-PDF.

Solution structures of Zn- and Ni-PDF, suggesting that the difference in catalytic Power resulting from the nature of the metal.

Apfel [122] (2000) E. coli Ni-PDF with beta-sulfonylhydroxamic acid Structure of PDF-synthetic inhibitor complex

Clements [120] (2001) E. coli Ni-PDF, with inhibitors

Structures of PDF complexes with actinonin and N-formyl hydroxylamine inhibitor BB-3479

Hackbarth [121] (2002) E. coli Ni-PDF complexed with inhibitors

Structure of PDF complexes with VRC4307, an N-alkyl urea hydroxamate inhibitor.

Guilloteau [101] (2002)

PDFs from E. coli, S. aureus, B. stearothermophilus, and P. aeruginosa.

Extensive comparison of these PDFs and their complexes with actinonin.

Baldwin [100] (2002) S. aureus His-tagged Fe-PDF X-ray crystal structure of S. aureus ferrous-PDF

Smith [105] (2003) PDFs from E. coli, S. aureus, H. influenzae and S. pneunominae.

X-ray crystal structures of PDF from these organisms. It also describes complex Structure of nonpeptidic inhibitor with PDFs from E. coli and S. pneunominae .

38

Figure 6. Figure en ruban de la structure de la peptide dformylase de E. coli. Les rgions de lhlice sont montres en bleu, les feuillets- en rouge, et le reste en vert. Les atomes au niveau du centre du mtal sont colors par lment, avec le carbone en gris, lazote en bleu, loxygne en rouge, le soufre en jaune, le phosphore en magenta et lion mtallique en vert ; daprs M. K. Chan et al. (1997).

En rsum, La PDF de E. coli contient trois -hlices, trois feuillets et une hlice 3-10 critique. Le mtal du site actif est li de manire ttradrique Cys-90, His-132, His-136 et une molcule deau [116,117], mais la gomtrie globale du ttradre nest pas rgulire [98]. Lanalyse structurale des PDFs dautres espces rvle quelles adoptent, elles aussi, la mme conformation [101]. Lenvironnement autour du mtal au niveau du site actif prsente de grandes similitudes chimiques et gomtriques que les protases de la famille des thermolysines [117,119]. Cependant, la PDF est manifestement diffrente des autres protases zinc qui possdent le motif conserv de liaison au mtal HEXXH. La distinction la plus saisissante est que le troisime ligand du mtal est une cystine, au lieu dun glutamate ou dune histidine comme dans la thermolysine et les mtalloprotases de la matrice. Le Glutamate-133, proche de la liaison mtal-eau, joue probablement un rle crucial dans la protonation et la dprotonation des intermdiaires de la raction durant la catalyse [98,117]. Ce mcanisme catalytique est suppos ressembler celui de la famille des thermolysines. Une autre caractristique importante de la structure de la PDF est que laminoacide Gln-50, lequel est conserv dans les diffrentes PDFs comme rsidu central dans lhlice 3-10, est impliqu dans une liaison hydrogne avec leau lie au mtal. Ce rsidu glutamine peut galement jouer un rle important dans la protonation-dprotonation des intermdiaires de la raction durant lhydrolyse du groupement N-formyle [117]. La comparaison des liaisons de la PDF avec des ions mtalliques varis rvle que les structures des Ni-PDF et Fe-PDF sont trs similaires celle de la Zn-PDF. Par exemple, dans la Ni-PDF, lion nickel du site actif est li His-132, His-136, Cys-90, et une molcule deau en formant un ttradre, tel quobserv dans lenzyme zinc. Un ensemble de liaisons hydrogne impliquant les aminoacides conservs des PDFs est manifestement identifi et est apparemment partag par les trois formes de lenzyme. Malheureusement, la comparaison entre ces trois formes de PDF, lenzyme pure [119], lenzyme complexe avec le MAS (Met-Ala-Ser) [98] ou avec

39

lactinonin [101], ne rvle pas dexplication claire concernant la diffrence dans lefficacit catalytique de la fer-PDF ou de la nickel-PDF par rapport la zinc-PDF. Labsence dune quelconque diffrence structurale de ces diverses formes de PDF suggre que la diffrence dans lefficacit de lenzyme est vraisemblablement due la nature chimique des ions mtalliques [119].

Guilloteau et al. (2002) ont montr, tandis que toutes les structures du site actif des PDFs de diffrentes bactries taient similaires, qu il y a quelques distinctions structurales entre les PDFs de type I et de type II [101]. En gnral, les PDFs de type I de E. coli et P. aeruginosa se ressemblent beaucoup entre-elles, tout comme les PDFs de type II de S. aureus et B. stearothermophilus. Cependant, le C-terminal de lhlice trouv dans les PDF de type I est remplac dans le type II par une boucle, suivie dun petit brin . La signification de cette diffrence nest pas claire, du moment que les quatre protines catalysent la mme raction avec une efficacit similaire, et leur liaison lactinonin est quasiment identique. Baldwin et al. ont observ que la Fe-PDF de type II (S. aureus) pouvait retenir son activit catalytique pendant plusieurs mois, tandis que celle de type I (E. coli ) qui lui correspond tait extrmement instable [100]. Il ny a pas dexplication structurale pour cette diffrence dans la stabilit.

La structure du complexe enzyme-MAS rvle que la chane du substrat, du ct de la mthionine, sincruste soigneusement dans la poche S1, qui est une poche hydrophobe forme par Ile-44, Ile-86, Glu-88, Leu-125, Ile-128, Cys-129 et His-132 [98]. Des tudes de modlisation molculaire suggrent que la phnylalanine peut galement sajuster dans cette poche hydrophobe S1. La comparaison des structures des PDFs de diffrentes espces bactriennes [101] suggre que la poche S1 garde la mme forme dans toutes les enzymes, bien que diffrents rsidus revtissent la poche dans chaque cas. Les PDF de toutes les espces bactriennes ayant besoin dliminer le groupement formyle, il ny a pas de surprise ce que toutes ces enzymes aient une poche similaire pour recevoir la chane latrale de la mthionine. La composition de la poche S1 a t confirme davantage par les structures des complexes PDFs-inhibiteurs [116,123,124].

Les poches S2 et S3 ne sont pas bien dfinies. Toutes les PDFs ont en commun les rsidus Glu-88 et Gly-89 au niveau du site S2 [101], mais dans les structures 3-D, la poche S2 des PDF de type I est lgrement plus vaste que celle des PDF de type II. Les rsidus daminoacides formant le revtement de la cavit S2 diffrent selon les espces, mais la nature chimique de la totalit de la cavit demeure la mme pour toutes les PDs. Au contraire, les cavits S3 des PDF de diffrentes espces, prsentent une grande variation avec des diffrences qui altrent la forme et la nature chimique de la poche [101]. Le degr variable de conservation de la structure au niveau des poches de liaison avec le substrat peut permettre la diffrenciation entre les inhibiteurs spcifiques et les inhibiteurs large spectre. Il est probable que les inhibiteurs large spectre pourraient tre dsigns condition que lnergie de liaison provienne principalement des interactions avec des sites invariables des poches de liaison, tandis que les inhibiteurs spcifiques certaines espces pourraient rsulter dune focalisation sur les interactions avec des domaines variables. Une autre considration dans la conception des inhibiteurs de la PDF est le problme de rsistance.

Les structures 3-D des PDFs complexes avec des inhibiteurs synthtiques fournissent dimportants renseignements. Comme prvu, lion mtallique du site actif forme cinq liaisons avec les inhibiteurs [120-122]. Le groupement hydroxamate forme des liaisons hydrogne avec les chanes latrales de Glu-133 et Gln-50, confirmant lhypothse que ces deux aminoacides sont impliqus dans la catalyse [117]. La fonction NH de lIle-44 forme une liaison H avec le carbonyle P2 des inhibiteurs [120,121]. Pour les inhibiteurs peptidiques de la PDF, la chane latrale du rsidu P2 est principalement

40

expose au solvant mais ralise galement des interactions de Van Der Waals avec les chanes latrales des aminoacides de la cavit S2. La partie P3 de linhibiteur est principalement accessible au solvant [120].

Le centre actif de la PDF est plutt similaire celui des matrices des mtalloprotines (MMPs) [119]. Cette similarit est davantage confirme par le manque de slectivit de certains inhibiteurs de la PDF [122]. Les acides -sulfonylhydroxamiques, composs possdant une inhibition apprciable de la dformylase, inhibent galement les MMPs avec la mme puissance. Au contraire, certains inhibiteurs nont aucune action sur plusieurs autres types de mtalloprotases, telles que les endopeptidases neutres. Cette similitude structurale avec les MMPs implique une toxicit potentielle due une inhibition indsirable de MMPs lors de lutilisation des inhibiteurs de la PDF comme mdicaments antibactriens.

Cependant, depuis peu des diffrences significatives entre les MMPs et les PDFs ont t dmontres, il serait donc possible de concevoir des inhibiteurs de la PDF nayant aucun effet sur les MMPs [121].

Finalement, les structures tridimensionnelles des PDFs seules et de PDFs en complexes avec des inhibiteurs nous apprennent que la conception des inhibiteurs de la PDF ncessite une maximisation de la formation dun chlate avec le mtal du site actif et des interactions de Van Der Waals au niveau de la cavit S1. Les poches S2 et S3 de lenzyme sont relativement flexibles. Bien que ces sites puissent encore fournir une nergie de liaison additionnelle, il nest pas judicieux de fonder la majeure partie de lnergie autant de sites, car ils sont sujets des mutations qui nentranent pas forcment une diminution de lactivit enzymatique, laquelle pourrait rsulter dune frquence de rsistance leve. Cependant, les ensembles occupant les cavits S2 et S3 pourraient tre de bons endroits pour gnrer des proprits physico-chimiques convenables dans les inhibiteurs afin daccrotre leur pntration travers la membrane des cellules bactriennes, pour fournir des proprits pharmacocintiques correctes in vivo et rduire les problmes potentiels de toxicit.

Les inhibiteurs de la PDF, tels lactinonin, sont de puissants inhibiteurs avec des valeurs de Ki de lordre du nanomolaire. Nanmoins, la liaison de ces inhibiteurs avec la PDF ne provoque pas un changement apprciable de la conformation dans la structure de la protine [101,120].

4. CLASSIFICATION DES PDFS (ARBRE PHYLOGENETIQUE DES PDFs) A partir des donnes de squences obtenues chez les bactries et partir des

analyses des ensembles de dltions et dinsertions (appeles I1 et I2 dans la figure 7) localises entre des lments de structures secondaires identifis, il a t conclu que les PDFs peuvent tre divises en deux classes majeures [93].

La classe I est reprsente par lenzyme de E. coli et systmatiquement par les

PDFs de toutes les bactries Gram-ngatives (figure 8). La classe II est reprsente par la PDF de Bacillus stearothermophilus et contient

les PDFs des Mycoplasma et des bactries Gram-positives avec un faible taux de G+C (GC %) (figure 8).

Cependant, si deux PDFs apparaissent dans une bactrie Gram-positive, la seconde est souvent une enzyme appartenant la classe I. Des PDFs homologues significativement diffrentes de ces deux classes ont t trouves chez les bactries Gram-positives, ainsi que chez des bactries Gram-positives faible GC %, tel que

41

Clostridium beijerinckii. Finalement, la squence complte du gnome de lactinomycte Streptomyces coelicolor a rvl la prsence de quatre gnes def. Ceci correspond au plus grand nombre de gnes de PDF dtect chez le genre Eubactrium ce jour. Il est intressant de remarquer quune des quatre PDFs de cet actinomycte (S. coelicolor 1/4 dans la figure 8) diverge de toutes les autres PDFs connues.

Il a t rapport que les actinomyctes produisent naturellement une molcule avec une activit anti-PDF, lactinonin. Nanmoins, les actinomyctes sont eux-mmes rsistants lactinonin, probablement due lacquisition dune PDF rsistante lactinonin. Ce qui pourrait expliquer la prsence de ces diverses PDFs chez les actinomyctes. Alternativement, une fonction autre que la dformylation classique des polypeptides naissants peut expliquer lexistence dune PDF peu ordinaire et la duplication des gnes def chez S. coelicolor.

42

Figure 7. Alignement des PDFs des protistes eucaryotes.

43

4.1. Les PDFs des Eucaryotes suprieurs

Lanalyse des squences produites, rcemment, de gnomes complets de

plusieurs eucaryotes a tonnement rvl la prsence de PDFs orthologues [93]. Par exemple, deux PDFs de la classe I ont t identifies dans le gnome nuclaire de deux plantes monocotyldones et dicotyldones en pleine floraison [110]. Une squence de la PDF a t galement identifie dans le gnome de liverwort Marchantia polymorpha. Ceci indique que les PDFs sont prsentes dans toutes les plantes suprieures (Embryophyta). Ces enzymes diffrent des enzymes eubactriennes car elles possdent des pr-squences N-terminales qui ciblent des domaines catalytiques correspondant divers compartiments de la cellule. Par consquent, les PDFs mitochondriales des plantes (mPDFs) sont prises pour cibles au niveau des mitochondries seulement, tandis que les PDFs des chloroplastes (cpPDFs) sont les seules PDFs trouves dans les plastes (figure 8) [110]. Les cpPDFs sont troitement apparentes aux PDFs des cyanobactries (figure 8). Des orthologues des mPDFs ont t identifies chez les insectes et dans les tissus de divers vertbrs [110]. Tous les orthologues des PDFs danimaux ont des squences trs similaires celles des mPDFs et drivent manifestement de la mme branche de larbre phylogntique des PDFs (figure 8). La squence bactrienne qui ressemble le plus celles des diverses mPDFs est la PDF divergente de S.coelicolor (figure8).

4.2. Les PDFs des Eukaryotes infrieurs

Des PDFs ont t galement trouves dans les gnomes de protistes varis. Une cpPDF (PDF des plastes) a t identifie chez lagent de la malaria Plasmodium falciparum et semble tre prsente au niveau de lapicoplaste [109,110]. Une PDF a t galement retrouve chez lamibe Dictyostelium discoideum [110]. Cette PDF, probablement situe au niveau de la mitochondrie, prsente beaucoup de ressemblance aux PDFs de la classe II (Figure 8). Enfin, deux orthologues de PDFs diffrents ont t trouvs chez les kinetoplastes, Trypanosoma sp. et Leishmania major (Figure 8) [109]. Ces PDFs sont manifestement diffrentes des PDFs de classe I et II et sont proposes pour tre classes dans une nouvelle classe, la classe III.

4.3. Les PDFs orthologues des Archae

PSI-BLAST [125] est actuellement reconnu pour tre un outil puissant pour lidentification de squences biologiquement similaires. Ce programme a permis rcemment didentifier pour la premire fois deux nouvelles squences chez les Archaea prsentant une grande similitude aux PDFs (figure7 et 8).

44

Figure 8. Arbre phylogntique des PDF daprs Giglione et Meinnel (2001) Figure 8. Arbre phylogntique des PDF daprs Giglione et Meinnel (2001)

Ces PDFs des Archaea ont t trouves chez les euryarchaeota Methanothermobacter thermoautotrophicus (Genbank numro daccession AE000809) et Methanothermus fervidus (Genbank numro daccession CAA70987). Ces deux squences sapparentent troitement aux squences trouves dans les kinetoplastes (les PDFs de la Classe III). Une caractristique spcifique des PDFs des Archeae est lapparition dune insertion distale entre les motifs 2 et 3 (Figure 8). Etant donne lalternance des rsidus hydrophobiques et polaires dans cette insertion, son seul effet est probablement une faible extension du feuillet antiparallle loin du site actif. Nanmoins, il faut souligner que le motif 1 est le seul faiblement conserv chez cette espce.

Ainsi, il est clair que, contrairement ce qui est cru jusqu trs rcemment, les orthologues des PDFs ne sont pas spcifiques aux Eubactries, mais au contraire

45

apparaissent dans la plupart des branches de larbre phylogntique des organismes vivants. Cependant certains organismes, tels que les nmatodes, les moisissures et certaines Archeae, ne possdent pas dorthologues de PDFs. Bien entendu, il est possible que ces organismes aient une PDF avec un taux dhomologie en dessous du seuil tolr par le programme BLAST, mais il est peu probable. En effet, des recherches dans des bases de donnes diverses ont t accomplies sans succs. Depuis, de nouvelles squences de gnomes entiers seront disponibles dans les toutes prochaines annes, et il serait intressant didentifier ces organismes qui ne contiennent pas de PDF.

A partir de plus de 120 squences dorthologues de PDFs disponibles dans les bases de donnes, 56 squences de PDFs ont t slectionnes pour reprsenter la diversit des squences de cette enzyme. Les squences ont t alignes laide du logiciel "ClustalX" et larbre gnalogique construit par "Tree-View1.6". Le nombre (1,2 ou 4) indique que la squence est une des deux (ou des quatre) espces de PDF de cet organisme. cpPDF = pdf des plastes , mPDF = PDF des mitochondries.

46

- CHAPITRE 4 -

INHIBITEURS DE LA PDF BACTERIENNE

1. RECHERCHE DE NOUVEAUX ANTIBACTERIENS

Bien que le nombre dantibiotiques soit trs grand, la diversit des classes

chimiques quil reprsente est, cependant, limite et les mcanismes de rsistance sont le plus souvent lis chaque classe dantibiotique. Les nouvelles approches lgard de la recherche de nouveaux antibiotiques prennent avantage pour de nouvelles cibles impliques dans de nouveaux mcanismes dj explors dans la dcouverte de nouveaux mdicaments et pour lesquels les mcanismes de rsistance ne se sont pas largement dvelopps parmi les populations bactriennes.

Ainsi, parmi la plthore de nouvelles cibles potentielles, plusieurs semblent mieux convenir au processus de dcouverte de mdicaments, dans lequel elles rpondent des critres bien dfinis, telle leur capacit des essais dactivit in vitro. Aujourdhui, la recherche pharmaceutique de nouveaux antibiotiques implique une purification prliminaire de la cible in vitro, lisolement dinhibiteurs de plus ou moins faible affinit

Chikhi abdelouahab

Science