Office canadien de coordination de l’évaluation des technologie de la santé Pharmacothérapie de la maladie d’Alzheimer. I. Analyse comparative d’essais cliniques Christina Wolfson, Ph. D. 1,2 Yola Moride, Ph. D. 1,3 Anne Perrault, M. Sc. 1 Franco Momoli, M. Sc. 1,2 Louise Demers, Ph. D. 1 Mark Oremus, M.A. 1,2 mai 2000 Soutien technique assuré par : Carole Bohbot, Irina Lazariciu, Alexander Tsertsvadze 1. Centre d’épidémiologie clinique et d’études communautaires, Hôpital général juif-Sir Mortimer B. Davis, Montréal, (Québec) 2. Départements associés d’épidémiologie et de biostatistique et de santé professionnelle, Université McGill, Montréal (Québec) 3. Faculté de pharmacie, Université de Montréal, , Montréal, (Québec)
145
Embed
Pharmacothérapie de la maladie d’Alzheimer. I. … · Groupe de recherche en gériatrie Université McMaster ... l’étiologie de la maladie et la découverte d’un traitement
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Office canadien de coordination de l’évaluation des technologie de la santé
Pharmacothérapie de la maladie d’Alzheimer. I. Analyse comparative d’essais cliniques
Christina Wolfson, Ph. D.1,2
Yola Moride, Ph. D.1,3
Anne Perrault, M. Sc.1
Franco Momoli, M. Sc.1,2
Louise Demers, Ph. D.1
Mark Oremus, M.A.1,2
mai 2000
Soutien technique assuré par : Carole Bohbot, Irina Lazariciu, Alexander Tsertsvadze
1. Centre d’épidémiologie clinique et d’études communautaires, Hôpital général juif-Sir Mortimer B. Davis, Montréal, (Québec)
2. Départements associés d’épidémiologie et de biostatistique et de santé professionnelle, Université McGill, Montréal (Québec)
3. Faculté de pharmacie, Université de Montréal, , Montréal, (Québec)
1.1 INTRODUCTION............................................................................................................................................................. 4 1.2 OBJECTIVES................................................................................................................................................................... 5 1.3 EFFICACITÉ THÉORIQUE PAR RAPPORT À EFFICACITÉ PRATIQUE........................................................................... 5 1.4 SYNTHÈSE DES DONNÉES LES PLUS CONCLUANTES................................................................................................. 6 1.5 GROUPE DE RECHERCHE.............................................................................................................................................. 6
2.1 PHARMACOTHÉRAPIE DE LA MALADIE D’ALZHEIMER............................................................................................ 8 2.2 STRATÉGIE DE RECHERCHE......................................................................................................................................... 8
2.2.1 PERUSE – Université McGill............................................................................................................................9 2.2.2 Cochrane Library................................................................................................................................................9 2.2.3 Exposés de synthèse.............................................................................................................................................9 2.2.4 Autres publications............................................................................................................................................10
2.3 RÉSULTATS.................................................................................................................................................................. 10 2.3.1 Mode de sélection des essais à examiner.......................................................................................................10
3 DESCRIPTION MÉTHODOLOGIQUE ET SYNTHÈSE DES DONNÉES LES PLUS CONCLUANTES DES ESSAIS SUR LE TRAITEMENT DE LA DÉMENCE ...........................................14
4 SOMMAIRE DES RÉSULTATS DE LA SYNTHÈSE DES DONNÉES LES PLUS CONCLUANTES .............................................................................................................................................95
5. SOURCES DE RÉFÉRENCE................................................................................................................................... 106
6. BIBLIOGRAPHIE PAR AUTEURS ...................................................................................................................... 116
BIBLIOGRAPHIE DES ECR REJETÉS...................................................................................................................... 132
ANNEXE D : NOTE DE LA TRADUCTION .............................................................................................................. 139
1
EXAMINATEURS
Les personnes mentionnées ci-dessous ont eu l’amabilité d’offrir leurs observations sur le présent rapport. Toutefois, l’OCCETS assume l’entière responsabilité de sa forme et de son contenu définitifs.
Conseil consultatif scientifique de l’OCCETS Dre Gina Bravo Institut de gériatrie Université de Sherbrooke Sherbrooke (Québec) Dr David Persaud Université Dalhousie Halifax (Nouvelle-Écosse)
Examinateurs externes Dr Richard Gladstone Université de Toronto Toronto (Ontario) Dr Willie Malloy Groupe de recherche en gériatrie Université McMaster Hamilton (Ontario)
REMERCIEMENTS
L’Office canadien de coordination de l’évaluation des technologies de la santé (OCCETS) a
financé la présente étude, tandis que le Fonds de la recherche en santé du Québec (FRSQ), par
l’entremise de l’Équipe prioritaire de l'épidémiologie de la démence chez les personnes âgées,
a assuré en partie la rémunération de Carole Bohbot et d’Alexander Tsertsvadze.
2
SOMMAIRE
La maladie d’Alzheimer, affection invalidante touchant principalement les personnes
âgées, représentera de toute évidence un important problème de santé publique au Canada au
cours des deux prochaines décennies. En effet, selon des prévisions récentes, le nombre de cas
de maladie d’Alzheimer au Canada passera de 160 000 à plus de 380 000 d’ici 2020. Ces
prévisions sont fondées sur l’hypothèse voulant que l’incidence de la maladie d’Alzheimer
demeure inchangée.
De vastes initiatives de recherche au Canada et dans le monde entier sont axées sur
l’étiologie de la maladie et la découverte d’un traitement curatif. D'ici à ce que ces recherches
soient fructueuses, des milliers de personnes âgées au Canada continuent néanmoins de
souffrir de la maladie d’Alzheimer. C’est pourquoi la recherche actuelle est également centrée
sur la mise au point de traitements médicamenteux susceptibles de ralentir la progression de la
maladie chez ces personnes.
Dans le présent rapport, nous examinons des essais cliniques publiés caractérisés, à
notre avis, par une rigueur méthodologique telle qu’ils offrent les meilleures données
probantes qui soient sur l’efficacité du donépézil, du métrifonate, de la rivastigmine, de la
sélégiline, de la vitamine E, de la lécithine, de la linopirdine, de la propentofylline et du
Gingko Biloba dans le traitement de la maladie d’Alzheimer.
Par la recherche documentaire, nous avons relevé 27 essais cliniques randomisés qui
répondent aux critères méthodologiques appropriés.
Nous concluons, d'une part, que les données publiées ne permettent pas d’établir
l’efficacité de la sélégiline, de la vitamine E, de la lécithine, de la linopirdine et de la
propentofylline.
D’autre part, d’après les faits probants examinés, le donépézil, le métrifonate et la
rivastigmine procurent tous trois une amélioration modeste, statistiquement significative, du
rendement cognitif et du fonctionnement global de personnes âgées atteintes de la maladie
d’Alzheimer probable, qui satisfont aux critères d'admissibilité d’essais cliniques. Dans tous
ces cas, l’ampleur de l’effet est du même ordre. Quant au Gingko Biloba, les résultats des
essais sont prometteurs, mais l'effet de cet extrait n'est pas aussi marqué que celui des
médicaments mentionnés ci-dessus.
3
Quoique tous ces médicaments soient bien tolérés, quant à la fréquence d’effets
indésirables, le taux d’abandon est élevé dans certains cas, d’où une surestimation possible de
l'efficacité thérapeutique apparente.
Il importe de souligner que le présent rapport n’est fondé que sur les résultats d’essais
publiés et que, de ce fait, il peut être marqué d’un biais de publication. Plus précisément, s’il
est vrai qu’il est moins probable que les essais ne démontrant pas d'effet thérapeutique soient
publiés, nos constatations surestimeraient alors l’efficacité en raison de l’inclusion sélective
d’essais positifs. Par contre, le rejet d’essais non publiés pour cause de faiblesse
méthodologique n’entraîne vraisemblablement pas de biais, puisqu’il est fort peu probable que
ces essais auraient répondu à nos critères de rigueur méthodologique.
Dans le rapport complémentaire (Pharmacothérapie de la maladie d’Alzheimer. II.
Examen des instruments de mesure utilisés dans les essais cliniques), nous étudions les
qualités psychométriques des instruments de mesure principaux et secondaires de ces essais, et
nous ne pouvons que constater à regret l’utilisation d’une vaste gamme d’échelles qui n'ont
pas fait l'objet d'une évaluation psychométrique appropriée. Bien que la fiabilité et la validité
d’un grand nombre de ces échelles ne fassent aucun doute, leur sensibilité au changement n’a
pas été évaluée de façon appropriée. C’est pourquoi la portée clinique des écarts médicament:
placebo demeure imprécise.
L’aptitude à effectuer une analyse comparative de médicaments employés dans le
traitement de la maladie d’Alzheimer ne repose pas uniquement sur la comparabilité de la
structure, de la durée et des instruments de mesure des essais, mais dépend également des
modes de présentation des résultats. À cet égard, la présentation des résultats des essais sur la
maladie d’Alzheimer, même des essais effectués par le même groupe de chercheurs, n’est pas
uniforme. Tout en sachant que les revues spécialisées préconisent leurs propres lignes
directrices en matière de rédaction, nous proposons que les rapports d’essai clinique sur des
médicaments employés dans la maladie d’Alzheimer se conforment à un mode de présentation
des résultats normalisé, afin d’accroître la possibilité de comparer les résultats de diverses
études.
4
1 INTRODUCTION
1.1 Introduction
La maladie d’Alzheimer (MA) est une affection débilitante entraînant le déclin de la
mémoire à court terme et de la mémoire des faits récents, et la détérioration d’autres
fonctions cognitives supérieures, telles l’attention. Avec le temps, l’amnésie est d’une telle
ampleur qu’elle occasionne la perte d’autonomie totale. Les données les plus récentes sur la
prévalence de la MA au Canada sont tirées de l’Étude sur la santé et le vieillissement au
Canada (ESVC), qui a pris fin en 1992 (1). Dans cette enquête auprès d’un échantillon
représentatif de la population, on a procédé au dépistage du déficit cognitif en administrant la
version modifiée du mini-examen de l'état mental (3MS) à des groupes de personnes âgées
de 65 ans et plus, sélectionnées de façon aléatoire (2). Les personnes chez qui on a décelé un
déficit cognitif et un échantillon aléatoire de personnes n'accusant pas ce déclin ont subi une
évaluation clinique pour déterminer la présence de démence et établir un diagnostic. Le
diagnostic de démence a été établi d’après les critères du Manuel diagnostique et statistique
des troubles mentaux (DSM-IIIR) (3) et celui de la MA selon les critères du National
Institute of Neurological Disease and Stroke – Alzheimer’s Disease and Related Disease
Association (NINCDS/ADRDA) (4). Les résultats de l’évaluation de 9 008 personnes âgées
vivant dans la collectivité indiquent que la prévalence de la MA est de 1 % chez les
personnes âgées de 65 à 74 ans, de 7 % chez les personnes âgées de 75 à 84 ans et de 26 %
chez les personnes de plus de 85 ans.
Les résultats de l’ESVC quant à la prévalence concordent avec ceux d’études
effectuées ailleurs. On estime que, au moment de l’étude, plus de 78 000 personnes âgées
canadiennes vivant dans la collectivité étaient atteintes de la MA. Selon les prévisions de
cette même étude, fondées sur l’hypothèse voulant que l’incidence et la survie demeurent
stables, le nombre total de personnes atteintes de la MA au Canada (au sein de la collectivité
ou en établissement) passera d’environ 161 000 (1992) à plus de 387 000 d’ici 2020, de sorte
que cette maladie représentera un important problème de santé publique au cours du nouveau
millénaire.
Avant la dernière décennie, il n’existait aucun médicament efficace dans le traitement
de la maladie d’Alzheimer (MA). En septembre 1993, la Food and Drug Administration
5
(FDA) des États-Unis a approuvé l’utilisation de la tacrine (Cognex®) dans le traitement de la
MA. Puis, en novembre 1996, l’organisme approuvait l’utilisation du donépézil
(ARICEPTMD). À ce sujet, le Canada a emboîté le pas en août 1997, sans toutefois approuver
l’utilisation de la tacrine. À l’heure actuelle, d’autres médicaments en sont à l’étape des
essais et certains d’entre eux semblent prometteurs. Dans le présent rapport, nous examinons
les données les plus concluantes concernant l’efficacité d’un certain nombre de médicaments
dans le traitement de la MA. L’évaluation des médicaments employés dans le traitement de la
MA est complexe en raison de la disparité des aspects méthodologiques des essais (p. ex., la
structure de l’essai, les critères d’inclusion, les instruments de mesure des résultats, les doses,
la durée de l’essai, la taille de l’étude, etc.) ainsi que de l'hétérogénéité des modes de
présentation des techniques d'analyse et des résultats détaillés dans la documentation publiée.
Dans une étude antérieure sur la tacrine (5), nous constatons qu’il n’est pas judicieux de
regrouper des essais en vue d’effectuer une méta-analyse standard à cause de la disparité des
méthodes utilisées.
1.2 Objectives
Le projet comporte trois objectifs principaux :
1 : Évaluer les données probantes sur l’efficacité clinique de divers médicaments dans le
traitement de la MA.
2 : Comparer l’efficacité clinique de ces médicaments dans le traitement de la MA.
3 : Examiner, dans le rapport complémentaire, les données sur la fiabilité et la validité
des instruments de mesure principaux et secondaires utilisés dans les essais
sélectionnés à la partie I.
1.3 Efficacité théorique par rapport à efficacité pratique
L’efficacité théorique d’un traitement pharmacologique ou médical se définit comme
l’étendue de l’effet bénéfique produit par une intervention particulière dans des conditions
idéales. En règle générale, la détermination de l’efficacité théorique constitue le but des
essais cliniques randomisés. L’efficacité théorique est le préalable à l’efficacité pratique, qui
se définit comme la mesure de l’étendue de l’effet bénéfique produit par une intervention
particulière dans des conditions qui s’apparentent à la « situation réelle ». L’extrapolation,
6
soit la transposition des données sur l’efficacité théorique en indication d’efficacité pratique,
est complexe et nécessite l’étude non seulement d’un certain nombre de caractéristiques de
l’essai (p. ex., les critères d’exclusion, l’observance du régime thérapeutique, le taux
d’abandon de l’étude, la surveillance de l’observance, etc.), mais également des
renseignements sur l’acceptation du traitement par les patients, les dispensateurs de soins et
les médecins traitants.
1.4 Synthèse des données les plus concluantes
C’est un fait admis depuis longtemps que les études descriptives traditionnelles ne
constituent pas la démarche idéale pour évaluer l’efficacité de stratégies thérapeutiques.
Aussi a-t-on vu apparaître au milieu des années 1970 la méta-analyse, mécanisme de
synthèse des constatations de diverses études sur le même sujet en vue d’améliorer la qualité
de l’évaluation des données probantes. Même si la méta-analyse comme moyen d’évaluer
l’efficacité d'études interventionnelles s’est répandue comme une traînée de poudre, ce type
d’analyse comporte ses propres limites et suscite des problèmes. Les lecteurs intéressés par
ce sujet sont priés de consulter l’excellente étude de Slavin (6) pour plus de renseignements.
À titre de solution au problème des conclusions trompeuses découlant des méta-
analyses, Slavin propose une démarche appelée « synthèse des données les plus
concluantes », qui englobe nombre des aspects avantageux de la méta-analyse tout en
conservant des éléments importants des études descriptives « avisées et approfondies ».
Cette démarche de synthèse des données les plus concluantes comprend la sélection
judicieuse d’études d’après des critères de rigueur méthodologique et la synthèse de la
documentation choisie, mais ne débouche pas sur la présentation d’un sommaire de données
statistiques fondées sur une analyse quantitative.
1.5 Groupe de recherche
L’étude s’est tenue au Centre d’épidémiologique clinique et d’études communautaires
(CECEC) de l’Hôpital général juif – Sir Mortimer B. Davis de Montréal (Québec) au
Canada. Voici les quatre chercheurs : Dre Christina Wolfson, neuroépidémiologiste et
professeure agrégée au Département d’épidémiologie et de biostatistique de l’Université
McGill; Dre Yola Moride, pharmacoépidémiologiste et professeure adjointe à la faculté de
7
pharmacie de l'Université de Montréal; Anne Perrault, épidémiologiste et chargée de
recherche au CECEC; Franco Momoli, étudiant au programme de doctorat au Département
d'épidémiologie et de biostatistique de l'Université McGill. L’étude amorcée, Louise Demers,
ergothérapeute, boursière en perfectionnement postdoctoral au CECEC et experte en matière
d’échelles fonctionnelles, s’est jointe à l’équipe. Le coordonnateur du projet est Mark
Oremus, étudiant au programme de maîtrise au Département d’épidémiologie et de
biostatistique de l’Université McGill. Deux assistants à la recherche, Irina Lazariciu,
étudiante au programme de maîtrise au Département de mathématiques et de statistique de
l’Université McGill, et le Dr Alexander Tsertsvadze, étudiant au Département
d’épidémiologie et de biostatistique de l’Université McGill, ont assuré le soutien technique.
Enfin, Carole Bohbot a exercé les fonctions de secrétaire.
8
2 MÉTHODOLOGIE
2.1 Pharmacothérapie de la maladie d’Alzheimer
Pour recenser les divers médicaments employés dans le traitement de la MA, nous
avons d’abord consulté le Web, des manuels médicaux généraux et des manuels traitant de la
MA et de la démence. Comme nous avons sélectionné les médicaments sans égard à leur
mécanisme d’action, nous en avons relevé 86. En accord avec l’OCCETS, nous avons axé la
stratégie de recherche de rapports d’essai publiés sur des médicaments commercialisés ou qui
en sont à l’étape des essais cliniques de phase III de sociétés pharmaceutiques. Par
commercialisés, nous entendons des médicaments disponibles soit sur ordonnance ou en
vente libre. L'approbation du médicament par la Direction générale de la protection de la
santé de Santé Canada ou son inscription sur une liste de médicaments d’un régime
d’assurance-médicaments provincial ne constituent pas des préalables au respect du critère de
commercialisation. Ainsi, des 86 médicaments relevés, nous en avons conservé 14
(tableau 2.1).
Tableau 2.1 : Médicaments employés dans le traitement de la maladie d’Alzheimer – Commercialisés ou en essai clinique de phase III
donépézil métrifonate
rivastigmine galantamine
lécithine
vitamine E sélégiline
Gingko Biloba œstrogène aspirine
indométhacine prednisone
linopirdine propentofylline
2.2 Stratégie de recherche
La stratégie de recherche comporte quatre axes précis : (i) PERUSE – Université
McGill; (ii) Cochrane Library; (iii) exposés de synthèse; (iv) autres publications. Les essais
cliniques publiés avant 1986 sont rejetés d'emblée. Vu que les critères diagnostiques de
recherche NINCDS/ADRDA (4) de la MA ont été publiés en 1984, nous sommes d’avis qu’il
9
aurait été difficile d’établir la validité des diagnostics de MA des essais effectués avant cela.
Nous avons également écarté les rapports non publiés et les études parues exclusivement
sous forme de résumé.
2.2.1 PERUSE – Université McGill
PERUSE est un moteur de recherche des bibliothèques de l’Université McGill qui
offre l’accès à plusieurs bases de données dans les domaines des sciences sociales, des
sciences de la vie et des sciences physiques. Nous l’avons utilisé pour consulter les bases de
données suivantes : Applied Science and Technology, CINAHL (soins infirmiers et
paramédicaux), Core Biomedical Collection, Core Biomedical Collection III, HealthSTAR,
MEDLINE et PsycINFO.
Les noms des médicaments présentés au tableau 2.1 sont les mots-clés utilisés lors de
la recherche. De plus, chaque nom de médicament a été associé aux mots-clés « Alzheimer »
et « randomized ». Dans toutes les bases de données, nous avons également utilisé le
syntagme général de MeSH, « Alzheimer's Disease/drug-therapy », afin de relever des
exposés de synthèse et d’autres essais cliniques contrôlés et randomisés (ECR).
2.2.2 Cochrane Library
La Cochrane Library est une série de bases de données mises à jour à intervalles
réguliers, qui renferment des études méthodiques et actuelles d’ECR. Pour repérer d’autres
ECR et exposés de synthèse que ceux relevés par l’entremise de PERUSE, nous avons utilisé
le Cochrane Controlled Trial Register (CCTR), bibliographie d’essais cliniques au sein de la
vaste base de données. Dans ce cas, le syntagme de recherche était « Alzheimer-disease-
drug-therapy ».
2.2.3 Exposés de synthèse
Les deux recherches documentaires mentionnées ci-dessus nous ont permis de relever
40 exposés de synthèse, que nous avons dépouillés manuellement pour cerner d’autres ECR.
Dans ce cas, nous avons dépisté surtout des essais cliniques publiés avant 1990.
10
2.2.4 Autres publications
Nous avons consulté divers journaux, coupures de presse et magazines rassemblés par
le chercheur principal afin de dépister des sources de référence portant sur des essais
cliniques ou des exposés de synthèse.
2.3 Résultats
Par la recherche documentaire, nous avons relevé 65 essais cliniques (tableau 2.2).
2.3.1 Mode de sélection des essais à examiner
Pour circonscrire les essais à examiner, nous avons procédé à l'évaluation à l'aveugle
de la qualité des 65 essais et à l'examen des critères diagnostiques utilisés dans ces essais.
Avant d’amorcer ce processus, trois examinateurs (CW, YM et FM) ont effectué une étude à
l’aveugle indépendante d’un traitement de la MA qui n’est pas soumis à la présente analyse.
Un assistant à la recherche a donc extrait divers renseignements d’un essai clinique sur la
thiamine (7), soit le résumé, l’année, le nom de la revue, le nom des auteurs, la section des
résultats et des observations. L’évaluation de la rigueur méthodologique de l’essai repose sur
l'utilisation de l’échelle Jadad (8). À la conférence de concertation qui a suivi l’examen de
l’essai sur la thiamine, nous avons convenu de conserver les renseignements de la section des
résultats portant sur les malades perdus de vue en période post-thérapeutique, les abandons et
les effets indésirables dans les rapports soumis à l'évaluation à l’aveugle. Cet exercice a
également permis d’éclaircir le mécanisme de cotation de l’échelle Jadad, décrit comme « un
indice quantitatif de la probabilité que la méthodologie et les résultats présentés dans un
[essai] sont dénués de biais » (9). Déterminer par cotation la qualité d’un essai clinique
constitue une façon de s’assurer que seuls les essais les plus rigoureux sur le plan
méthodologique sont choisis en vue d’une étude méthodique (10).
À cet égard, nous avons choisi l’échelle Jadad en raison de sa facilité d’utilisation et
de sa construction appropriée. Dans leur examen de 24 instruments de mesure de la qualité,
Moher et collab. (9) constatent que l’échelle Jadad est le seul instrument qui répond à leurs
critères d’élaboration rigoureuse. Ces critères sont les suivants : le compte rendu précis du
mode de sélection initiale des items de l’échelle et des motifs du choix définitif, et
11
l’explication de la façon dont l’instrument distingue les ECR les uns des autres sur le plan de
la qualité. Il existe deux versions de l’échelle Jadad, la version à trois items et celle à six
items. Le tableau 1 de l’annexe A renferme les trois questions (à propos de la randomisation,
du mécanisme à double insu et du taux d’abandon) de l'échelle à trois items. Dans la présente
étude, nous utilisons l’échelle à six items (qui comprend les questions des tableaux 1 et 2 de
l’annexe A), dont les scores vont de 0 à 8.
D'après Jadad et collab. (8), la fidélité inter-juges de leur échelle est de passable à
bonne. Dans leur étude, les auteurs déterminent la fiabilité en demandant à sept examinateurs
d’évaluer 36 essais de recherche sur la douleur et à huit autres examinateurs de les évaluer à
l’aveugle (masquage des noms de l’auteur et de la revue ainsi que des résultats). Les
coefficients de corrélation intraclasse (CCI) vont de 0,56 à 0,76 quant à l’analyse des
versions à trois items et à six items de l’instrument. Une étude récente (11) de 76 essais dans
le domaine des transfusions sanguines au cours d’interventions chirurgicales révèle que la
fidélité inter-juges de l’échelle Jadad est faible (coefficients kappa de 0,37 à 0,39), lorsque
deux ou quatre évaluateurs examinent les articles publiés, que ce soit à l’aveugle ou de façon
ouverte. La suppression de l'item concernant la description appropriée des abandons
s'accompagne d'une hausse de la fidélité inter-juges (coefficients kappa de 0,53 à 0,59).
Même si la fiabilité inter-juges de l’échelle Jadad diffère dans les deux études
mentionnées ci-dessus, nous avons tout de même choisi cet instrument en raison de sa
structure rigoureuse et de sa facilité d’utilisation. De plus, nous avons conservé l'item sur les
abandons parce que la détermination de l’efficacité d’un médicament devrait tenir compte de
l’incidence des abandons. À notre avis, la question sur les abandons ne compromet pas
nécessairement la fiabilité de l’échelle Jadad, car la fidélité inter-juges varie d’un domaine de
recherche à un autre. Le piètre rendement d’un item dans ce domaine ne signifie pas
automatiquement qu’il en sera de même dans un autre domaine. Nous avons examiné la
fidélité inter-juges une fois que tous les essais ont été notés, pour voir en rétrospective s’il y
avait matière à préoccupation.
À la suite de la session de formation concernant l’essai sur la thiamine, un adjoint à la
recherche a remis une copie masquée de la section méthodologique des 65 essais aux
examinateurs. Il leur a également transmis la partie des résultats décrivant les abandons et les
12
suivis impossibles. Pour masquer les copies, on a extrait toutes les mentions de l’auteur, de la
revue et de l’endroit. Chaque examinateur a évalué à l’aveugle de façon indépendante les
65 essais. De plus, nous avons tenu une conférence de concertation afin de déterminer les
écarts de cotation de certaines études et de résoudre ce problème le cas échéant; mais aucun
problème de cette nature ne s’est présenté.
À cette conférence, les examinateurs ont convenu de rejeter les essais dont la cote de
qualité était inférieure à 5. Compte tenu du mécanisme de cotation de l’échelle Jadad, cette
façon de procéder ferait en sorte que les rapports d’essai retenus seraient presque à coup sûr
randomisés et à double insu. En outre, ces rapports contiendraient à tout le moins des
renseignements sur certaines autres caractéristiques jugées importantes (par les
examinateurs) dans l’évaluation de traitements médicamenteux (p. ex., les abandons, les
effets indésirables, les critères d’inclusion/d’exclusion et les analyses statistiques).
Dans une évaluation distincte, l’un des examinateurs (CW) a passé en revue les
critères diagnostiques utilisés dans les essais. Outre le fait d’obtenir une cote de 5 ou plus sur
l’échelle Jadad, les essais retenus devaient mentionner l’utilisation des critères diagnostiques
NINCDS/ADRDA (4) dans le diagnostic de la MA. Étant donné que la MA est un syndrome
plutôt qu’une maladie comportant ses propres marqueurs biologiques décelables avant le
décès, il importait de s’assurer que les essais avaient recours aux mêmes critères
diagnostiques dans la sélection de leurs participants afin d’optimiser la comparabilité des
essais sur le plan des caractéristiques des malades. À cet égard, plusieurs des études sur le
Gingko Biloba (12-14) n’indiquent pas clairement si les participants satisfont aux critères
NINCDS/ADRDA. Nous avons consulté un neurologue spécialiste de la cognition afin de
déterminer la justesse des critères diagnostiques utilisés dans ces essais. En fin de compte,
nous avons écarté les essais qui n’utilisent pas les critères NINCDS/ADRDA, quelle que soit
leur cote de qualité.
Le tableau 2.2 présente les essais retenus. Les motifs de rejet figurent à la section
portant sur les médicaments (chapitre 3) et à l’annexe B.
Selon les examinateurs, l’échelle Jadad est facile à utiliser puisqu'ils ont pu évaluer
les essais en moins de 10 minutes chacun. À partir des données des études à l’aveugle, nous
13
avons évalué la fidélité inter-juges en déterminant le coefficient de corrélation intraclasse
(CCI) (15). Celui-ci s’établissant à 0,9, la fidélité inter-juges est excellente.
Parallèlement au processus d’évaluation à l’aveugle, trois autres chercheurs (AP, LD
et MO) ont commencé l’examen des qualités psychométriques des instruments de mesure
principaux et secondaires utilisées dans les essais sélectionnés lors de la recherche initiale.
Étant donné l’échéancier du projet, ce dernier groupe a passé en revue des essais qui ont été
écartés en bout de ligne.
Tableau 2.2 : ECR relevés lors de la recherche documentaire et ECR retenus Médicament
caractéristiques de l’état végétatif, apathie, agressivité et labilité affective). L’article de fond
de Tariot et collab. (63) à ce sujet ne propose pas de directives quant à la cotation de l’échelle
C-BRSD, mais on peut soit effectuer la sommation des scores de fréquence des divers items
57
ou dénombrer les troubles de comportement repérés. La méthode de cotation n’est pas
précisée dans le document de Sano et collab., mais dans un cas comme dans l’autre, plus le
score est élevé plus les troubles de comportement sont nombreux. Tant dans le groupe de la
sélégiline que dans le groupe du placebo, l’état des malades se détériore, quoique
l’augmentation moyenne du score C-BRSD diffère, à savoir des augmentations moyennes
respectives de 5,4 et de 8,9 (l’écart n’est pas statistiquement significatif).
Il est difficile de déterminer l’effet de la sélégiline sur l’humeur et le comportement
en raison de la disparité des échelles utilisées dans les essais. Il est en effet malaisé d’établir
des comparaisons car les échelles couvrent des ensembles d'items très différents. Ainsi,
l’échelle BPRS ne porte pas sur une gamme appropriée de problèmes liés à la MA. De son
côté, l’échelle ADAS-noncog (64-66) comporte des items qui débordent du cadre du
domaine, mais n’en couvre pas d’autres qui revêtent de l’importance dans la MA. À
l’exception de l’essai de Lawlor et collab. (46), la plupart des essais n’ont pas admis de
malades présentant des troubles de comportement et de l’humeur, tout en considérant ces
aspects comme des résultats secondaires. Dans ces ECR, les conditions ne sont pas propices à
l’évaluation de l’effet d’une intervention sur le comportement et l’humeur.
Dans l’ensemble, la sélégiline ne produit pas d’effet significatif dans les quatre
catégories de résultats : l’évaluation globale de la démence, l’évaluation de la fonction
cognitive, l’état fonctionnel/qualité de vie, et le comportement et l’humeur. Dans quatre
études, le MMSE constitue un critère d’efficacité, et dans aucune de ces études n’a-t-on
constaté de différence statistiquement significative entre le groupe de la sélégiline et le
groupe sous placebo (40-42;44). Dans une des études (41), la désorientation est le seul item
dont le résultat est différent dans les deux groupes, sans que le MMSE ne décèle un effet.
Dans une autre étude, les chercheurs rendent compte d’une amélioration moyenne
marginalement significative (p=0,08) de 2,5 points sur l’échelle ADAS-cog (44). Enfin, dans
un autre essai (46), on constate un écart significatif de 10,8. Dans cette étude, les chercheurs
font mention d'un écart de 5,6 points au DMAS et de 2,2 points sur l’échelle abrégée
d’appréciation psychiatrique (BPRS). Ces résultats ne sont pas statistiquement significatifs,
mais l’étude ne comptant que 20 participants, elle n’était sans doute pas de taille à détecter
(de façon statistiquement significative) des écarts de cette ampleur. Selon la conclusion
58
globale, il n’y a pas de lien entre l’échelle ADAS-cog et le changement de comportement des
malades aptes à subir le test.
Fait curieux, les auteurs des trois études non retenues (37-39) font mention d’écarts
statistiquement significatifs dans le cas de la plupart des échelles utilisées. Cela met en
évidence l’importance d'effectuer des essais cliniques à double insu selon une méthodologie
rigoureuse.
La structure en chassé-croisé soulève des préoccupations liées à la possibilité de
l'effet de rémanence. L’un des essais (44) ne comporte pas de période d’élimination, un autre
comprend une période d’élimination de deux semaines (46) et le dernier, une période
d’élimination de quatre semaines (45). Dans le premier essai, on a procédé à une analyse
ultérieure afin de supprimer l'effet de rémanence propre à la structure en chassé-croisé en
comparant les deux groupes avant le croisement. De la sorte, l’essai s’apparente à une étude à
contrôle parallèle d’une durée de six semaines (n=10). Les chercheurs constatent alors un
écart statistiquement significatif sur l'échelle BPRS (c.-à-d., une amélioration de 2,1 points
dans le groupe de la sélégiline par rapport à une détérioration de 3,2 points dans le groupe
sous placebo). Dans le dernier essai (45), aucune analyse particulière n’a été effectuée pour
déterminer la présence d’un effet de rémanence.
3.5.3 Alpha-tocophérol (vitamine E)
L’essai de Sano et collab. (40), décrit à la section précédente, est le seul essai sur la
vitamine E. Comme nous avons déjà présenté les caractéristiques de cet essai, le compte
rendu qui suit est axé sur les groupes de la vitamine E, du placebo et de la vitamine E
associée à la sélégiline.
3.5.3.1 Protocole thérapeutique Les participants du groupe de l’alpha-tocophérol prennent un composé racémique de
dl-α-tocophérol à raison de 1 000 UI deux fois par jour (le matin et l’après-midi).
L’observance thérapeutique est évaluée par l’examen d’urine, observance confirmée par un
taux du médicament de 2 mg/décilitre ou plus dans 75 % des prélèvements du participant.
59
3.5.3.2 Résultats Au moment de référence, les scores MMSE du groupe de la vitamine E sont
inférieurs à ceux du groupe sous placebo (11,3 contre 13,3; p=0,07). Puisque le score MMSE
est également associé au résultat principal, il est incorporé dans les modèles à titre de
variable confusionnelle. Quant au résultat principal, « l’un ou l’autre des événements
cibles », le délai de survenue du résultat dans le groupe traité est statistiquement significatif,
comme l'illustre le risque relatif de 0,47 (p=0,001). En examinant chacun des résultats de
façon distincte, la constatation passe du général au particulier pour exprimer un délai
statistiquement significatif avant l’institutionnalisation des personnes du groupe de la
vitamine E (RR=0,42; p=0,003). Selon les instruments suivants : MMSE, EIS, BRS et UPD,
la vitamine E ne produit aucun effet. Par contre, les scores BDS du groupe sous placebo sont
supérieurs à ceux du groupe de la vitamine E (5,4 contre 4,0; p=0,004), et selon l’échelle DS,
les participants du groupe sous placebo nécessitent plus de soins et de supervision que les
participants du groupe de la vitamine E (86 % contre 76 % nécessitant de l’aide pour se
déplacer, se tourner, manger ou aller à la toilette, p=0,04).
La combinaison de la vitamine E et de la sélégiline ne produit pas d’effet bénéfique
supplémentaire. En fait, elle réduirait l’effet bénéfique de chacun des médicaments
administrés seuls sur le délai de survenue du résultat principal : risque relatif de 0,69;
p=0,049. D’autre part, elle cause de plus nombreuses chutes (22 % par rapport à 5 %,
p<0,005) et syncopes (16 % contre 4 %) que le placebo. Sous l'angle des instruments de
mesure secondaires, l’effet de la combinaison est essentiellement le même que celui de la
vitamine E seule : le changement moyen de score BDS est le même, écart également
significatif par rapport au placebo, et le nombre de patients les moins autonomes est réduit
dans la même proportion. Seule l’échelle d’évaluation comportementale dans la démence
(BRSD) indique un effet bénéfique supplémentaire. Tandis que les scores augmentent dans
tous les autres groupes de l’étude, y compris le groupe du placebo, le score moyen de ce
groupe diminue de façon significative de 1,1 (p=0,02).
60
3.6 Lécithine
Les lécithines sont des phospholipides qui participent à la constitution de la
membrane cellulaire et au métabolisme des lipides dans le foie. La lécithine est utilisée dans
la MA surtout à titre de précurseur cholinergique, et elle est alors conjuguée habituellement à
d’autres interventions pharmacologiques, telle la tacrine. En effet, les inhibiteurs de la
cholinestérase épuiseraient les réserves de choline, d’où la nécessité de leur adjoindre un
supplément cholinergique (67) (68). Les premières études sur l’effet de la lécithine sont, dans
la majorité des cas, non concluantes et de piètre qualité méthodologique (69). La présente
section porte sur des résultats tirés d’essais cliniques sur l’association tacrine et lécithine.
Idéalement, pour déterminer l’effet de la lécithine, il aurait fallu examiner des essais
comparant la lécithine au placebo ou, à tout le moins, des essais comparant l’association
tacrine/lécithine à la tacrine seule.
3.6.1 Méthodologie
3.6.1.1 Structure des essais Par l’évaluation à l’aveugle, nous avons sélectionné quatre essais. À l’examen
subséquent, nous en avons écarté trois, soit parce qu’il n’y avait pas de groupe témoin (70)
ou que les résultats présentés n’étaient pas suffisants pour formuler des observations sur
l’effet de la lécithine (71;72). La seule étude retenue en vue de l’examen approfondi est un
essai en chassé-croisé sur l’association lécithine et tacrine (73). Cet essai multicentrique
d’une durée de huit semaines compte 440 participants atteints de la MA. Les participants ne
devaient pas avoir d’antécédents d’incident cérébrovasculaire, ni prendre des médicaments
agissant sur le système nerveux central et être, de façon générale, en bonne santé. La
démarche analytique englobe l’analyse de la variance, l’analyse de la covariance et la
technique de Cochran-Mantel-Haenszel, mais on ne peut préciser si l'essai est fondé sur
l'approche selon le principe de vouloir traiter.
Les auteurs décrivent les caractéristiques de base de toutes les personnes, même
celles qui n'ont pas été réparties de façon aléatoire. L’échantillon final soumis à la
randomisation comprend 122 personnes choisies de façon précise – les personnes ayant
répondu au traitement par la tacrine – dont aucune autre caractéristique n'est indiquée que la
répartition par sexe et par âge semblable à celle de l’échantillon initial de 440 personnes. Ces
61
122 personnes ont obtenu des scores ADAS plus élevés et des scores MMSE plus faibles. En
d’autres termes, les personnes randomisées sont celles ayant répondu à l’action de la tacrine
au cours de la phase d’instauration de la dose d’après une échelle d’évaluation de la fonction
cognitive et dont le déficit cognitif est plus prononcé que celui des autres personnes de
l’échantillon original. Dans l’échantillon initial, l’âge varie de 50 ans à 89 ans, la moyenne
étant de 69,6 ans (écart-type de 8,3). Les hommes forment près des deux tiers (62 %) de
l’échantillon. À la phase de présélection de référence, le score moyen MMSE est de 17,8
(écart-type de 4,2 à 4,6).
3.6.1.2 Protocole thérapeutique L’étude comporte une phase d’instauration de la dose de six semaines (pour
déterminer la « dose optimale »), une période de référence de deux semaines sous placebo et
deux phases de traitement de quatre semaines (comprenant le croisement). La tacrine est
administrée à raison de 40 mg/jour ou de 80 mg/jour (en quatre capsules). Les doses
administrées pendant la phase à double insu sont les doses produisant une amélioration d’au
moins 4 points du score total ADAS (c.-à-d., la « dose optimale » déterminée pendant la
phase d’instauration de la dose). La lécithine est administrée à raison de 9,04 g/jour (en
quatre capsules).
3.6.1.3 Instruments de mesure Les principaux instruments de mesure sont les échelles ADAS-cog et CGIC; l’échelle
ADAS-noncog est utilisée à titre d’instrument de mesure secondaire.
3.6.2 Résultats
3.6.2.1 Abandons et effets indésirables Près des deux tiers des participants n’ont pu prendre une dose optimale. En outre,
avant la randomisation, un autre groupe de 26 personnes (6 %) a mis fin à sa participation à
l’essai au cours de la phase de référence sous placebo. Les 122 autres personnes ont été
réparties dans le groupe de la tacrine associée à la lécithine, le groupe de la tacrine ou le
groupe de la lécithine. Les effets indésirables attribuables à la lécithine ne sont pas
mentionnés. Des 122 personnes randomisées, quatre (3,4 %) se sont retirées au cours de la
première phase de chassé-croisé et 112 personnes ont terminé les deux phases de l’étude. La
répartition des abandons selon les diverses phases de l’étude n’est pas indiquée.
62
3.6.2.2 Efficacité Les résultats de la seconde phase du chassé-croisé ne sont pas présentés. La première
phase de l’étude offre deux possibilités de comparaison en ce qui a trait à la lécithine. En
comparant quatre semaines d’utilisation de la lécithine à la période de référence sous
placebo, les auteurs constatent une légère augmentation, quoique non statistiquement
significative, des scores MMSE, ADAS-cog, -noncog ainsi que du score global ADAS. Le
score de référence ADAS-cog est de 27,3 (écart-type de 1,7) et l’écart après quatre semaines
est de –1,3 (écart-type de 0,8). Toutefois, en moyenne, les participants de tous les groupes du
médicament manifestent une amélioration légère. La combinaison de la lécithine et de la
tacrine comparée (en contrôle parallèle) à la tacrine seule ne produit pas d’amélioration
quantifiable des scores des résultats. De façon générale, l’ajout de la lécithine à la tacrine ne
modifie pas de façon notable la proportion de personnes qui s’améliorent ou se détériorent
selon l'échelle CGIC. Le traitement par la lécithine seule se traduit par une amélioration
moindre et une détérioration plus accentuée que les deux autres modalités thérapeutiques
(amélioration en pourcentage : lécithine 35 %; tacrine 54 %; tacrine et lécithine 46 % –
détérioration en pourcentage : lécithine 24 %; tacrine 11 %; tacrine et lécithine 6 %). La
première phase de l’étude comprend trois volets thérapeutiques, dont aucun sur le placebo
seul. Bien que le compte rendu ci-dessus porte sur la lécithine après quatre semaines par
rapport au moment de référence et sur l’association lécithine/tacrine par rapport à la tacrine
seule, il n’y a pas de groupe placebo (c.-à-d., pas de traitement actif) pour la comparaison à
la 4e semaine.
Tableau 3.6 : Résultats – Essai sur la lécithine
Source de référence de l’étude (73)
Résultats d’ordre cognitif
ADAS-cog -1,3 [-2,9 ; 0,3]
MMSE 0,9 [0,1 ; 1,7]
Résultats globaux
CGIC 35 % amélioration, 24 % détérioration
ADAS-noncog -0,6 [-1,4 ; 0,2]
[IC de 95 %] * Les résultats ci-dessus représentent l’écart par rapport au moment de référence et les intervalles de confiance de 95 %
du groupe de la lécithine seule (à la 4e semaine).
63
On peut difficilement déterminer la portée clinique des résultats figurant dans le
tableau, de même que ceux décrits plus haut, en raison de la courte durée de l’essai. Le
MMSE ne constitue pas l’outil approprié pour des suivis si brefs. Lorsqu’on les compare aux
changements escomptés décrits dans les études de validation, les résultats ci-dessus sont
manifestement sans importance. En outre, Dahlke et collab. (74) démontrent que les
infirmières et les médecins notent l'échelle CGIC de façon différente, et comme à la fois des
infirmières et des médecins interviennent dans la présente étude, la fiabilité des résultats du
CGIC en souffre probablement. Les auteurs ne mentionnent pas si les évaluateurs des divers
centres ont suivi une formation dans ce domaine, ni si différentes listes de mots ont été
utilisées à l'occasion des administrations consécutives de l’échelle ADAS-cog.
3.7 Propentofylline
La propentofylline (HWA 285), dotée de caractéristiques neuroprotectrices et
antioxydantes, est un inhibiteur de la recaptation de l’adénosine et un inhibiteur de la
phosphodiestérase (75). Le médicament diminue les troubles cognitifs chez les modèles
murins (76), augmente la potentialité à long terme de l’hippocampe du cobaye (77) et accroît
le facteur de croissance neuronale endogène (NGF) dans les cellules astrogliales de la souris
(78). Il empêcherait la baisse normale de l’immunoréactivité du NGF chez les rats âgés (79)
et, de la sorte, favoriserait la survie neuronale cholinergique.
3.7.1 Méthodologie
3.7.1.1 Structure des essais À la suite de l’évaluation à l’aveugle, nous avons sélectionné deux études dont la
structure est à contrôle parallèle. L’une est un essai monocentrique (80) de trois mois
comptant 30 personnes atteintes de la MA, diagnostiquée selon les critères
NINCDS/ADRDA. Les antécédents neurologiques ou psychiatriques, les maladies
vasculaires (y compris les maladies périphériques), les carcinomes et la consommation de
médicaments agissant sur le système nerveux central constituent les motifs d’exclusion de cet
essai. La mesure de résultat principal est la détermination du métabolisme cérébral (par la
tomographie par émission de positrons à l’aide du 18F-2-fluro-2-déoxy-d-glucose) au cours
d’une tâche de perception auditive continue. Quant à l’autre étude (81) d'une durée de 12
mois, elle porte sur 260 patients externes atteints de la MA légère ou de démence vasculaire
64
(selon les critères DSM-IIIR) provenant de divers centres. Les critères d'admissibilité sont
semblables à ceux de l’étude de Mielke et collab. (80), sauf en ce qui concerne l’utilisation
de benzodiazépines prescrites pour des troubles du sommeil.
La moyenne d’âge des participants de l’étude de Mielke et collab. (80) est de 64,8 ans
(fourchette de 52 à 78 ans), Ces participants sont des hommes dans une proportion de 57 %,
et la moyenne des scores MMSE au moment de référence est de 20,4 (écart-type de 3,5).
Pour leur part, Marcusson et collab. (81) n’indiquent pas de façon distincte les
caractéristiques des patients souffrant de la MA et celles des malades atteints de démence
vasculaire. Dans cet essai, la moyenne d’âge des participants du groupe de la propentofylline
est de 71,9 ans (écart-type de 7,3) et celle des participants du groupe placebo est de 72,9 ans
(écart-type de 7,1). La répartition selon le sexe n’est pas mentionnée.
3.7.1.2 Protocole thérapeutique Le protocole thérapeutique des deux essais est identique, soit l'administration du
médicament à raison de 900 mg/jour (en trois capsules).
3.7.1.3 Instruments de mesure Les principaux instruments de mesure sont l’échelle Gottfries-Bråne-Steen (GBS) et
la partie II de l’échelle CGI en ce qui concerne l'état fonctionnel global, de même que le test
du syndrome Kurz (SKT) et le MMSE pour la cognition.
3.7.2 Résultats
3.7.2.1 Abandons et effets indésirables Deux personnes (7 %) ont abandonné l’étude de Mielke et collab. (80), tandis que
73 personnes (28 %) ont cessé leur participation à l’essai de Marcusson et collab. (81).
Comme la propentofylline accroît le débit sanguin cérébral, elle peut causer des maux
de tête, des étourdissements et des vertiges. En outre, étant donné que le médicament est un
dérivé xanthinique, il est susceptible de provoquer des malaises gastro-intestinaux. Dans
l’une des études (80), deux personnes du groupe de la propentofylline (13 %) ont présenté
une éruption cutanée, alors qu’une personne du groupe de la propentofylline (7 %) et trois
(20 %) du groupe sous placebo ont éprouvé des douleurs gastro-intestinales. Dans l’autre
étude (81), 45 personnes du groupe de la propentofylline (35 %) et 23 du groupe sous
placebo (18 %) ont éprouvé des nausées, des étourdissements, des douleurs gastro-
65
intestinales, des maux de tête et des brûlures d’estomac. En raison de la gravité de ces effets,
15 personnes (12 %) du groupe de la propentofylline et 11 (8 %) du groupe sous placebo ont
abandonné l’essai.
Tableau 3.7 : Description – Essais sur la propentofylline
Source de référence de l’étude (80) (81)
Durée Trois mois Douze mois
Dose 900 mg/jour 900 mg/jour
Principales mesures de résultats Métabolisme du glucose GBS, SKT
Nombre de personnes réparties au hasard 30 260
Taux de participation complète 93 % 72 %
3.7.2.2 Efficacité Après trois mois de traitement, le métabolisme de zones corticales et sous-corticales
précises des personnes traitées par la propentofylline s’est accru de façon statistiquement
significative par rapport aux personnes du groupe sous placebo (au cours de la tâche de
reconnaissance auditive de mots) (80). Il est difficile de transposer de tels résultats en un
effet de portée clinique. Les auteurs ont recours à plusieurs tests neuropsychologiques, mais
aucune mesure de résultat ne diffère de façon notable d’un groupe traité à un autre; qui plus
est, l’aggravation de la démence (selon le MMSE) dans le groupe sous placebo, dont font
mention les auteurs, est trompeuse. En fait, les personnes du groupe de la propentofylline ont
subi une détérioration plus considérable en moyenne, mais le groupe est marqué par une plus
grande variabilité individuelle que le groupe sous placebo [respectivement, –1,4 (écart-type
de 3,8) contre –1,0 (écart-type de 1,6)]. Ces résultats ne démontrent pas un ralentissement de
la progression de la MA. Quant aux scores neuropsychologiques, la propentofylline améliore
le DSST [écart après trois mois de 3,2 (écart-type de 6,2) pour la propentofylline et de –2,1
(écart-type de 7,5) pour le placebo] Toutefois, ce test, très exigeant pour les personnes âgées,
est influencé par l’état de la vue et la dextérité manuelle. On ne dispose pas de données de
référence s’appliquant aux personnes âgées atteintes de démence afin d’évaluer de façon
appropriée de tels changements.
Dans leur étude (81), Marcusson et collab. font état d’une légère amélioration,
quoique soutenue, suscitée par la propentofylline chez les personnes atteintes de la MA, bien
que seuls les changements des mesures SKT soient statistiquement significatifs après une
66
période de 12 mois. Les scores SKT de référence sont de 16,2 (écart-type de 6,4) pour le
groupe de la propentofylline et de 15,2 (écart-type de 6,5) pour le groupe du placebo, alors
qu'au 12e mois, les écarts sont respectivement de –1,3 (écart-type de 4,0) et de –0,2 (écart-
type de 3,6). Étant donné qu'aucune information n'indique ce qu’est un changement de portée
clinique au SKT, l’interprétation des écarts mentionnés ci-dessous est problématique; aussi, à
l’heure actuelle, le SKT ne constitue-t-il pas un instrument de mesure principal approprié
dans les essais cliniques sur la maladie d’Alzheimer. Quant à l’échelle GBS, les écarts entre
le moment de référence et le 12e mois sont de 1,8 (écart-type de 14,1) dans le groupe de la
propentofylline et de 5,1 (écart-type de 14,7),dans le groupe sous placebo, les scores accrus
traduisant une détérioration de l’état. Les résultats MMSE des divers sous-groupes ne sont
pas présentés de façon distincte, de sorte que les résultats ayant trait à la MA ne sont pas
précisés.
Tableau 3.8 : Résultats – Essais sur la propentofylline
Source de référence de l’étude (80) (81)
Résultats d’ordre cognitif
SKT ND -1,1 [-2,3 ; 0,1]
DSST 5,3 [-0,1 ; 10,7] ND
MMSE -0,4 [-2,8 ; 2,0] ND
Résultats globaux
GBS ND -3,3 [-7,9 ; 1,3]
CGI item I ND -0,1 [-0,3 ; 0,2]
CGI item II ND -0,6 [-1,9 ; 0,8] L’écart entre les scores et les intervalles de confiance de 95 % [ ] des groupe du placebo et de la propentofylline sont mesurés au 3e mois dans l’étude (80) et au 12e mois dans l’étude (81).
Marcusson et collab. (81) présentent leurs résultats CGI sous forme de changements
moyens par rapport au moment de référence, mais en raison de la nature ordinale de la
cotation, il serait plus judicieux de les exprimer sous forme de proportion en pourcentage
d’amélioration ou de détérioration (impossible à calculer à partir des données figurant dans le
tableau ci-dessus). De plus, même si les interrogateurs ne savaient rien de la nature du
traitement subi par les personnes, ils connaissaient probablement les scores obtenus à
67
d’autres échelles ou instruments et, par conséquent, leur cotation du CGI est sans doute
empreinte de subjectivité.
3.8 Linopirdine
La linopirdine, composé phényl-lindolinone qui favorise la libération présynaptique
d’acétylcholine endogène (82-84), est dénuée des effets indésirables courants propres aux
inhibiteurs de la cholinestérase. Elle stimule également la libération de noradrénaline et de
sérotonine, deux neurotransmetteurs jouant un rôle dans la MA (82).
3.8.1 Méthodologie
3.8.1.1 Structure de l'essai Le seul essai retenu à l’évaluation à l’aveugle est une étude multicentrique à contrôle
parallèle, à laquelle participent 350 personnes atteintes de la MA (diagnostic établi en
fonction des critères DSM-IIIR et NINCDS/ADRDA), réparties de façon aléatoire et suivies
pendant une période de six mois (85). Au nombre des critères d’exclusion, mentionnons les
antécédents psychiatriques ou neurologiques autres que la MA, la sténose de la carotide ou la
sténose vertébro-basilaire, l’alcoolisme, la toxicomanie et la consommation de médicaments
agissant sur le système nerveux central. DuPont Pharma a conçu et parrainé cet essai. La
démarche analytique est fondée sur l’analyse selon le principe de vouloir traiter.
La moyenne d’âge des personnes du groupe de la linopirdine est de 71,5 ans (écart-
type de 7,9), et de 71,7 ans (écart-type de 7,96) dans le groupe sous placebo. Dans
l’ensemble, la proportion d’hommes est de 56 % et le score MMSE moyen au moment de
référence est de 19,5 (écart-type de 3,1).
3.8.1.2 Protocole thérapeutique À la suite d’une phase initiale de deux semaines sous placebo, les participants ont été
répartis au hasard soit dans le groupe de la linopirdine à raison de 90 mg/jour (en trois
capsules) ou dans le groupe sous placebo.
3.8.1.3 Instruments de mesure Les instruments de mesure principaux sont l'échelle CGI pour ce qui est de l'état
fonctionnel global et l’échelle ADAS-cog quant au rendement cognitif.
68
3.8.2 Résultats
3.8.2.1 Abandons et effets indésirables Dans l’ensemble, 20 personnes du groupe sous placebo (10,5 %) et 61 personnes du
groupe de la linopirdine (31,6 %) se sont retirées de l’étude. Les auteurs décrivent les
caractéristiques de base des personnes sélectionnées (N=382), mais ne précisent pas celles
des personnes réparties de façon aléatoire (N=375).
Des effets indésirables attribuables au traitement surviennent chez 68 personnes
(36 %) du groupe sous placebo et chez 77 personnes (41 %) du groupe de la linopirdine, où
les participants sont plus enclins à une élévation hépatique de l’alanine transférase (ALT) que
les personnes du groupe du placebo. Chez 37 personnes (19,9 %) du groupe de la linopirdine
et deux personnes (1,6 %) du groupe sous placebo, l’élévation de l’ALT correspond à trois
fois la limite supérieure de l’écart normal.
Tableau 3.9 : Description – Essai sur la linopirdine
Source de référence de l’étude (85)
Durée Six mois
Dose 90 mg/jour
Instruments de mesure principaux ADAS-cog, CGI
Nombre de personnes réparties au hasard 375
Taux de participation complète 78 %
3.8.2.2 Efficacité Comme les participants n’ont pas tous terminé la période de traitement de six mois,
les chercheurs procèdent au report prospectif des derniers scores d’évaluation des personnes
s’étant retirées, ces scores devenant les mesures du 6e mois. La détermination de l’ampleur
de l'effet est donc fondée sur diverses périodes de traitement allant jusqu’à six mois. Selon
les résultats CGI, peu de participants éprouvent une détérioration au cours de l’étude, et la
proportion de malades manifestant une amélioration est la même dans le groupe de la
linopirdine que dans le groupe du placebo (soit environ 10 %). Les résultats ADAS-cog sont
présentés sous forme de graphique. Les participants traités par la linopirdine présentent une
amélioration minime (de un ou deux points environ) par rapport aux personnes du groupe du
placebo, au cours de la période de six mois. Les scores ADAS-cog à la fin de cette période
69
sont de 20,2 pour le groupe de la linopirdine et de 22,1 quant au groupe du placebo (p=0,01).
Bien que le score total ADAS du groupe de la linopirdine soit plus faible de façon
statistiquement significative que celui du groupe du placebo (d’après l’analyse selon le report
prospectif), la portée clinique de cet écart et des autres écarts est contestable. De plus, les
chercheurs n’indiquent pas s’ils ont utilisé différentes listes de mots aux administrations
successives de l’échelle ADAS-cog.
Enfin, alors que les auteurs signalent l’utilisation de l’échelle d’évaluation de
l’autonomie physique (PSMS) pour évaluer les participants, ils ne font pas mention des
résultats.
Tableau 3.10 : Résultats – Essai sur la linopirdine
Source de référence de l’étude (85)
Moment de référence Fin (six mois)
Résultats d’ordre cognitif
ADAS-cog * ND -1,9 [-3,3 ; -0,5]
SKT 38,5 [26,2 ; 50,8] placebo
37,8 [24,7 ; 50,9] linopirdine
40,8 [36,1 ; 45,5]
39,5 [36,6 ; 42,4]
Résultats globaux
ADAS-noncog 2,4 [0 ; 7,5] placebo
2,3 [0 ; 7,4] linopirdine
3,4 [1,6 ; 5,2]
3,0 [1,4 ; 4,6] * L'écart des scores entre le groupe placebo et le groupe linopirdine et intervalles de confiance de 95 % [ ].
3.9 Gingko Biloba (EGb 761)
Le EGb 761 est un extrait normalisé provenant des feuilles du Gingko Biloba. Cet
extrait est formé de divers composés chimiques parmi lesquels les flavénoïdes et les terpènes
exerceraient un effet thérapeutique. Son mécanisme d’action n’est pas tout à fait élucidé,
pourtant le Gingko Biloba a récemment été approuvé en Allemagne dans le traitement de
l’insuffisance vasculaire cérébrale. L’examen de Kleijnen et Knipschild (86) fait mention de
plusieurs études, publiées pour la plupart en Allemagne, qui indiquent que le Gingko Biloba
produit un effet sur la circulation cérébrale, le métabolisme cellulaire neuronal et
l’élimination des radicaux libres. Dans cet examen, les auteurs précisent les symptômes types
de l’insuffisance vasculaire cérébrale atténués par le Gingko, soit les troubles de
70
concentration et de mémoire, la distraction, la confusion, le manque d’énergie, la fatigue, le
rendement physique réduit, l’humeur dépressive, l’anxiété, l’étourdissement, l’acouphène et
la céphalée. L’EGb 761 est également appelé Tebonin, Tanakan ou Rokan. Ces extraits sont
normalisés quant à la quantité de flavénoïdes (25 %) et de terpènes (6 %). Une quatrième
préparation, Kaveri, a un contenu normalisé de la même façon. L’une des préoccupations que
soulèvent les extraits de Gingko Biloba est que leur contenu diffère selon le procédé de
fabrication. L’une des conséquences de cette disparité du contenu est la possibilité que l’effet
soit variable d'une préparation à une autre.
3.9.1 Méthodologie
3.9.1.1 Structure des essais À l’évaluation initiale, nous avons relevé sept essais sur le Gingko Biloba et ses effets
sur la cognition (12-14;87-90) qui respectaient les critères de rigueur méthodologique. Par la
suite, nous avons écarté quatre de ces essais (12-14;90) soit parce que les participants ne sont
pas atteints de démence (90) ou qu’il était impossible de déterminer avec certitude que les
participants répondent aux critères NINCDS/ADRDA du diagnostic de la maladie
d’Alzheimer probable (12) (13;14;90). Les trois autres essais (87-89) ont fait l’objet de
l'examen approfondi. Deux essais se sont déroulés en Allemagne (88;89) et un aux États-
Unis (87). Le premier (89), essai multicentrique comptant des participants provenant de 41
centres à Berlin, s’est déroulé en 1990-1991. Les auteurs indiquent qu’ils ont dû offrir de la
formation sur place concernant le diagnostic de la démence, car les chercheurs ne
connaissaient pas suffisamment le processus diagnostique. La source de financement de
l’étude n’est pas mentionnée, mais l’un des auteurs était alors au service de Dr Willmar
Schwabe GmbH and Co à Karlsuhe (Allemagne), fabricant du EGb 761. Le second essai
allemand est une petite étude monocentrique à laquelle participent 20 personnes atteintes de
la MA (88). La source de financement n’est pas indiquée. L’étude américaine (87), la plus
vaste des trois, est dirigée par le North American EGb Study Group qui a recruté
309 personnes atteintes soit de la MA (n=236) ou de démence vasculaire (n=73). La Dre
Willmar Schwabe Pharmaceutical Company a financé cet essai. Dans les deux essais
comprenant à la fois des personnes atteintes de la MA et des personnes souffrant de démence
vasculaire (DV) (87; 89), les renseignements concernant le groupe de la MA sont incomplets.
71
Par conséquent, il est difficile de tirer des conclusions concernant l’utilisation de l’EGb dans
le traitement de la MA.
Bien que la validité du diagnostic de la MA et de la DV dans l’essai de Kanowski et
collab. (89) soit contestable, les auteurs affirment tout de même que les chercheurs
principaux ont évalué les participants après l’essai (mais avant l’analyse des données) afin de
les différencier selon les deux formes de démence. Le Bars et collab. (87) utilisent les critères
DSM-IIIR et ICD-10 pour établir un diagnostic de « démence non compliquée », soit la MA
ou la DV, tandis que Maurer et collab. (88) fondent leur diagnostic de MA probable sur les
critères DSM-IIIR et NINCDS/ADRDA. Les critères d'admissibilité définis par Kanowski et
collab. sont le fait d’être âgé de 55 ans ou plus, d’obtenir un score MMSE se situant entre 13
et 25 et un score SKT entre 6 et 18, exprimant un déficit allant de très léger (SKT=5 à 8) à
modéré (SKT=14 à 18). Les malades accusant des troubles de la conscience ou souffrant
d’autres affections cérébrales ou de démence d’autre origine n’ont pas été admis à l’essai, de
même que les personnes prenant des médicaments pouvant perturber l’évaluation de
l’efficacité. De leur côté, Maurer et collab. (88) admettent des personnes atteintes de
démence légère ou modérée, déterminée par un score BCRS de 3-5, et n’ont pas sélectionné
de personnes ayant un score Hachinski >4 (c.-à-d., cas de démence d’origine vasculaire). Les
démences d’étiologie différente et tout état pouvant entraver la tenue des tests
psychométriques constituent d’autres motifs d’exclusion. Pour participer à l’étude, les
personnes doivent être dans le groupe d'âge de 50 à 80 ans. Dans l’essai de Le Bars et collab.
(87), les critères d'admissibilité sont un diagnostic de démence non compliquée accompagné
d’un score MMSE se situant entre 9 et 26 et d’un score GDS variant de 3 à 6 (démence
légère ou modérée) ainsi que l’absence d’autres affections médicales importantes. La
consommation de médicaments ne constitue pas un critère d’exclusion pour autant qu’aucun
changement de médicament ne survienne ou qu’aucun autre médicament ne soit prescrit
pendant l’étude.
Kanowski et collab. (89) mentionnent les caractéristiques de base des groupes qui
poursuivent l’essai jusqu’à la fin. Par contre, ils n’indiquent pas les renseignements de base
sur les personnes réparties au hasard. Cela limite considérablement l’interprétation des
résultats de l’essai et entrave la comparaison des caractéristiques des patients entre les essais
sur l’EGb. De plus, les auteurs ne présentent pas de façon distincte les données sur le groupe
72
de la MA. Les personnes ayant terminé la phase de traitement sont âgées de 70 ans en
moyenne, et l’âge est à peu près le même dans les divers groupes de traitement. La majorité
des participants sont des femmes (66 % dans le groupe du médicament par rapport à 69 %
dans le groupe du placebo). Les hommes du groupe du placebo ayant terminé l’essai sont
âgés de 66 ans en moyenne par comparaison aux femmes dont l'âge moyen est de 72 ans.
D’après les résultats du SKT, la majorité des participants des deux groupes ayant terminé
l’essai souffrent d’une démence légère au moment de référence (85 % des participants du
groupe du médicament ayant terminé l’essai obtiennent un score <13 points, comme 73 %
des participants du groupe du placebo). Selon les caractéristiques de base indiquées dans
l’essai américain (87), la majorité des participants sont des femmes (58 % dans l’ensemble),
le groupe du placebo comptant une proportion de 62 % et le groupe du médicament de 54 %.
Les participants sont âgés en moyenne de 68 ans (moyenne globale et moyenne dans chaque
groupe), et les scores moyens MMSE au moment de référence sont de 21,2 dans l’ensemble,
de 21,3 dans le groupe sous placebo et de 21,1 dans le groupe traité par le médicament, ce
qui traduit une démence d’intensité légère.
Dans l’essai de Maurer et collab. (88), les personnes du groupe du placebo sont plus
jeunes en moyenne que celles du groupe traité par l’extrait (60,6 ans contre 68,5 ans). Les
femmes représentent 40 % du groupe du placebo (4 sur 9) et 55 % (5 sur 9) du groupe du
Gingko Biloba. Bien que les données précises à cet égard ne soient pas indiquées dans
l’article, les auteurs affirment que l’intensité de la démence chez les participants du groupe
traité par l’extrait est « un peu plus prononcée » que chez les participants du groupe sous
placebo, selon l'échelle BCRS. Ces différences au moment de référence ne sont pas prises en
considération dans l’analyse. Les scores SKT dans cet essai (18,1 dans le groupe du placebo
et 19,7 dans le groupe du médicament, indiquant une démence modérée) diffèrent assez des
scores des participants ayant terminé l’essai de Kanowski et collab. (89) (c.-à-d., 12,2 pour
les personnes atteintes de la MA dans le groupe du placebo contre 10,9 pour les personnes
atteintes de cette maladie dans le groupe du médicament).
Quoique la répartition selon le sexe et les caractéristiques relatives à l’âge soient
semblables dans ces essais, il est difficile de déterminer la comparabilité du degré de déficit
vu que les instruments de mesure sont différents (BCRS, SKT et MMSE) et que l’un des
essais ne présente que les caractéristiques de base des personnes ayant terminé l’essai (89).
73
Dans l'ensemble, on peut toutefois dire que les participants de l’essai de Maurer et collab.
(88) sont atteints d’une démence plus prononcée que celle dont souffrent les participants des
deux autres essais.
3.9.1.2 Protocole thérapeutique La durée de l’essai est de 12 semaines (88), de 24 semaines (89) ou de 52 semaines
(87). Les essais comportent tous une période de rodage par placebo à simple insu, dont la
durée est de 7 jours (88), de 4 semaines (89) ou de 14 jours (87). Ils comprennent tous
également un groupe sous placebo et un seul groupe traité par l’extrait. Dans deux des essais,
la dose de l’extrait est de 240 mg/jour (88;89) : dans l'essai de Kanowski et collab., la
posologie est d'un comprimé de 120 mg le matin et le soir, avant un repas, alors que dans
l’étude de Maurer et collab., elle est de deux comprimés de 40 mg administrés trois fois par
jour. Dans l’essai américain, la dose est réduite de moitié, les participants prenant un
comprimé de 40 mg trois fois par jour avant les repas.
3.9.1.3 Instruments de mesure Les principaux instruments de mesure utilisés pour évaluer l’efficacité thérapeutique
dans l’essai de Kanowski et collab. (89) sont l’échelle CGI, le SKT pour évaluer la cognition
et l’échelle Nuremberg d’observation gériatrique (NAB) pour évaluer les activités de la vie
quotidienne. Quant à l’essai de Le Bars et collab. (87), les principaux instruments de mesure
sont l’échelle ADAS-cog, le GERRI pour les activités de la vie quotidienne et les activités
sociales, et l'échelle CGIC pour la psychopathologie générale. Les auteurs de cet essai
indiquent que les résultats des mesures secondaires sont présentés dans un autre document.
Maurer et collab. (88) n’ont retenu que le SKT en tant qu’instrument de mesure principal tout
en choisissant le test de marquage des pistes (ZVT), l’échelle ADAS et le test de vocabulaire
à choix multiple (MWT-B) à titre d’instruments de mesure secondaires.
3.9.2 Résultats
3.9.2.1 Abandons et effets indésirables Le rapport de l’étude de Maurer et collab. (88) ne fait pas état d'effets indésirables et
ne fait mention des abandons que pour signaler que deux malades ont cessé leur
participation, « une femme ayant dû se retirer parce que le P300 n’a pu être consigné et une
autre en raison de l’inobservance ». Les résultats de l’étude concernent les 18 autres
74
personnes. Kanowski et collab. (89) rapportent que l’analyse selon le principe de vouloir
traiter est fondée sur 205 des 216 personnes qui ont été réparties au hasard et que l’analyse
d’efficacité repose sur les données de 156 participants, dont la majorité souffrent de la MA
(n=125). Les effets indésirables, qui ne sont présentés que pour l’ensemble du groupe,
englobent 122 manifestations dont sept considérées comme graves. La fréquence des effets
indésirables est la même dans les divers groupes de l’étude, quoique cinq des sept effets
indésirables graves soient survenus dans le groupe du médicament. Dans les sept cas, à
l’exception d’un, les participants ont cessé le traitement. Les auteurs sont d’avis que, sauf
dans un cas, les effets indésirables ne sont pas attribuables au médicament. Par ailleurs, ils ne
précisent pas les divers types d’effets indésirables. Ils mentionnent toutefois que les
affections cutanées sont les effets indésirables les plus fréquents dans le groupe du
médicament, alors que les troubles gastrointestinaux représentent les effets indésirables les
plus courants dans le groupe du placebo.
Dans l’essai américain (87), les données concernant les abandons sont présentées de
façon combinée pour les personnes atteintes de la MA et les personnes souffrant de DV. Des
327 personnes réparties de façon aléatoire, seules 78 personnes (48 %) et 59 personnes
(35 %) ont terminé l’étude respectivement dans le groupe du médicament et dans le groupe
du placebo. La majorité des abandons dans les deux groupes ont lieu après la 26e semaine (la
moitié de la durée de l’essai). Cinq des manifestations indésirables sont graves (deux décès
dans le groupe traité; un décès, un accident cérébrovasculaire et un hématome sous-dural
dans le groupe du placebo). Dans les deux groupes, le tiers des participants fait mention d’au
moins un effet indésirable de quelque type que ce soit. Quant à la proportion des effets
indésirables caractérisés comme étant probablement attribuables au traitement, elle est de
16 % dans le groupe du médicament et de 12 % dans le groupe du placebo. La plupart des
effets indésirables sont d’intensité légère, et les symptômes gastrointestinaux sont légèrement
plus fréquents dans le groupe du médicament que dans le groupe sous placebo. Le faible taux
de participation complète tant dans le groupe du placebo que dans le groupe de l'extrait
entrave considérablement l’interprétation des résultats.
75
3.9.2.2 Efficacité Pour évaluer l’efficacité thérapeutique, Kanopski et collab. (89) ont défini les
changements de portée clinique en regard de chaque résultat principal :
• changement des scores CGI aux niveaux de « grande amélioration » ou de « très
grande amélioration »;
• diminution du score total SKT d’au moins 4 points;
• diminution du score total NAB d’au moins 2 points.
En se fondant sur ces définitions (et en tenant compte de l’ensemble du groupe), les auteurs
mentionnent que 10 % des participants du groupe du placebo satisfont à au moins deux de
ces critères par rapport à 28 % des participants du groupe du médicament (p=0,012). À
l’examen des résultats individuels, ils constatent que 32 % du groupe du médicament par
rapport à 17 % du groupe du placebo ressentent un effet de portée clinique sur l'échelle CGI
(p<0,01); que 38 % du groupe du médicament par comparaison à 18 % du groupe du placebo
manifestent un changement de portée clinique sous l’angle du SKT (p<0,05). Selon les
résultats du NAB, il n’y a pas d’écart statistiquement significatif entre les deux groupes quant
à la proportion des personnes ayant répondu au traitement. Les auteurs décrivent de façon
distincte les changements quantitatifs de ces paramètres dans le groupe de la MA. Les écarts
traitement:placebo entre le moment de référence et la 24e semaine de l'échelle CGI, du SKT
et de l'échelle NAB sont respectivement de 0,7 point, de 1,5 point et de 0,6 point. Les auteurs
ne traitent pas de la possibilité de la variation de l'effet d’un centre à un autre susceptible de
se produire en raison du faible nombre de personnes recrutées dans chaque centre.
Malheureusement, il n’y a, à toutes fins utiles, pas de documentation en anglais étayant la
capacité de déceler le changement de deux de ces instruments, les échelles CGI et NAB.
Même si la démence dont souffrent les participants de l’étude de Maurer et collab.
(88) est plus prononcée que celle dont sont atteints les participants de l’essai de Kanowski et
collab. (89), selon les scores SKT, les écarts traitement:placebo entre le moment de référence
et la fin de la période cible sont plus importants dans le premier cas que dans le second. Dans
le plus petit des deux essais, le groupe du médicament s'améliore en moyenne de 2,88 points
SKT sur 12 semaines comparativement à 2,4 points SKT en moyenne sur 12 semaines dans
l’essai de Kanowski et collab. (89). Dans ce dernier essai, le groupe du placebo s'améliore en
moyenne de 0,9 point tandis que dans le premier, ce groupe manifeste une détérioration de
76
0,8 point. Quant au ZVT, il n’y a pas d’écart dans l’essai de Maurer et collab. (88). En se
fondant sur la même définition d’un répondant au traitement selon le CGI que celle de l’essai
de Kanowski et collab. (89), on constate qu'une proportion semblable de personnes du groupe
du placebo, soit 11 %, répondent bien au traitement, contre 33 % dans le groupe du
médicament.
Dans l’essai américain (87), le groupe du placebo subit une détérioration
statistiquement significative d’après l’échelle ADAS-cog, exprimée par une augmentation
moyenne du score de 1,5 point. D’autre part, le groupe du médicament ne présente aucun
changement significatif (changement moyen de score=-0,2). L’écart entre les deux groupes
(1,7) se révèle statistiquement significatif (p<0,05) et en faveur du groupe du médicament
pendant les 52 semaines de l’étude. Les chercheurs de l’étude de Maurer et collab. (88) ont
également recours à l’échelle ADAS-cog en tant qu’instrument de mesure secondaire, et
l’ampleur des résultats est du même ordre quoique l’étude n’ait duré que 12 semaines. Le
groupe du médicament s'améliore, le score ADAS-cog diminuant en moyenne de 1,89 point,
tandis que le groupe du placebo se détériore légèrement, le score augmentant en moyenne de
0,03 point. En raison probablement de la faible taille de l’échantillon de cet essai (n=18),
l’écart constaté ne se révèle pas significatif sur le plan statistique.
Tableau 3.11a : Sommaire des ECR sur le donépézil Étude Rogers et collab., 1996 (16)
Score Jadad=6-7 Financée par Eisai
Rogers et collab., 1998 (17) Score Jadad=6-7 Financée par Eisai
Rogers et collab., 1998 (18) Score Jadad=6 Financée par Eisai
Burns et collab., 1999 (19) Score Jadad=6.5 Financée par Eisai
Renseignements sur l’étude Multicentrique, parallèle; 12 sem., et élimination 2 sem.; participation : 40 personnes par groupe; abandons : 20 personnes; âge moyen au point de départ ≅72 ans.
Multicentrique, parallèle; 24 sem., et élimination 6 sem.; placebo (n=162),donépézil 5 mg (n=154), donépézil 10 mg (n=157); taux de participation complète : non indiqué; âge moyen au point de départ ≅73 ans, score moyen MSSE=19, et CDR=0,5-2.
Multicentrique, parallèle; 12 sem., et aug. forcée de la dose dans le groupe 10 mg, puis élimination simple insu 3 sem.; participation : 468 personnes; taux de participation complète : placebo 93 %, 5 mg 90 %, 10 mg 82 %; abandons : 12 %; au point de départ : MA probable, CDR=0,5-2, âge moyen=74 ans.
Multicentrique, parallèle; double insu 24 sem., élimination simple insu 6 sem.; placebo (n=274), 5 mg (n=271), 10 mg (n=273); taux de participation complète placebo 80 %, 5 mg 78 %, 10 mg 74 %; au point de départ : âge moyen≅71 ans (50-93), score moyen MMSE=20 (9-26), CDR=0,5-2.
Placebo, donépézil 5 mg, donépézil 10 mg (aug. forcée de la dose); posologie uniquotidienne le soir.
Placebo, donépézil 5 mg, donépézil 10 mg (5 mg pendant 1 sem. puis 10 mg); posologie uniquotidienne au coucher.
Placebo, donépézil 5 mg, donépézil 10 mg; administration orale uniquotidienne le soir; le groupe 10 mg a pris 5 mg pendant la première semaine de l’étude.
Tableau 3.11b : Sommaire des ECR sur le métrifonate Étude Becker et collab., 1996 (21)
Métrifonate Score Jadad=6-8 Financée par NIMH, NIA
Becker et collab., 1998 (26) Score Jadad=5 Financée par NIMH, NIA
Cummings et collab., 1998 (23) Score Jadad=8 Financée par Bayer
Morris et collab., 1998 (25) Score Jadad=7-8 Financée par Bayer
Renseignements sur l’étude Parallèle; 3 sem. sous placebo au début, phase de 3 mois à double insu, 1 mois d’interruption, phase ouverte en dose d’entretien; placebo (n=23), métrifonate (n=27); abandons : 3 (non compris dans les chiffres ci-dessus); au point de départ : âge moyen= 71,4 ans, scolarité moyenne (ans) = 12,6 (pl)/11,2 (m), score moyen MMSE=19,5 (pl)/19,3 (m), score moyen ADAS-cog=25,6 (pl)/26,4 (m).
Parallèle; phase simple insu 4 sem. où tous les participants prennent le métrifonate (instauration dose 1 sem., dose sécuritaire 3 sem.), puis 6 mois double insu (sans élimination dans l’intervalle); taux de participation complète : 46 sur 47; au point de départ : âge moyen=71,7 (pl)/74,4 (m), scolarité moyenne (ans) =13 (pl)/13,2 (m), score moyen MMSE=19,8 (pl)/20,6 (m), ADAS-cog=21,8 (pl)/20,6 (m).
Multicentrique, parallèle; présélection 2 sem., double insu 12 sem. (dose d’attaque 2 sem., dose d’entretien 10 sem.), puis prolongation ouverte 40 sem; taux de participation complète : 463 sur 480; abandons : 18; observance : faible dose 34,5 %, dose moyenne 52,2 %, dose élevée 72,5 %; âge moyen au point de départ≅74 ans.
Multicentrique, parallèle; présélection 2 sem., double insu 26 sem. (y compris dose d’attaque 2 sem.), puis suivi 8 sem.; placebo (n=135), métrifonate (n=273); abandons : placebo 16, métrifonate 58; inobservance : placebo 3, métrifonate 3; au point de départ : âge moyen≅73,6 ans, score moyen MMSE=19,4 (pl)/18,8 (m), ADAS-cog=20,4 (pl)/22,9 (m).
Protocole thérapeutique Placebo; métrifonate à raison de 5,0 mg/kg par sem. X 2 sem., puis 4,9 mg/kg par sem. X 1 sem. pour atteindre 40-60 % de l’inhibition après 4 sem.; dose d’entretien = 2,1 mg/kg par sem. X 9 sem.
Placebo, métrifonate 2 mg/kg X 5 jours puis 0,95 mg/kg jour 6, puis 2,9 mg/kg par sem. en dose d’entretien (6 mois); objectif d’inhibition : 50-70 % après 1 sem.
Pl, m à 0,5-0,2 mg/kg (df), 0,9-0,3 mg/kg (dm), 2-0,65 mg/kg (dé); objectifs d’inhibition : 30 % (df), 50 % (dm), 70 % (dé); administration orale uniquotidienne au déjeuner.
Placebo, métrifonate à 2 mg/kg dose d’attaque, puis 0,65 mg/kg X 24 sem. en prise uniquotidienne avant le déjeuner; objectif d’inhibition : 70 %.
Protocole thérapeutique Dose entretien 50 mg une fois par jour X 26 sem., comprimé placebo identique dans le groupe témoin; objectif d’inhibition : non précisé.
Un comprimé par jour pour pl ou m; gda : 2 sem. sur 6 à 100 mg double insu (<65 kg) ou 150 mg (>65 kg), puis 50 mg X 4 sem.; gsda : 50 mg X 6 sem.; objectif d’inhibition : 70 %.
Placebo, dose faible=1-4 mg/jour, dose élevée=6-12 mg/jour; augmentation hebdomadaire dose dans l’écart attribué à raison de jusqu’à 1,5 mg/jour au cours des semaines 1-12, puis augmentation ou diminution dans l’écart attribué X sem. 13-26 afin d’obtenir la dose tolérée la plus élevée possible.
Placebo, dose faible=1,4 mg; dose élevée=6-12 mg (2 capsules 2 X/jour avec aliments); augmentation hebdomadaire dose au sein de l’écart attribué pendant sem. 1-7; puis augmentation ou diminution dans l’écart attribué X sem. 8-26 afin d’obtenir la dose tolérée la plus élevée possible.
Note : pl=placebo, m=métrifonate, gda=groupe avec dose d’attaque, gsda=groupe sans dose d’attaque
Tableau 3.11d : Sommaire des ECR sur la sélégiline Étude Tariot et collab., 1998 (45)
Score Jadad=5-6 Financée par NIMH, NIA
Freedman et collab., 1998 (42) Score Jadad=7-8 Financée par le ministère de la Santé et la Fondation de la santé mentale de l’Ontario
Sano et collab., 1997 (40) (sélégiline et vitamine E) Score Jadad=5 Financée par NIH/médicaments fournis par Hoffman Laroche Somerset
Lawlor et collab., 1997 (46) Score Jadad=5 Financée par NIH et Somerset Pharm.
Renseignements sur l’étude Chassé-croisé; sélégiline 8 sem., placebo 8 sem., élimination 4 sem.; 50 personnes et 2 abandons (dépression, perception d’absence d’efficacité); au point de départ : MA légère ou modérée, patients externes, âge moyen=69,9 ans, scolarité moyenne=13,0 ans contre 14,4 ans.
Parallèle; placebo à simple insu 4 sem., phase à double insu 25 sem., puis élimination par placebo simple insu 12 sem.; 51 personnes; observance :>95 %; abandons : placebo 1, sélégiline 7; point de départ : MA probable, âge moyen=70 ans; GDS=3,9-4,2, MMSE=17,8-18,5.
Multicentrique, parallèle; suivi 2 ans; 341 personnes; observance : sélégiline ‘+’ à placebo 13 %, sélégiline 98 %, vitamine E 11 %, combinaison 93 % -vitamine E ‘+’ à placebo 12 %, sélégiline 9 %, vitamine E 93 %, combinaison 91 %; point de départ : âge moyen≅75 ans, scolarité moyenne (ans)≅12,5, score moyen MMSE 13,3 (pl)/11,3 (VE), score moyen BDS=6,1 (pl/6,6 (VE).
Chassé-croisé; sélégiline 6 sem., élimination 2 sem., placebo 6 sem.; admission 25 personnes, 5 abandons au cours des 2 premières sem. en raison d’incapacité à se conformer au protocole de l’étude; pas d’abandons par suite d’effets indésirables; point de départ : MA probable, âge moyen=75 ans, durée moyenne de MA=4,8, score moyen MMSE=11,9.
Protocole thérapeutique Placebo, sélégiline Placebo, sélégiline 5 mg X 1 sem., sélégiline 10 mg X 24 sem.
Placebo, sélégiline 5 mg 2 X/jour, vitamine E 1000 UI 2 X/jour, combinaison sélégiline et vitamine E.
Placebo, sélégiline 10 mg.
Note : VE=vitamine E
Tableau 3.11e : Sommaire des ECR sur la sélégiline (suite) Étude Schneider et collab., 1993 (44)
Score Jadad=5 Financée par NIMH, Californie
Burke et collab., 1993 (41) Score Jadad=5-6 Financée par Somerset Pharm.
Mangoni et collab., 1991 (43) Score Jadad=7 Financement non indiqué
Renseignements sur l’étude Chassé-croisé; sélégiline 4 sem., placebo 4 sem., pas élimination; 10 personnes/aucun abandon; point de départ : patients externes, MA probable, âge moyen=88,8 ans, score moyen MMSE=15,7, scolarité moyenne=13,7 ans.
Parallèle; suivi 15 mois; 39 personnes; abandons : placebo 1 au début, placebo 2 de plus et sélégiline 3 pendant suivi à non attribuable aux effets indésirables; observance : 93 %; point de départ : MA légère, CDR=1, âge moyen=74,8 ans contre 71,4 ans; scolarité=13,3 contre 11,4.
Parallèle; suivi 3 mois; placebo (n=51), sélégiline (n=68); abandons : placebo à 4 (efficacité médiocre) et 1 (effet indésirable), sélégiline à 2 (efficacité médiocre), 3 (effets indésirables) et 1 (?); au point de départ : MA probable, GDS=3, 4 ou 5; âge moyen=68,7 ans contre 69,0 ans; scolarité moyenne (ans)=6,9 contre 6,4.
Tableau 3.11f : Sommaire des ECR sur la propentofylline, la linopirdine et la lécithine Étude Mielke et collab., 1998 (80)
Propentofylline Score Jadad=5 Financement non précisé
Marcusson et collab., 1997 (81) Propentofylline Score Jadad=5 Financement non précisé
Rockwood et collab., 1997 (85) Linopirdine Score Jadad=6 Financée par DuPont Pharma.
Foster et collab., 1996 (73) Lécithine Score Jadad=5 Financée par Parke-Davis
Renseignements sur l’étude Parallèle; 12 sem., répartition aléatoire de 15 pers. dans le groupe placebo et de 13 pers. dans le groupe prop; abandons : 1 pour refus de randomisation et 1 par suite d’éruption cutanée; point de départ : 16 hommes (8 par groupe), âge moyen=65,7 (pl) et 68,3 (prop), score moyen MMSE=21,3 (pl) et 19,5 (prop.).
Multicentrique, parallèle; présélection 1 mois, phase à double insu 12 mois; placebo (n=131), prop (n=129); abandons : 73 (28 %), dont 11 (pl)/15 (prop) par suite d’effets indésirables et 5 (pl)/11 (prop) à la demande du dispensateur de soins; au point de départ (pl/prop) : âge moyen=72,9/71,9, score moyen MMSE=20,7/20,8.
Multicentrique, parallèle; amorce sous placebo simple insu 2 sem., phase à double insu 6 mois; placebo (n=193), lino (n=184) au début de la période de rodage; abandons : placebo 20 et linopirdine 61 de la phase de rodage à la fin de l’étude; point de départ (pl/lino) : âge moyen=71,5/71,7, scolarité moyenne (ans) =11,2/11,1, score moyen MMSE=19,6/19,4.
Multicentrique, chassé-croisé; instauration dose à double insu 6 sem, p. référence sous placebo 2 sem., 2 phases de traitement à double insu de 4 sem.; 440 personnes inscrites à l’étude, 116 terminent la première période à double insu et 112 terminent la seconde période à double insu; point de départ : excellents répondants au traitement à la tacrine.
Tableau 3.11g : Sommaire des ECR sur le Gingko Biloba Étude Le Bars et collab., 1997 (87)
Score Jadad=7 Financée par Schwabe
Maurer et collab., 1997 (88) Score Jadad=7 Financement non précisé
Kanowski et collab., 1996 (89) Score Jadad=7 Financée par Schwabe
Renseignements sur l’étude
Multicentrique, parallèle; phase à dose fixe double insu 52 sem., y compris rodage sous placebo à simple insu de 14 jours; 251 patients MA admis, 236 dans ITT (pl=116; GB=120); abandons : énorme taux d’abandon à 12 sem. à38 % du groupe pl termine l’essai contre 50 % du groupe GB; point de départ (personnes ITT) : femmes=58 %, âge moyen=68 (ÉT=10), scolarité moyenne (ans) 14 (écart 0-20), score moyen MMSE=21,1 (ÉT=5,7), score moyen ADAS-cog=20,0 (ÉT=15,8), durée moyenne de la maladie=4,3 (ÉT=3,8).
Parallèle; essai à double insu de 3 mois contrôlé par placebo, précédé d’une phase de rodage de 7 jours; 20 personnes (objectif initial de 40); abandons : 2 patients sont retirés pour cause d’inobservance et de P300 non inscrit); point de départ : âge moyen=68,5 (pl) et 60,6 (GB), score moyen ADAS-cog=36,1 (pl) et 31,2 (GB).
Multicentrique, parallèle; rodage sous placebo simple insu de 4 sem., puis phase à double insu de 24 sem.; 222 participants, 156 terminent l’essai (pl=77, GB=79); abandons : 6 après le rodage, 11 après 12 sem., 21 pendant l’essai, 28 non-respect du protocole (consultations manquées, observance médiocre, consommation de médicaments non autorisés); point de départ (renseignements disponibles que pour les personnes ayant terminé l’étude) : groupe placebo à 24 hommes et 53 femmes, âge moyen=66,4 (hommes) et 72,0 (femmes), groupe GB à 27 hommes et 52 femmes, âge moyen=69,7 (hommes) et 70,2 (femmes).
Protocole thérapeutique Placebo; GB comprimés de 40 mg 3X/jour avant les repas, chaque comprimé contient 24 % flavonéglycosides, 6 % de terpénolactones (31 % gingkosides A, B et C, et 2,9 % bilobalide).
Placebo; GB 240 mg (80 mg 3X/jour), chaque comprimé de 40 mg contient 9,6 mg de flavonéglycosides et 2,4 mg de terpénolactones.
Placebo; GB 120 mg 2X/jour avant les repas, chaque capsule renferme 24 % de gingkoflavonéglycosides et 6 % de terpénolactones (gingkosides, bilobalide).
Note : pl=placebo, GB=Gingko Biloba, ITT= principe de vouloir traiter
81
Tableau 3.12 : Sommaire des instruments de mesure les plus couramment utilisés
Amélioration clinique globale (CGI), indice d’amélioration globale, impression clinique de changement global (CGIC ou CGI-changement)
Amélioration globale de l’état de santé
Clinicien
1 (très grande amélioration) –7 (très grande détérioration)
Impression clinique globale (CGI) *Note : Les sous-échelles peuvent être considérées comme des instruments distincts ou des parties constituantes d’un seul instrument.
Impression clinique de gravité globale (CGI-gravité)
Gravité de la maladie
Clinicien 1 (normal) –7 (parmi les plus grièvement malades)
Indice d’efficacité Rapport entre les effets bénéfiques et les effets indésirables d’un médicament
Clinicien 1-16, calculé selon une grille renfermant la description de quatre effets possibles et de quatre degrés de gravité possibles des effets indésirables
Impression clinique de changement global-plus (CIBIC-plus)
ND Amélioration globale de l’état de santé
Clinicien disposant de l’information du dispensateur de soins
1 (très grande amélioration) –7 (très grande détérioration)
Échelle d’évaluation clinique de la démence (CDR)
ND Déficit cognitif sur les plans de la mémoire, de l’orientation, du jugement/ résolution de problèmes, des affaires communautaires, des activités à la maison/de passe-temps et des soins personnels
Clinicien 0=aucune
0,5=douteuse
1=légère, 2=modérée, 3=grave
Un score est noté en regard de chacune des six catégories; le score unique (0-3) du déficit global est obtenu par un algorithme.
82
Tableau 3.12 : Sommaire des instruments de mesure les plus couramment utilisés (suite)
Échelle d’évaluation clinique de la démence – Sommation des scores (CDR-Sum of Boxes)
ND Déficit cognitif sur les plans de la mémoire, de l’orientation, du jugement/ résolution de problèmes, des affaires communautaires, des activités à la maison/de passe-temps et des soins personnels
Un score est noté en regard de chacune des six catégories; on procède à la sommation des scores pour obtenir le score définitif (0-18).
Échelle de détérioration globale (GDS)
ND Détermination des stades progressifs du déficit cognitif
Clinicien 1 (aucun déficit cognitif) –7 (déficit cognitif très prononcé)
Échelle d’évaluation de la maladie d’Alzheimer –cognitive (ADAS-cog)
ND Orientation, mémoire, langage et praxie
Clinicien ou autre examinateur qualifié (le clinicien doit coter certaines parties de l’échelle – p. ex., la capacité d’expression orale)
0-70, plus le score est élevé, plus le déficit est prononcé
Mini-examen de l’état mental (MMSE)
ND Orientation, mémoire, langage, concentration et praxie
Interrogateur qualifié
0-30, plus le score est élevé, moins le déficit est important (≤23=déficit; ≥17=déficit grave)
Test du syndrome de Kurtz (SKT)
ND L’attention : appellation d’objets/chiffres, manipulation de cubes, dénombrement des symboles, appellation dans l'ordre inverse; mémoire : immédiate/différée mémoire de reconnaissance
Interrogateur qualifié
Scores originaux établis dans des pays germanophones écart 0-27, plus le score est élevé, plus le déficit est grave (5 degrés de gravité)
83
3.10 Effets indésirables
La surveillance des effets indésirables (EI) est obligatoire dans les essais cliniques.
Dans l’ensemble, les effets indésirables se répartissent en deux catégories principales : (i) les
effets escomptés d’après les caractéristiques pharmacologiques du médicament (effets
indésirables de type A); (ii) les effets inattendus (effets indésirables de type B). Les effets
indésirables de type B seraient reliés aux caractéristiques individuelles, en raison du fait qu’ils
ne se produisent pas chez la majorité de la population traitée.
Les effets indésirables de type A sont décelables dans les essais cliniques parce qu’ils
se produisent relativement fréquemment et souvent peu après le début du traitement. Par
contre, en raison de la taille limitée de l’échantillon et de la courte durée des essais cliniques,
ceux-ci ne constituent pas le cadre approprié pour détecter des effets de fréquence rare (les
effets indésirables de type B), ni les effets qui surviennent un certain temps après le début du
traitement. Ce qui est malheureux, car les effets indésirables rares sont souvent les effets les
plus graves. De plus, même en ce qui concerne les EI les plus courants, l’estimation de
l’incidence est, en règle générale, imprécise en raison de la petite taille de l’échantillon. Par
conséquent, les données des essais cliniques ne peuvent permettre de déterminer de façon
exhaustive l’innocuité d’un médicament.
Néanmoins, tous les EI survenant pendant un essai clinique sont consignés, même si
l’on ne peut préciser leur origine, de sorte que des EI sont notés tant par les personnes traitées
par le médicament que par celles qui ne reçoivent pas le médicament actif. Diverses
classifications peuvent constituer le cadre de référence de l'évaluation de la gravité des EI
(91). La classification proposée par Ibanez et collab. (92) est fondée sur la survie : (i) mortels;
(ii) graves – c.-à-d., qui mettent la vie en danger; (iii) modérés, c.-à-d., entraînant
l’hospitalisation ou l’absentéisme au travail ou à l’école. Une autre classification (93) repose
sur le traitement que nécessite l’EI : classe 1 – les effets indésirables n’occasionnent aucun
changement de médicament; classe 2 – les effets indésirables provoquent un changement de
médicament, soit la diminution de la dose ou l’ajout d’un médicament; classe 3 – les EI
provoquent la cessation du traitement par le médicament soupçonné d'en être la cause.
Malheureusement, les rapports d’essai clinique sur la MA que nous avons examinés ne
renferment pas les données appropriées pour catégoriser les effets indésirables selon l’une ou
84
l’autre des classifications, bien que, de façon générale, les auteurs mentionnent si la survenue
de l’effet indésirable a entraîné l'interruption du traitement.
Les tableaux qui suivent indiquent les EI, leur fréquence et leur gravité, tel qu'il en est
fait mention dans les essais examinés. Dans la colonne gravité, la fréquence des EI est
indiquée dans les trois catégories : légers, modérés ou graves. La classification est fondée sur
l’impression de gravité des auteurs de l’essai en question, tandis que la fréquence est
déterminée d’après le nombre total de personnes du groupe en particulier. Cette colonne
indique également le nombre (ou le taux) des abandons attribuables aux EI.
Tableau 3.13a : Effets indésirables
Médicament Essai Structure Groupe 1 Groupe 2 Groupe 3 Placebo Gravité
Propentofylline : 4 décès, 4 effets indésirables graves et 11 effets indésirables non graves. Placebo : 2 décès, 3 effets indésirables graves, 8 effets indésirables non graves. Ces décès ne sont pas attribuables aux médicaments à l’étude.
Tous considérés comme légers ou modérés. La fréquence par catégorie n’est pas indiquée, que ce soit dans la catégorie des effets légers ou dans celle des effets modérés. Abandons par suite d’effets indésirables : Placebo : 2/5 abandons 1mg/jour : 5/8 abandons 3 mg/jour : 2/2 abandons 5 mg/jour : 3/5 abandons Les types d'effets indésirables ne sont pas précisés.
Groupe 1 Groupe 2 Placebo Légers 21 % 53 % 16 % Mod. non non non mention. mention. mention. Graves 4 % 4 % 5 % n=157 n=158 n=153 Abandons par suite d’effets indésirables : Placebo : 2 % 5 mg/jour : 4 % 10 mg/jour : 10 % Les nausées et la diarrhée sont les effets entraînant le plus souvent la cessation. 2% des personnes du groupe 10mg/jour ont cessé leur participation en raison surtout des nausées, puis de la diarrhée.
Tableau 3.13d : Effets indésirables
Médicament Essai Structure Groupe 1 Groupe 2 Groupe 3 Placebo Gravité Donépézil Burnset et
La plupart des effets indésirables sont légers et transitoires (aucune autre ventilation n’est indiquée). 9 % des participants (n=818) souffrent de complications graves, bien que la nature de ces manifestations ne soit pas indiquée. Abandons par suite d’effets indésirables : Placebo : 10 % 5 mg/jour : 9 % 10 mg/jour : 18 % Les types d’effets indésirables ne sont pas précisés.
Tous les effets indésirables attribués probablement ou assurément au métrifonate sont légers et transitoires. Aucune autre précision n’est donnée. Aucune cessation de traitement par suite d’effets indésirables.
Tableau 3.13e : Effets indésirables
Médicament Essai Structure Groupe 1 Groupe 2 Groupe 3 Placebo Gravité Métrifonate Becker et
collab. (26)
Parallèle Métrifonate (n=23) 14 incidents mentionnés.Le type d’effets n’est pas indiqué.
Placebo (n=24) 8 incidents mentionnés. Le type d'effets n’est pas indiqué.
Tous les effets indésirables considérés comme probablement ou assurément associés au métrifonate sont légers et transitoires. Aucune autre précision n’est indiquée. Pas de modifications du traitement en raison d’effets indésirables.
Métrifonate Cummings et collab. (23)
Parallèle Métrifonate Faible dose (n=121) Douleur abdominale 2 % Diarrhée 9 % Flatulence 1 % Nausée 2 % Crampes aux jambes 1 % Anomalies de la fonction hépatique 0
Métrifonate Dose moyenne (n=120) Douleur abdominale 4 % Diarrhée 11 % Flatulence 3 % Nausée 8 % Crampes aux jambes 3 % Anomalies de la fonction hépatique 1 %
Métrifonate Dose élevée (n=119) Douleur abdominale 12 % Diarrhée 19 % Flatulence 6 % Nausée 16 % Crampes aux jambes 8 % Anom. de la fonction hép. 0
Placebo (n=120) Douleur abdominale 3 % Diarrhée 8 % Flatulence 1 % Nausée 9 % Crampes aux jambes 1 % Anomalies de la fonction hép. 0
Groupe 1 Groupe 2 Groupe 3 Placebo Légers 49 % 58 % 66 % 59 %Mod. 23 % 35 % 34 % 26 %Graves 6 % 7 % 8 % 5 % n=121 n=120 n=119 n=120 Placebo : 4 % Faible dose: 5 % Dose moyenne : 7 % Dose élevée : 7 % Trois participants ont abandonné l’étude par suite de bradycardie asymptomatique au cours de la phase de la dose d’attaque.
Il n’est fait mention que du fait que la majorité des nausées et vomissements rapportés sont légers ou modérés. Aucune autre précision quant à la gravité n’est indiquée. Abandons par suite d’effets indésirables : Placebo : 7 % 1-4 mg : 8 % 6-12 mg : 28 % Les types d’effets indésirables ne sont pas indiqués
Tableau 3.13h : Effets indésirables
Médicament Essai Structure Groupe 1 Groupe 2 Groupe 3 Placebo Sévérité Rivastigmine Rösler et
La seule indication de gravité est la mention que l’intensité de la plupart des effets indésirables (sans précision) n’est pas établie avec certitude. Abandons par suite d’effets indésirables : Placebo : 7 % Faible dose : 7 % Dose élevée: 23 % La plupart des abandons causés par des effets indésirables sont survenus au cours de la phase d’augmentation de la dose. Les types d’effets indésirables ne sont pas précisés.
Gingko Biloba Maurer et collab. (88)
Parallèle Gingko Biloba (n=9) Aucun effet signalé
Placebo (n=9) Aucun effet signalé
Aucune indication.
Gingko Biloba Kanowski et collab. (89)
Parallèle Gingko Biloba (n=79 personnes ayant terminé l’étude) 63 effets indésirables consignés. Affections cutanées : 6 % Troubles GI : 5 %
Placebo (n=77 personnes ayant terminé l’étude) 59 effets indésirables mentionnés. Affections cutanées : 1 % Troubles GI : 11 %
6 patients éprouvant des effets indésirables graves. Un participant subissant des effets indésirables non graves a interrompu le traitement de façon prématurée. Les types d’effets indésirables ne sont pas précisés.
Gingko Biloba Le Bars et collab. (87)
Parallèle Gingko Bilob(N=155) 30 % des participants signalent au moins un effet indésirable. 97 effets indésirables. Les types d’effets indés. ne sont pas indiqués.
Placebo (n=154) 31 % des participants signalent au moins un effet indés. 91 effets indés. Les types d’effets indés. ne sont pas précisés.
Abandons par suite d’effets indésirables : Placebo : 2,5 % Gingko Biloba : 6 % 1 décès dans le groupe du placebo; 2 décès dans les groupes traités par le médicament. 1 accident cérébrovasculaire et 1 hématome sous-dural dans le groupe du placebo.
Tableau 3.13i : Effets indésirables
Médicament Essai Structure Groupe 1 Groupe 2 Groupe 3 Placebo Gravité Sélégiline Sano et
- Aucun abandon pour cause d’EI. - Les degrés de gravité ne sont pas précisés.
Sélégiline Burke et collab. (41)
Parallèle Aucune indication Aucune indication Aucun EI grave.
Sélégiline Lawlor et collab. (46)
Chassé-croisé Aucune indication Aucune indication Aucun EI « significatif » Aucun abandon par suite d’EI.
Sélégiline Tariot et collab. (45)
Chassé-croisé Aucune indication Aucune indication 1 dépression (x %) nécessitant un AD : la phase au cours de laquelle cela s’est produit n’est pas indiquée.
Tableau 3.13j : Effets indésirables
Médicament Essai Structure Groupe 1 Groupe 2 Groupe 3 Placebo Gravité Sélégiline Schneider
et collab. (44)
Chassé-croisé Nausée 10 % 2 participants sur 3 du groupe de la physostigmine ont éprouvé des nausées légères intermittentes tout au long de l’essai.
Gingko Biloba Le Bars et collab. (87)
Parallèle EGb (120 mg/jour) Décès 1,3 % EI graves 7,7 % EI GI 11,6 %
Décès 0,6 % ACV 0,6 % Hématome sous-dural 0.6 % EI graves 5,8 % EI GI 7,1 %
5 EI graves 3/21 EI graves ont causé un abandon (2 Egb, 1 placebo)
Gingko Biloba Maurer et collab. (88)
Parallèle EGb (240 mg/jour) Aucun constaté
Aucun constaté
Gingko Biloba Kanowski et collab. (89)
Parallèle EGb (240 mg/jour) 63 EI au total (non énumérés) Symptômes GI : 5,1 % EI possibles : 5 participants notamment : éruptions cutanées de nature allergique, symptômes GI, céphalée
Total : 59 EI au total (non énumérés) Symptômes GI : 11,7 % Probable : 1 participant présentant une éruption cutanée
7 cas graves (5 dans le groupe Egb) : 6 participants présentant des effets graves et 1 participant manifestant un effet non grave ont abandonné l’étude. 3 EI graves au cours de la période de rodage par placebo (imputabilité écartée).
95
4 SOMMAIRE DES RÉSULTATS DE LA SYNTHÈSE DES DONNÉES LES PLUS CONCLUANTES
Dans le présent chapitre, nous résumons les constatations de l’examen approfondi des
données publiées concernant neuf traitements médicamenteux, ou pharmacothérapies
potentielles, de la MA. Grâce à l’évaluation à l’aveugle et au processus de cotation
méthodologique, nous n’avons sélectionné que des essais cliniques respectant des normes
élevées de rigueur méthodologique. Au total, 36 essais cliniques randomisés (soit à contrôle
parallèle ou en chassé-croisé) satisfont aux critères d'admissibilité minimaux d’après
l’évaluation à l’aveugle. Toutefois, au cours de la conférence de concertation qui a suivi cette
évaluation, nous avons rejeté 12 de ces essais (1 sur la rivastigmine, 1 sur la sélégiline, 3 sur la
lécithine et 7 sur le Gingko Biloba), soit parce qu’ils ne répondaient pas aux exigences
minimales, soit parce que les critères diagnostiques utilisés soulevaient des préoccupations. Ce
résultat met en évidence la nécessité d’une conférence de concertation afin que les évaluateurs
examinent ensemble tous les essais qui ont franchi l’étape de l’évaluation à l’aveugle, avant de
les soumettre à l’analyse. Après avoir passé en revue la version préliminaire du présent
rapport, nous avons relevé deux autres essais sur le métrifonate que nous avons convenu
d'analyser vu qu’ils respectent tous les deux les critères de rigueur méthodologique. Par
conséquent, le rapport final couvre 26 essais cliniques randomisés.
Dans un rapport antérieur (5) sur l’efficacité de la tacrine dans le traitement de la MA,
nous en arrivons à la conclusion que les études sont tellement disparates sur le plan de la dose,
de la durée du traitement et des instruments de mesure qu’il n’est ni judicieux, ni approprié du
point de vue méthodologique de combiner leurs constatations pour obtenir un sommaire unifié
des estimations de l’efficacité de la tacrine. Nous espérions que, depuis la parution de ce
rapport en 1997, la procédure des essais cliniques sur les médicaments contre la démence se
soit uniformisée. Dans l’ensemble, nous constatons que la qualité méthodologique des essais
examinés dans le présent rapport est, de fait, supérieure à celle des études examinées pour
évaluer l’efficacité de la tacrine. Cela s’explique probablement, du moins en partie, par le fait
que la majorité des essais examinés dans le présent rapport ont été publiés en 1995 ou par la
suite. À cet égard, la sélégiline est la seule exception, car les essais cliniques portant sur ce
médicament ont paru entre 1991 et 1998. De même, le seul essai portant sur la vitamine E a
96
été publié en 1992. En outre, plusieurs essais sur le même médicament (p. ex., le donépézil, la
rivastigmine, le métrifonate) ont été effectués par le même groupe de chercheurs ou par
certains des mêmes chercheurs, ce qui, à notre avis, contribuerait à améliorer la comparabilité.
Cependant, nous n’avons pu comparer de façon idéale les résultats de ces études en raison de
la considérable diversité des modes de présentation des données, même dans les essais
effectués par le même groupe de chercheurs.
Par ailleurs, la gamme des instruments de mesure évaluant le rendement cognitif, la
capacité fonctionnelle et le comportement est à ce point vaste qu’elle rend très complexe la
tâche de tirer des conclusions globales sur l’efficacité thérapeutique. Comme le choix des
instruments de mesure est primordial dans l’évaluation de l’efficacité de médicaments contre
la démence, la présente étude comprend un rapport exhaustif sur les qualités psychométriques
des instruments de mesure principaux et secondaires utilisés dans les essais examinés. À cet
égard, le lecteur est prié de consulter Pharmacothérapie de la maladie d’Alzheimer II. Examen
des instruments de mesure utilisés dans les essais cliniques (partie II).
Initialement, nous devions effectuer une méta-analyse quantitative des essais regroupés
selon le médicament à l’étude, lorsque cela était justifié. Toutefois, après avoir étudié
soigneusement les divergences de structure et, plus particulièrement, de mode présentation des
données, nous avons déterminé que même des méta-analyses portant sur les essais étudiant le
même produit pharmaceutique ne seraient pas valables ni, dans bien des cas, possibles en
raison de l’insuffisance de renseignements dans les rapports d’essai. Même si la combinaison
des résultats de divers essais est devenue pratique courante, cette façon de faire soulève des
questions, notamment en ce qui a trait aux facteurs pouvant causer des biais. En règle
générale, la tenue d’une méta-analyse suppose la prise en compte des biais liés à la
publication, à l’évaluation de la qualité et à l’hétérogénéité entre les essais.
Biais de publication : Comme notre examen ne porte que sur des rapports d’essais
publiés intégralement, il est fort probable qu'un certain nombre d'essais ont été écartés par le
fait même. L’intégrité de la méta-analyse se trouve donc compromise puisque le rejet d’études
non publiées peut entraîner un biais de sélection.
Évaluation de la qualité : Étant donné que nous avons utilisé l’échelle Jadad pour
évaluer la qualité des études, nous croyons avoir sélectionné, parmi les essais repérés, ceux
97
caractérisés par la plus grande rigueur méthodologique. Toutefois, les résultats d’une méta-
analyse varient selon le mode d’utilisation des cotes de qualité. En ce qui nous concerne, nous
avons déterminé qu’une cote en particulier constituait le seuil de qualité et, partant de là, nous
n’avons pas examiné les données des essais qui ne respectent pas ce seuil. Les essais analysés
n’ont pas tous la même cote de qualité, facteur dont nous n’avons pas tenu compte.
Hétérogénéité entre les essais : Dans les cas où la structure de l’essai est semblable, le
mode de présentation des résultats diffère au point que, dans certains essais, les
caractéristiques de base des personnes réparties de façon aléatoire ne sont pas décrites de
façon suffisamment détaillée pour qu’il soit possible de procéder à des ajustements dans
l’analyse [p. ex., (19)]. Le rejet d’un essai sur quatre pour ce motif restreint l’utilité d’une
méta-analyse.
En outre, à la suite de l’examen méthodologique et de la conférence de concertation,
nous n’avons pu retenir qu’un seul essai sur la vitamine E (40), sur la lécithine (73) et sur la
linopirdine (85) aux fins de l’examen approfondi, d’où l’impossibilité d’une méta-analyse.
Aucun des six essais étudiés ne démontre de façon convaincante l’efficacité de la
sélégiline, malgré le caractère prometteur de cet agent en raison de son action antioxydante.
Bien que quelques items des échelles cognitives utilisées fassent ressortir une certaine
amélioration, celle-ci ne transparaît pas dans le comportement du malade. Dépourvue
d'efficacité manifeste, la sélégiline ne cause toutefois que peu d’effets indésirables, dont aucun
n’est suffisamment grave pour occasionner la cessation du traitement.
À l’exception du risque accru de chutes et de syncopes, l’alpha-tocophérol (vitamine
E) est également bien toléré. Ce médicament accroît de façon statistiquement significative le
délai entre l'admission à l’étude et la survenue des événements cibles, qui représentent les
résultats principaux. Ce choix de résultat principal défini comme le délai avant le décès ou
l’institutionnalisation; la perte d’autonomie, telle que mesurée par l’échelle BDS, dans
l'exécution d'au moins deux des trois activités que sont le fait de se nourrir, de soigner son
apparence ou d'aller à la toilette; ou l'aggravation de la démence, confirmée par un score CDR
de 3, rend difficile l’interprétation des résultats. Une sous-analyse par résultat particulier
indique que, dans le groupe de l’alpha-tocophérol, le délai avant l’institutionnalisation est
accru de façon significative. C’est un fait généralement admis que le risque
98
d’institutionnalisation est fondé sur un certain nombre de facteurs individuels et familiaux, et
ces facteurs n’ont pas été pris en compte (en réalité, ils n’ont pas été mesurés) dans le rapport.
En outre, ce résultat est d’autant plus intrigant que le traitement par la vitamine E seule
produirait un effet plus grand que le traitement par la combinaison de la vitamine E et de la
sélégiline.
Quant à la lécithine, nous ne savons pas si le mode de sélection, reposant sur le critère
voulant qu’il s’agisse de personnes ayant bien répondu à la tacrine, peut avoir dénaturé les
résultats de sorte qu'on ne puisse mettre en évidence l'effet de la lécithine. Une durée de
traitement de quatre semaines est sans doute trop courte pour étayer les effets bénéfiques, et la
structure en chassé-croisé est inappropriée en ce qui concerne les affections de progression
constante, telles la MA. Par ailleurs, le rapport ne renferme pas de données concernant la
seconde phase de l’étude, et il n’y a pas de comparaison définie avec le placebo. Selon cette
étude, les précurseurs cholinergiques seuls ne joueraient pas un rôle bénéfique, ce que laissent
d’ailleurs entrevoir les résultats d’essais antérieurs, moins rigoureux sur le plan
méthodologique (95). Il se peut que l’hypothèse cholinergique à l’origine de telles
comparaisons ne puisse expliquer à elle seule la physiopathologie réelle de la MA (69;95).
D’après l’examen d’un seul essai, la linopirdine n’exercerait pas d’effets bénéfiques
chez les personnes atteintes de la MA. Cette constatation, conjuguée au risque de
dysfonctionnement hépatique, vient mettre en doute l’utilité clinique du médicament.
De son côté, la propentofylline exercerait un effet bénéfique minime sur le
fonctionnement global et la cognition en administration à long terme, quoique la portée
clinique de cet effet soit indéterminée. Le médicament fait preuve d’innocuité même après un
an d’utilisation continue.
Le résumé qui suit est centré sur trois inhibiteurs de la cholinestérase (le donépézil, le
métrifonate et la rivastigmine) et sur le Gingko Biloba. Quant à la sélé giline, la vitamine E, la
lécithine, la linopirdine et la propentofylline, nous sommes d’avis que les données publiées ne
démontrent pas leur efficacité.
99
4.1 Donépézil
En se fondant sur les résultats de l’essai de phase II (16), où le médicament est
administré à des doses de 1 mg, de 3 mg et de 5 mg/jour, les chercheurs des essais de phase III
subséquents (19) (18) (17) ont tous choisi d’utiliser le médicament à raison de 5 mg/jour et de
10 mg/jour.
Dans l’ensemble, les résultats de ces essais sont uniformes, à savoir que le donépézil
est bien toléré aux doses de 5 mg/jour et de 10 mg/jour, et qu’il produit un effet modéré
(statistiquement significatif) tant sur la cognition que sur l’état clinique global des malades sur
des périodes de 12 et de 24 semaines. Dans tous les cas, le médicament est administré une
fois par jour. L’amélioration de la cognition, mesurée par l’échelle ADAS-cog, n'est que
légèrement plus élevée chez les participants ayant reçu 10 mg/jour que chez les participants
ayant reçu le médicament à raison de 5 mg/jour; en outre, dans deux des études, le groupe du
médicament à dose élevée compte plus d’abandons que le groupe du médicament à faible dose
(17;18). La fréquence élevée d’effets indésirables dans le groupe de 10 mg de l’essai de
Rogers et collab. (17) est probablement due à l’augmentation rapide de la dose, passant de
5 mg/jour à 10 mg/jour en une semaine. Les effets thérapeutiques observés dans les groupes
du médicament à 10 mg/jour sont, à toutes fins utiles, les mêmes (2,88 points, 2,9 points et
3,1 points), que ce soit sur 12 semaines ou 24 semaines. Il est impossible d'établir des
comparaisons directes entre l’essai de Burns et collab. (19) et les autres en raison du manque
de données précises à cet égard.
Dans ces essais, les chercheurs adoptent tous l’approche du report prospectif des
dernières observations en ce qui a trait aux abandons, ce qui a pu contribuer à la surestimation
de l’effet thérapeutique. Cet aspect est particulièrement important dans le cas de l’essai de
Rogers et collab. (17) où seuls 68 % des participants du groupe de 10 mg/jour terminent
l’essai par rapport à 80 % des participants du groupe sous placebo. Le problème tient au fait
que la durée réelle de traitement n’est pas la même dans les groupes comparatifs et que les
scores ADAS-cog du groupe du médicament, mesurés plus tôt au cours de l’essai, sont plus
élevés que les scores escomptés à la fin de l’étude, la détérioration étant sous -estimée. Cette
divergence peut donner lieu à un écart faussement accru entre le groupe du médicament et le
groupe sous placebo. Même si la détérioration dans le groupe du placebo des essais d’une
100
durée de 12 semaines est moindre que celle dans les essais de 24 semaines, l’effet
thérapeutique est d'une plus grande ampleur, d’où les constatations de même nature d'essais de
durée différente. Certains chercheurs sont d’avis qu’un changement de 4 points du score
ADAS-cog se produit inévitablement chez les personnes atteintes de la MA en l'absence de
traitement (voir la partie II), et qu’un médicament contre la démence devrait à tout le moins
contrer ce changement. Dans aucun des essais examinés le donépézil n’exerce-t-il un effet de
cette ampleur.
En ce qui a trait à l'état fonctionnel global, les auteurs des essais sur le donépézil
mentionnent tous un écart statistiquement significatif entre le groupe du médicament et le
groupe du placebo sur l'échelle CGIC (16) ou CIBIC-plus (17-19). La valeur absolue de
l’écart, notablement semblable d’un essai à un autre, ne varie pas selon la dose du médicament
ou la durée de l’essai. En effet, les chercheurs constatent un écart de 0,3 point ou de 0,4 point
en moyenne entre le groupe sous placebo et le groupe du médicament. Il est difficile de
déterminer la portée clinique de résultats présentés de cette façon. Lorsqu’ils sont exprimés
autrement, on note toutefois, dans tous les essais, un écart statistiquement significatif entre les
groupes de 5 mg/jour, de 10 mg/jour et du placebo en ce qui a trait à la proportion des
participants dont l’état s'améliore ou ne change pas d’après l’échelle d’évaluation globale. Par
contre, il n’y a pas d’écart entre les deux groupes du médicament à cet égard.
Dans l’ensemble, le donépézil produit un effet modeste à la fois sur le rendement
cognitif et le fonctionnement global. Les données n’indiquent pas cependant que la dose de
10 mg/jour est plus efficace que la dose de 5 mg/jour. À ce propos, il conviendrait de
poursuivre la recherche. Les taux d’abandon élevés, particulièrement dans l’essai de Rogers et
collab. (17), compromettent la validité des résultats sur l’efficacité de cette étude et la
comparabilité avec les autres études.
4.2 Métrifonate
Selon les résultats de notre examen, le métrifonate administré une fois par jour est
assez bien toléré, peu de personnes ayant cessé prématurément leur participation en raison
d’effets indésirables. Tous les essais font mention d’un effet thérapeutique statistiquement
significatif, d’après les scores ADAS-cog, à la fin de la phase à double insu. Toutefois,
101
l’ampleur de l’écart varie d’un essai à un autre. De façon générale, les groupes sous placebo
manifestent une détérioration au fil des essais, tandis que l’état des groupes du médicament
soit ne change pas, soit s'améliore légèrement. L’ampleur de l’effet, mesuré par l’échelle
ADAS-cog, est maximale (aux doses équivalentes) à la dose la plus élevée, que la durée de
l’étude soit de 12 ou de 26 semaines. Il convient de souligner que le rapport de Raskind et
collab. (22) ne renferme pas suffisamment de données pour comparer l’ampleur de l’effet
entre cet essai et les autres. Dans l’ensemble, par rapport aux participants des groupes du
placebo, dont l’état se détériore au fil du temps, les participants des groupes du métrifonate
soit ne présentent aucun changement, soit manifestent une légère amélioration. Dans deux
essais de 26 semaines comptant deux groupes du médicament à dose différente (comportant
tous deux une phase de dose d’attaque), les écarts moyens respectifs entre le groupe du
médicament à dose élevée et le groupe du placebo sont de 2,94 points (23) et de 2,86 points
(25). Fait notable, ces valeurs sont à peu près les mêmes que celles obtenues dans les essais
sur le donépézil, quoique de nouveau, les critères de succès thérapeutique, soit l’arrêt du
processus pathologique en six mois (c.-à-d., 4 points sur l’échelle ADAS-cog) n’aient pas été
atteints.
Dans tous les essais, les chercheurs constatent un effet thérapeutique significatif sur le
fonctionnement global, tel que mesuré par l'échelle CIBIC-plus. Les écarts
médicament:placebo entre le moment de référence et la fin de la phase à double insu sont
presque identiques. Morris et collab. (25) font mention d’un écart médicament:placebo de 0,28
point (IC de 95 % : 0,06 à 0,50), alors que Raskind et collab. (22) signalent un écart de
0,2 point (p<0,05). De leur côté, Cummings et collab. (23) indiquent un écart comparable dans
le groupe du médicament à dose moyenne (écart médicament:placebo de 0,29 point, IC de
95 % : 0,09 à 0,48) et dans le groupe du médicament à dose élevée (écart médicament:placebo
de 0,35 point, IC de 95 % : 0,15 à 0,54). L’étude de Jann et collab. (20) démontre qu’une dose
d’attaque n’est pas nécessaire.
D’après l’analyse de la documentation publiée, l’efficacité du métrifonate serait du
même ordre que celle du donépézil. Lors d’un entretien, un représentant de Bayer nous a
informés que « l’utilisation clinique du métrifonate est actuellement interrompue afin
d’évaluer le risque de faiblesse musculaire proximale ».
102
4.3 Rivastigmine
La structure des deux études examinées est telle que la comparabilité des résultats s’en
trouve accrue. Toutefois, la disparité des modes de présentation des données des deux essais
rend difficile la comparaison de la portée des résultats. Le rapport de l’essai de Corey-Bloom
et collab. (29) comprend des renseignements sur diverses caractéristiques des participants au
moment de référence. Par contre, Rösler et collab. (31) ne font état que de renseignements de
base relatifs aux échelles ADAS-cog et PDS. Les deux études sont marquées par un fort taux
d’abandon dans le groupe du médicament à dose élevée à cause du protocole d’augmentation
fixe de la dose (le groupe dans lequel les chercheurs constatent d’ailleurs des écarts) et sont
caractérisées, d’autre part, par l’utilisation de diverses analyses statistiques de l’efficacité.
Notre examen approfondi révèle que le traitement par la rivastigmine à dose élevée
administrée deux fois par jour produit un effet bénéfique modéré tant sur la cognition que sur
l’état clinique global. Dans les deux études, le groupe de participants sélectionnés est
hétérogène, et plus de 90 % des personnes souffrent d’autres affections médicales ou
consomment d’autres médicaments, ce qui, théoriquement, accroît la généralisabilité des
résultats. Dans leur étude (29), Corey-Bloom et collab. constatent un écart médicament à dose
élevée:placebo de 3,78 points (IC de 95 % : 2,69 à 4,87) sur 26 semaines, selon l’analyse du
principe de vouloir traiter, écart plus important que ceux découlant de l'utilisation du
donépézil ou du métrifonate. Dans l’essai de Rösler et collab. (31), l’ampleur de l’effet dans le
groupe du médicament à dose élevée est beaucoup plus faible, l’écart médicament à dose
élevée:placebo étant de 1,6 point (p<0,10). Quant au groupe du médicament à faible dose,
l’écart n’est pas statistiquement significatif.
Dans les deux essais, les chercheurs font état d’un effet statistiquement significatif de
la rivastigmine sur le fonctionnement global, tel que mesuré par l'échelle CIBIC-plus. Dans les
deux groupes du médicament de l’essai de Corey-Bloom et collab. (29), l’écart
médicament:placebo entre le moment de référence et la fin de la période cible est
pratiquement le même (c.-à-d., 0,29 dans le groupe du médicament à dose élevée et 0,26 dans
le groupe du médicament à dose faible). Rösler et collab. (31) signalent des écarts du même
ordre, soit un écart médicament dose élevée:placebo de 0,47 et un écart médicament faible
dose:placebo de 0,33, écarts estimés d’après les données disponibles.
103
Dans les deux études, l’état des participants du groupe du médicament à dose élevée
s'améliore, d’après l’échelle de détérioration progressive, par rapport aux participants du
groupe placebo, tandis qu’il n’y a pas d’amélioration manifeste chez les participants du groupe
de la rivastigmine à faible dose. Dans l’étude de Rösler et collab., ces effets sont mis en
évidence par l’analyse du report prospectif des dernières observations, alors que dans l’étude
américaine, l’analyse selon le principe de vouloir traiter produit des résultats semblables.
L’échelle PDS a été mise au point en tant qu’échelle d’évaluation de la qualité de vie
chez les personnes atteintes de la MA (34), et son utilisation dans les essais cliniques comme
instrument de mesure des activités de la vie quotidienne ne fait pas l’unanimité (36).
4.4 Gingko Biloba
Le Gingko Biloba est très répandu, et en Europe son utilisation est proposée dans les
cas d’insuffisance vasculaire cérébrale, laquelle contribuerait à la physiopathologie de la
démence. Les essais examinés sont de durée différente, utilisent le médicament à des doses
diverses (dans les deux essais où le médicament est utilisé à la même dose, il est administré
deux fois par jour dans l’un et trois fois par jour dans l’autre), ont recours à des instruments de
mesure principaux et secondaires différents, et la taille de l’échantillon varie considérablement
d’un essai à un autre. De plus, un seul des essais (88) ne comprend que des personnes atteintes
de la MA, et les renseignements détaillés sur les abandons, les caractéristiques de base et les
effets secondaires concernant les participants atteints de la MA ne sont pas présentés de façon
appropriée dans les deux autres essais. En raison de ces divergences, il est difficile de tirer des
conclusions générales sur l’efficacité du Gingko Biloba dans le traitement de la MA. Dans
l’ensemble, le Gingko Biloba à raison de 120 mg/jour (87) exercerait un effet modeste sur la
fonction cognitive, comme l’illustre l’écart médicament:placebo entre le moment de référence
et la fin de la période cible de 1,7 point (IC de 95 % : 0,2 à 3,2) sur l’échelle ADAS -cog. Cet
effet est notablement plus faible que celui produit par les inhibiteurs de la cholinestérase (tel
qu’il est mesuré par l’échelle ADAS-cog ou le SKT) chez les personnes atteintes de la MA.
Toutefois, dans l’interprétation de ces résultats, il faut tenir compte du taux d’abandon
extraordinairement élevé tant dans le groupe du médicament (50 %) que dans le groupe sous
placebo (62 %). Dans leur essai de 12 semaines ne comptant que 20 personnes atteintes de la
104
MA traitées par le Gingko Biloba à raison de 240 mg/jour, Maurer et collab. (88) signalent un
écart de 0,91 point sur l’échelle ADAS-cog. Quant à l’essai de Kanowski et collab. (89), où le
médicament est administré à raison de 240 mg/jour et où le rendement cognitif est mesuré par
le SKT, la proportion des participants du groupe du médicament dont l’état s'améliore d’au
moins 4 points d’après le SKT (48 %) est plus élevée que celle du groupe placebo (18 %),
p<0,05. De plus, l’écart médicament:placebo est de 1,5 point au SKT dans cet essai de
24 semaines. Dans l’essai plus court de 12 semaines (88) où le médicament est utilisé à la
même dose, l’écart est de 3,67 points (p<0,013) en faveur du groupe du médicament. La
spectaculaire divergence des résultats sur l’efficacité de ces deux essais où la dose du
médicament est la même doit être examinée à la lumière du fait que la gravité de la maladie
n'est pas la même chez les participants. Les participants de l’essai de Maurer et collab. (88)
souffrent d’un déficit cognitif beaucoup plus prononcé que celui des participants des deux
autres essais. D’autre part, l’EGb n’exerce aucun effet sur le fonctionnement global.
Le fait que les chercheurs des trois essais cliniques sur le Gingko Biloba répondant aux
critères minimaux d'admissibilité à notre analyse aient recours à un instrument de mesure
principal qui n’est décrit dans aucune documentation de langue anglaise (soit le SKT) entrave
l’interprétation précise des résultats. Nous pensons que la recherche dans ce domaine serait
facilitée si les essais cliniques ne comptaient que des personnes atteintes de la MA probable et
si les instruments de mesure utilisés dans ces essais étaient des instruments reconnus à grande
échelle.
4.5 Dernières observations
La dernière décennie a vu surgir de nombreuses percées dans la pharmacothérapie de
la MA. En outre, les essais cliniques évaluant ces médicaments se sont améliorés du point de
vue de la structure, du déroulement et du mode de présentation des données, d’où le nombre
accru d’essais susceptibles de présenter des données concluantes à cet égard. Comme notre
examen ne couvre que des rapports d’essais publiés intégralement, il est fort possible (en fait,
probable) que nous ayons écarté par le fait même d’excellents essais en cours ou terminés
mais non publiés. D’après les données examinées, le donépézil, le métrifonate et la
rivastigmine produisent tous trois un effet bénéfique modeste, statistiquement significatif, sur
105
le rendement cognitif et le fonctionnement global des personnes âgées atteintes de la MA
probable, qui sont admissibles aux essais cliniques. Dans l'attente d'essais de plus longue
durée, tout ce qu’on peut affirmer, c’est que ces agents exercent un effet symptomatique. Par
ailleurs, l’efficacité du Gingko Biloba dans le traitement de la MA est moindre que celle des
inhibiteurs de la cholinestérase mentionnés dans le présent rapport.
Bien que ces médicaments soient tous bien tolérés, quant à la fréquence d’effets
indésirables, le taux d’abandon est élevé dans certains cas, d’où la surestimation possible des
effets thérapeutiques observés. Dans le rapport complémentaire (partie II), nous étudions les
qualités psychométriques des instruments de mesure principaux et secondaires utilisés dans
ces essais, et nous sommes encore et toujours préoccupés par le fait qu’une vaste gamme
d’échelles n’ont pas fait l’objet d’une évaluation psychométrique appropriée. Bien que la
fiabilité et la validité d’un grand nombre de ces échelles ne fassent aucun doute, leur capacité
à déceler le changement n’a pas été évaluée pour beaucoup d’entre elles. C’est pourquoi la
portée clinique des écarts médicament:placebo demeure imprécise. L’analyse comparative de
médicaments employés dans le traitement de la MA ne repose pas seulement sur la
comparabilité de la structure, de la durée et des instruments de mesure des essais, mais
également sur leur mode de présentation des résultats. Nous constatons que le mode de
présentation des résultats n’est pas uniforme d’un essai sur la MA à un autre, même dans les
essais effectués par le même groupe de chercheurs. Nous savons bien que les revues
spécialisées proposent toutes des lignes directrices particulières aux auteurs; malgré cela, nous
sommes d’avis que la diversité des modes de présentation de renseignements primordiaux,
notamment les renseignements concernant les participants et les résultats de l’essai, est
inadmissible.
106
5. SOURCES DE RÉFÉRENCE
(1) Anonymous. Canadian study of health and aging: Methods and prevalence of
dementia. CMAJ 1994; 150(6):899-913.
(2) Teng EL, Chui HC. The Modified Mini-Mental State (3MS) Examination. J Clin
Psychiatry 1987; 48:314-318.
(3) American Psychiatric Association. Diagnostic and Statistical Manual for Mental
Disorders. 3 ed. Washington, DC: American Psychiatric Association, 1987.
Slavin RE. Best evidence synthesis: An intelligent alternative to meta-analysis. J Clin
Epidemiol 1995; 48(1):9-18.
Small BJ, Viitanen M, Winbald B, Baeckman L. Cognitive changes in very old persons with
dementia: The influence of demographic, psychometric and biological variables. J Clin
Exp Neuropsychol 1997; 19:245-260.
Sramek JJ, Anand R, Wardle TS et al. Safety/tolerability trial of SDZ ENA-713 in patients
with probably Alzheimer`s disease. Life Sci 1996; 58(15):1201-1207.
Stephens MDB. Detection of New Adverse Drug Reactions. 3 ed. Reinhold, N.Y.: van
Nostrand, 1993.
Stern RG, Mohs RC, Davidson M et al. A longitudinal study of Alzheimer`s disease:
Measurement, rate and predictors of cognitive deterioration. Am J Psychiatry 1994;
151:390-396.
Taillandier J, Ammar A, Rabourdin JP et al. Traitement des troubles du vieillissement cérébral
par l'extrait de Ginkgo Biloba. Étude longitudinale multicentrique à double insu face
au placebo. Presse Med 15[31], 1583-1587. 1986.
126
Tariot PN, Goldstein B, Podgorski CA et al. Short-term administration of selegiline for mild-
to-moderate dementia of the Alzheimer`s type. Am J Geriatr Psychiatry 1998;
6(2):145-154.
Tariot PN, Mack JL, Patterson MB et al. The Behavior Rating Scale for Dementia of the
Consortium to Establish a Registry for Alzheimer`s Disease: The Behavioral
Pathology Committee of the Consortium to Establish a Registry for Alzheimer`s
Disease. Am J Psychiatry 1995; 152:1349-1359.
Tariot PN. CERAD Behavior Rating Scale for Dementia. Int Psychogeriatr 1996; 8 (Suppl.
3):514-518.
Teng EL, Chui HC. The Modified Mini-Mental State (3MS) Examination. J Clin Psychiatry
1987; 48:314-318.
Ulus IH, Wurtman RJ. Prevention by choline of the depletion of membrane
phosphatidylcholine by a cholinesterase inhibitor. N Engl J Med 1988; 318:191.
Weinstein HC, Teunisse S, van Gool WA. Tetrahydroaminoacridine and lecithin in the
treatment of Alzheimer`s disease. Effect on cognition, functioning in daily life,
behavioral disturbances and burden experienced by the carers. J Neurol 1991;
238(1):34-38.
Wesnes K, Simmons D, Rock M, Simpson P. A double-blind placebo-controlled trial of
tanakan in the treatment of idiopathic cognitive impairment in the elderly. Human
Psychopharmacol 1987; 2:159-169.
Wolfson C, Moride Y, Perrault A, Vida S. A Study of the Efficacy, Effectiveness and
Economic Impact of Tacrine in Alzheimer's Disease. 1997. Ottawa, Canadian
Coordinating Office for Health Technology Assessment.
127
Yamada Y, Nakamura H, Okada Y. HWA 285 enhances the formation of long-term
portentiation in guinea pig hippocampal slices. Neuroscience Letters 1994; 176:189-
192.
128
ANNEXE A
Tableau 1 : L’échelle Jadad à trois items
Question Options de réponse
1. L'étude est-elle décrite comme étant randomisée ? ‘Oui’ ou ‘Non’
2. L'étude est-elle décrite comme étant à double insu ? ‘Oui’ ou ‘Non’
3. Les abandons et les retraits sont-ils décrits ? ‘Oui’ ou ‘Non’
Cotation
En regard de chaque question, accorder un point à une réponse affirmative et aucun point
à une réponse négative.
Question 1 :
� accorder un point supplémentaire si la méthode de randomisation est appropriée
(c.-à-d., générée par ordinateur, etc.);
� soustraire un point si la méthode de randomisation est inappropriée.
Question 2 :
� accorder un point supplémentaire si le mécanisme de double insu est approprié
(c.-à-d., groupe identique sous placebo, etc.);
� soustraire un point si le mécanisme à double insu est inappropriée.
Source : Jadad AR, Moore A, Carroll D et collab. Assessing the quality of reports of randomized clinical trials: Is blinding necessary? Control Clin Trials 1996;17:1-12.
129
Tableau 2 : Les trois autres questions de l’échelle Jadad à six items
Question Options de réponse
Y a-t-il une description précise des critères d’inclusion/d’exclusion ? ‘Oui’ ou ‘Non’
La méthode d’évaluation des effets secondaires est-elle décrite ? ‘Oui’ ou ‘Non’
Les méthodes d'analyse statistique sont-elles décrites ? ‘Oui’ ou ‘Non’
Cotation (applicable à toutes les questions)
Accorder un point aux réponses affirmatives.
N’accorder aucun point aux réponses négatives.
Source : Jadad AR, Moore A, Carroll D et collab. Assessing the quality of reports of randomized clinical trials: Is blinding necessary? Control Clin Trials 1996;17:1-12.
130
ANNEXE B
ECR rejetés et motifs de rejet
Médicament ECR Motif de rejet
Œstrogène Gingko Biloba Indométhacine Lécithine
Linopirdine Métrifonate
Schneider et collab., 1997 Phillips et collab., 1992 Ditkof et collab., 1991 Sherwin et collab., 1988 Hofferberth et collab., 1994 Rai et collab., 1991 Wesnes et collab., 1987 Taillandier et collab., 1986 Rogers et collab., 1993 Safford et collab., 1994 Crapper-McLachlan et collab., 1993 Minthon et collab., 1993 Uney et collab., 1992 Weinstein et collab., 1991 Chatellier et collab., 1990 Fitten et collab., 1990 Gauthier et collab., 1990 Vida et collab., 1989 Heyman et collab., 1987 Sorgatz et collab., 1987 van Dyck et collab., 1997 Kaufer et collab., 1998
Score Jadad < 5 Score Jadad < 5 Score Jadad < 5 Score Jadad < 5 NINCDS/ADRDA non respectés NINCDS/ADRDA non respectés NINCDS/ADRDA non respectés Personnes non atteintes de démence Score Jadad < 5 Score Jadad < 5 Score Jadad < 5 Score Jadad < 5 Score Jadad < 5 * Score Jadad < 5 * * Score Jadad < 5 Score Jadad < 5 Score Jadad < 5 *Données sur les résultats insuffisantes pour interpréter l’effet de la lécithine Score Jadad < 5 Score Jadad < 5
131
ECR rejetés et motifs de rejet (suite)
Médicament ECR Motif de rejet
Propentofylline Sélégiline
Mielke et collab., 1996 Moller et collab., 1994 Filip et collab., 1999 Oakley et collab., 1997 Marin et collab., 1995 Agnoli et collab., 1992 Finali et collab., 1992 Finali et collab., 1991 Martignoni et collab., 1991 Agnoli et collab., 1990 Campi et collab., 1990 Falsapera et collab., 1990 Monteverde et collab., 1990 Piccinin et collab., 1990 Tariot et collab., 1987 Tariot et collab., 1987