alyse la bioM'lét~ie

Société F~aJt\çaisede BioW\ét~ie

De l'obse~vatioJl\à l'aJl\alysel

iM'lplicatioJl\ de la bioM'lét~ie

daJl\s les pays

de développemeJl\t

1998

Te;xtes p ..éseY\tés lo..s des jo~ ..Y\ées ..éalisées pa..

la Société "F..aY\çaise de BioWlét.. ie

à Ca ..cassoY\Y\e, les 29 et 30 Wlai 1997

Société F~aJt\çaisede BioW\ét~ie

De l'obse~vatioJl\à l'aJl\alysel

iM'lplicatioJl\ de la bioM'lét~ie

daJl\s les pays

de développemeJl\t

1998

Te;xtes p ..éseY\tés lo..s des jo~ ..Y\ées ..éalisées pa..

la Société "F..aY\çaise de BioWlét.. ie

à Ca ..cassoY\Y\e, les 29 et 30 Wlai 1997

IMPRIMt PAR :1~:~R:r7PARIS

S0l1ll11aire

Alain PavéPréface iii

Francis Laloë et Xavier PérrierDe l'observation à l'analyse 1

Janet RileyBiométrie pour l'impact sur le développement '" 5

Piel'l'e DagnelieQuelques perspectives relatives à la biométrie:pays en voie de développement et pays développés 1.5

Michel PassouantStatistiques et systèmes d'information 29

Pierre Morand et Jocelyne Fel'l'arisL'évolution des systèmes d'enquêtedes pêches artisanales en Afrique de l'Ouest,entre questions halieutiques et solutions méthodologiques 43

Christian Mullon et Marie PironSur la méthodologie de mise en placedes observatoires socio-économiques 61

Pierre Traissac, Bernard Maire et Francis DelpeuchAspects statistiques du ciblage des politiques et programmes nutritionnelsdans les pays en développement i9

Hélène Lubes-Niel, Hayet Khodja et Robert SabatierStatistique et hydrologie à travers quelques exemplesappliqués à des problématiques des pays en voie de développement 99

Frédéric ChiroleuDose Létale 50 : Historique et perspectives lli

Jean Thioulouse, Emmanuelle Pate, N'Deye N'Diaye et Patrice CadetInfluence de la jachère sur les peuplementsde nématodes phyto-parasites au Sénégal:protocoles de collecte et d'analyse des données et premiers résultats 129

Il

Biométrie et pays en développement

Alain Pavé*

Traiter d'un tel sujet était un défi.. Consacrer un colloque et un ouvrageà la question d'une discipline scientifique en regard des conditions naturelles,économiques et sociales de vastes régions du monde pouvait conduire à émettreles poncifs les plus affligeants. Cet écueil a été magistralement évité. Pourquoi?Certes les organisateurs et les intervenants ont su cadrer leur discours, sur desregistres différents: des conditions institutionnelles particulières des pays en question aux problèmes spécifiques de recherche et de formation qu'ils posent, en passant par l'évolution de la discipline au niveau international et la discussion surl'adéquation entre cette évolution et les conditions de sa pratique dans ces pays.

j\IIais il s'agissait avant tout d'un colloque scientifique. On peut alors se poserla question de l'apport original des recherches dans ces pays à l'évolution de cettediscipline. On remarquera d'abord que depuis une trentaine d'années la biométrie asingulièrement évolué en étendant son champ d'action, passant du développementde la statistique, qui a été et est encore son fleuron, à la modélisation, puis àl'utilisation de l'informatique bien au-delà de ses applications calculatoires. Onassiste aujourd'hui à un double mouvement, d'une part à une spécialisation deplus en plus grande des chercheurs, classique dans les dynamiques scientifiques,d'autre part à une diffusion des concepts, des méthodes et des techniques fécondantchacune des trois grandes tendances. Par exemple, le concept de modèle a migrédu côté statistique; les problèmes d'identification ont été mieux abordés par lesmodélisa teurs.

l't'lais précisément en quoi les problèmes posés dans les pays en développementsont sources de progrès? Le maître mot semble être diversité. Certes la biométriea comme objectif majeur l'analyse de la variabilité des systèmes vivants. Elles'est néanmoins constituée sur la base de problèmes concrets relevant tout particulièrement de l'agronomie et de la santé. Elle a épousé, d'une certaine façon, lesmodes de développement des pays du Nord. Tenter de converger vers des schémasuniformes. Développer une agriculture produetiviste. Mettre en place des méthodes thérapeutiques standards. Ce que nous proposent les pays en développements'écarte singulièrement de ces schémas: malgré une pression des pays du Nordqui ont essayé d'imposer des modèles de développement, fort est de constater, surle terrain, que ces modèles ne sont pas adaptés, ni aux conditions naturelles, niau contexte culturel des PED. Diversité des milieux et des pratiques, diversification des modes d'exploitation et de valorisation. Pour un biométricien, il ne s'agitplus de développer des plans d'expériences pour des tests de fertilisation dans une

-Professeur, Laboratoire de biométrie de J'Université Claude Bernard, Lyon l

III

monoculture. Il doit au contraire imaginer des méthodes adaptées à une diversitéde productions avec faible apport d'intrants. Il doit sortir des forêts monospécifiques ou faiblement diversifiées de nos régions pour s'attaquer aux grands massifsforestiers intertropicaux nlllltispécifiques. Il doit faire avec des médecines adaptées aux conditions locales de faible niveau économique, avec des modes de traitement \1 traditionnels 1', avec des conditions sociales et culturelles diverses et forttranchées. Il est amené à considérer des modes d'exploitation changeants, quis'adaptent à la variabilité quantitative et spécifique de la ressource halieutiqueainsi qu'aux fluctuations du marché.

Le biométricien doit donc faire avec la diversité des situations. Diversité n'estpas désordre. Il doit la prendre en compte. Inventer des méthodes adaptées.Chercher les invariants. Comprendre les structures sous-jacentes. L'analyser et lamodéliser. Concevoir des outils de traitement et de visualisation adaptés. Participer à la conception de modes de gestion de ces systèmes diversifiés.

Les pays du Nord s'écartent progressivement du \1 modèle unique", des schémassimplificateurs. Ils se diversifient et diversifient leurs modes de développement.Tous les secteurs d'intervention de la biométrie sont concernés: l'agriculture, lapêche, la santé, la forêt, l'environnement et cela à tous les niveaux d'organisation:de l'exploitation à la région, de la pêche artisanale à la pêche industrielle, dumalade au système de santé, de la parcelle forestière " monospécifique " à lagrande forêt intertropicale, de l'environnement local et régional à l'environnementplanétaire. Les questions, tant fondamentales que finalisées, posées en termes debiodiversité et qui concernent au premier plan les pays du Sud sont aussi un facteurimportant cie progrès pour la discipline. On peut gager que l'expérience acquiseclans l'étude des problèmes des pays du Sucl, par un retour curieux, permettra sansdoute de mieux appréhender les situations nouvelles rencontrées dans les pays cluNord.

Associer biométrie et problèmes des" pays en développement" n'est donc pasun contresens, ni une banalité. C'est l'amorce d'une pratique et d'une réflexion,riche de progrès potentiels pour la discipline, précieuse pour aborder les questionsnouvelles qui se posent et se poseront dans les divers secteurs où elle intervient.On peut donc se féliciter de cette initiative. On peut aussi espérer qu'elle serasuivie et amplifiée.

iv

De l'Observation à l'analyse ...

Francis Laloëa Xavier Perrierb

Contrairement aux habitudes, ce recueil de communications faites lorsde la session de biométrie pendant les XXIxe journées de statistique àCarcassonne en mai 1997, ne s'intitule pas "biométrie et ..."

Le choix fait par la Société Française de Biométrie de mettre l'accentsur les activités des biométriciens dans les pays en développement auraitpu conduire à un titre tel que "biométrie et pays en développement", maisil ne nous a pas semblé correct de pouvoir ainsi laisser a priori penser qu'ilexiste une spécificité pour une telle biométrie.

Une telle spécificité n'existe pas dans les outils mathématiques, ni dansle champ des applications. La santé, l'agriculture, la pêche posent toutautant de questions au Nord qu'au Sud (même si elles ne se présententpas toujours dans des termes identiques) et les mêmes méthodes peuventêtre mises en œuvre pour y apporter des réponses, même si l'accès à cesméthodes mérite une grande attention, comme le montrent J. Riley et P.Dagnélie ...

En préparant cette session, nous avons pensé qu'il était nécessaire d'insister plus que de coutume sur l'observation. La raison de ce choix n'estpas seulement liée à une quelconque difficulté d'observer qui pourrait êtreplus grancle dans les pays en développement que dans les autres. S'il y adifficulté, celle-ci réside peut-être avant tout dans l'identification cie ce qu'ilconvient d'observer.

En tant que biométriciens, nous choisissons, comme J.M. Legay, d'accepter les questions telles que posées par les biologistes ; en tant quechercheurs au sein cie programmes de recherche dont les problèmes sontdirectement liés à des questions cie développement, nous choisissons biensûr aussi d'accepter ces questions. Nous devons donc nous intéresser à larelation entre questions de biologie et questions de développement, et c'est

aOrstom, HEA (Halieutique et Ecosystèmes Aquatiques) et Cellule deBiométrie et Statistique. BP 504.5, 34032 lVlontpeliier Cedex l

bCentre de coopération internationale en recherche agronomique pour ledéveloppement (CIRAD), BP 5035, 34032 IVlontpeliier cedex l

1

peut-être là qu'est présente une certaine spécificité.

En effet, les problématiques scientifiques sont très largement posées dansle contexte de la "demande sociale" des pays développés. L'applicabilitédes résultats des recherches a donc toute chance d'être meilleure dans cespays développés. Ceci peut être illustré par deux exemples simples .

• Les modèles de génétique quantitative pour l'amélioration des plantesont longtemps négligé l'existence d'interactions entre effet du génomeet effet du milieu. Cette attitude, que l'on savait biologiquementerronnée, pouvait être "agronomiquement" utile dans un contexted'agriculture s'industrialisant. L'homogénéisation du milieu permettait en effet de négliger l'existence d'une interaction dont l'un deséléments était de faible importance. Mais, s'il peut y avoir une certaine ressemblance entre une parcelle expérimentale et une parcelled'une exploitation agricole industrialisée, l'hétérogénéité au sein d'uneparcelle de mil au Sahel apparaît un fait majeur pour l'observateur,même non averti .

• En faisant l'hypothèse qu'une population de poissons marins exploitéepar des navires de pêche est distribuée de façOll homogène, on peutadmettre que les rendements de pêche rel1ètent son abondance. Cettehypothèse est très probablement fausse, mais si les pêcheurs ont lesmoyens de poursuivre cette population dans ses déplacements, alorsles rendements pourront peut-être encore refléter l'abondance de cettepopulation exploitée. Si des pêcheurs artisans ne disposant pas d'unlong rayon d'action choisissent à chaque moment la technique leurpermettant de capturer l'espèce la plus abondante dans la zone quileur est accessible, l'impact de l'hétérogénéité spatio-temporelle surles erreurs d'appréciations commises en estimant les abondances parles rendements sera aggravé.

Si les modèles génétiques pour l'amélioration des plantes ou si les modèlesde dynamique des populations halieutiques exploitées avaient été conçudans le contexte des agricultures et des pêcheries des pays en développement, ils n'auraient peut-être pas été construits selon les mêmes ordres depriorité. Les deux exemples donnés montrent que les questions biologiquesdu strict point de vue fondamental n'auraient pas été moins intéressanteset leur intérêt biométrique est évident. De toute façon, les questions relatives aux interactions génotype-environnement ou aux pêcheries compositesmultispécifique-multiengin sont devenues d'actualité.

Mais ces deux exemples reposent aussi sur l'existence d'une interactionentre une dynamique biologique et une dynamique "socio-économique". Le

2

biométricien est alors néce~sairement amené à s'intéresser à cette interaction. En tant qu'un des spécialistes de l'étude de la variabilité, il doit enparticulier identifier la nature des variabilités qui contraignent la viabilitédes systèmes, et/ou sur lesquelles les acteurs fondent leurs stratégies.

Bien sûr cet intérêt n'est certainement pas propre au seul biométricien,et la biométrie - et plus généralement la statistique et l'ensemble desdisciplines de représentation des connaissances et de l'information - nepeuvent pas être seules contributrices en ce domaine. Le contexte décrit iciest nécessairement inter-disciplinaire, et il n'est pas surprenant d'observerque les programmes de recherches liés à des questions de développementfont très généralement état d'un besoin de pluridisciplinarité et, qu'au seinde ces programmes, la modélisation apparaisse fréquemment comme unoutil de communication entre disciplines.

Il nous est donc apparu important de consacrer un effort significatif àl'observation, avec trois communications reprises dans ce document. Cescontributions (Morand et Ferraris, Mullon et Piron, Passouant) sont relatives à des domaines variés. M. Passouant présente un système d'information sur la vallée du fleuve Sénégal, opérationnel depuis 1991, avec sesobjectifs, son évolution et les améliorations apportées depuis, en fonction des techniques, des demandes des utilisateurs... P. IvIorand et J.Ferraris décrivent avec plusieurs exemples d'exploitations halieutiques uneévolution conjointe des questionnements halieutiques, des objectifs liés àl'observation, et du statut même de ce qu'est l'observation. C. Mullon etl'lI. Piron nous présentent une réflexion générale sur les observatoires socioéconomiques, en identifiant nombre de difficultés et de besoins méthodologiques et en replaçant la démarche et les outils de la statistique dans l'environnement général d'un observatoire.

L'article de P. Traissac et al. montre de façon très claire la problématique générale du ciblage des interventions dans les programmes nutritionnels dans les pays en développement et les outils pouvant être les mieuxadaptés pour répondre aux questions posées.

H. Lubès et al. montrent à partir de quelques exemples le recours auxoutils statistiques variés pouvant être utilisés relativement à des questionstrès diverses en hydrologie.

F. Chiroleu présente un travail purement statistique lié à la détermination des doses létales .50. Cette présentation peut sembler peu spécifiquedes problèmes des pays en développement. Disons sim plement qu'en contexte tropical, la pression parasitaire aggrave les problèmes de traitementsphytosanaitaires et de gestion d'apparition de résistances et de pollutionsde l'environnement, et que la question traitée par F. Chiroleu est un mail-

3

Ion très important de la chaine des recherches relatives aux traitementsinsecticides dans le contexte général de l'apparition des résistances à cesproduits, avec leurs conséquences dramatiques dans les cultures cotonnièrespar exem pIe ...

De même l'article de J. Thioulouse et al. montre l'apport des méthodesd'analyse multivariées modernes. Ces méthodes ne sont pas spécifiques,mais elles apparaissent ici très bien adaptées à des analyses particulièrementimportantes en période d'évolution des durées de jachères...

Ces quelques communications donnent donc un aperçu des possibilitésoffertes par la biométrie et par la statistique, aussi bien en termes d'outilsqu'en termes d'apports des démarches disciplinaires.

Cela peut faire apparaître avec encore plus d'acuité les diagnostics poséspar J. Riley et par P. Dagnélie. Cela doit donner encore plus de force àleurs propositions.

4

Bion1étrie pour l'in1pact de la recherche sur ledéveloppen1ent

Janet Rileya

Résulné

Il Y a peu de temps, un projet du CTA (Centre Technique de Coopération Agricole et Rurale) a mis en évidence la pauvreté de la méthodologiebiométrique utilisée dans les instituts de recherche agronomique des paysafricains, des Caraïbes et du Pacifique. L'équipement informatique apparaît inadéquat et les programmes de formation biométrique sont dépassés.Des études menées dans d'autres pays en voie de développement arriventaux mêmes conclusions.

Un changement global infl uence actuellement l'orientation des recherches et la disponibilité des fonds pour la recherche. Les études qui étaientmenées jusqu'à présent dans des environnements contrôlés des stations sontmaintenant effectuées sur le terrain en milieu agricole pluridisciplinaire dansdes communautés locales. Les expériences et enquêtes sont par conséquentmoins bien suivies qu'auparavant, la variabilité-est grande et d'origine multiple et les données sont générées par des chercheurs, des agriculteurs etdes agents d'extension q ni interagissent. Il est nécessaire de bien évaluer l'impact des interventions sur les systèmes d'agriculture traditionnelspour chaque agent de la chaîne Chercheurs-Communautés : les agentsd'extension, les agric ulteurs, les familles, les instit utions agricoles et lesgouvernements locaux.

Les types de méthodes statistiques nécessaires à l'analyse de telles études de système ne sont pas enseignés dans les programmes nationaux d'éd ucation, ce qui résulte en des projets de recherche mal conçus et des analysesbiométriques incomplètes ou même jamais entamées.

Cet exposé présentera une étude typique de système en milieu paysan,qui intègre en même temps cultures, arbres, animaux, poissons, sols, in-

aStatistics Department, Rothamstecl Experimental Station, Harpenclen, UICtel: 44 1582763133 fax: 44 1.582467116 e-mail: [email protected]

sectes, climat et facteur humain, ainsi que les interactions et variabilitésdans l'espace et le temps. Les besoins statistiques pour évaluer ces composantes et leurs interactions seront discutés avec des exemples provenantde projets au Brésil, Bangladesh, Tha'I1ande, Vietnam, Colombie, Inde etAfrique de l'Est. L'exposé discutera également le choix des indicateurs utilisés pour évaluer l'impact des changements apportés à de tels systèmes insitu, et décrira les initiatives de recherches. Finalement, des suggestionsseront proposées pour améliorer la formation statistique dans les pays envoie de développement afin de les adapter aux changements des demandesdes donneurs et des besoins environnementaux des bénéficiaires.

L'étude de biométrie du CTA

Un projet du CTA (Centre Technique de Coopération Agricole et Rurale) a été mis en place pour évaluer les problèmes de méthodologie biométrique et statistique dans les instituts de recherche agronomique des paysafricains, des Caraïbes et du Pacifique (ACP). L'objectif est l'identificationdes possibilités de formations adéquates et des équipements biométriques,par exemple les livres, les journaux, les ordinateurs, les logiciels, et la diffusion des résultats de recherche dans les revues internationales.

Ce projet a mis en évidence la pauvreté de la méthodologie biométriqueutilisée dans les instituts et universités nationaux (Riley, 1996). Les chercheurs scientifiques ont peu d'accès auprès des statisticiens et des informaticiens qualifiés. Beaucoup de chercheurs ont reçu une formation statistiqueà plein temps à l'université mais la compétence statistique est médiocre.Les plans complètement randomisés et les plans en blocs de Fisher sontles plus populaires. Les autres plans ne sont pas beaucoup utilisés: nombre de chercheurs ne connaissent pas l'existence des carrés Latin (41%), oudes plans en split-plot (26%) ou des plans en blocs incomplets équilibrés(71%) ou des plans en Lattice (72%) ou des essais factoriels (30%). Lesconnaissances relatives aux méthodes d'analyses sont également faibles:si beaucoup de chercheurs comprennent et utilisent l'analyse de variance(87%) ; seuls 27% d'entre eux connaissent les modèles linéaires. Près de75% ne connaissent rien des modèles linéaires généralisés et 27% ne connaissent rien de la régression linéaire. Seuls 18% utilisent les analyses dumodèle multivarié.

La disponibilité des ordinateurs paraît suffisante, mais il y a une insuffisance de logiciels permettant la mise en oeuvre des méthodologies modernes. Le réseau électronique international reste très peu utilisé. Les livres debiométrie ne sont pas disponibles aux chercheurs et plus de 60% d'entre eux

6

n'envisagent pas de présenter leurs résultats de recherche dans des revuesinternationales.

Dans ces pays, les programmes de formation biométrique sont dépassésparce qu'on a copié les programmes de formation anglais, français, allemands ou américains ... d'il y a 50 ans. Ces programmes ne sont pas àjour,il y manque les développements récents et les possibilités offertes par lesordinateurs. Tout cela résulte en des projets de recherche mal conçus et desanalyses biométriques incomplètes ou même jamais entamées. Des étudesmenées dans d'autres pays en voie de développement arrivent aux mêmesconclusions (Preece, 1984; Gilliver, 1988; Lauckner, 1989; Fielding, 1990).

Ce dont la recherche agronomique a le plus besoin

Un changement global influence actuellement la direction des recherchesmenées et la disponibilité des fonds pour la recherche. Les études qui étaientmenées jusqu'à présent dans des environnements contrôlés des stations sontmaintenant effectuées sur le terrain en milieu agricole pluridisciplinaire dansdes communautés locales. Une étude typique de système en milieu paysanintègre en même temps cultures, arbres, animaux, poissons, sols, insectes,climat et facteur humain, ainsi que les interactions et variabilités dansl'espace et le temps. Le chercheur et le biométricien doivent être largementdes généralistes, ils doivent comprendre plusieurs disciplines et planifier desprojets pluridisciplinaires avec une vision à long terme (Riley, 1992). Il fautaccepter de lourds investissements qui ne peuvent pas apporter rapidementdes résultats.

Les implications pour la planification des études et pour le recueildes données sont immenses! Les données sont générées par un ensembled 'acteu rs en interactions : chercheu l'S, agriculteurs, agents de développement, familles, institutions agricoles, gouvernements locaux. Les types dedonnées sont très différents: "quantitatives" pour les chercheurs, "qualitatives" pour les agriculteurs et les familles, "économiques" pour les institutions agricoles et les gouvernements. Les types d'analyses correspondantsvarient beaucoup. Pour chaque type de données il est important de choisirle type approprié d'analyse afin d'obtenir des recommandations pertinentes.Les bases de données sont très grandes, rendant indispensable l'usage desordinateurs et des logiciels. Les expériences et enquêtes sont par conséquentplus complexes qu'auparavant, la variabilité est grande et d'origine multiple. De plus en plus les biométriciens doivent être les intermédiaires entretous les acteurs pour garantir la qualité des plans, des bases de données etdes analyses appropriées (Malinvaud, 1997).

7

Il est aussi nécessaire de bien évaluer l'impact des interventions surles systèmes d'agriculture traditionnels pour chaque agent de la chaîneChercheurs-Communautés. Le choix des indicateurs utilisés pour évaluerl'impact des changements apportés à de tels systèmes ,in s'Ït'll est rattachéau type de données et à l'échelle de mesure. Les analyses d'échantillons desol collectés à la ferme ne correspondent pas au cumul de données telles queles moyennes faites au niveau de la région. Il est nécessaire de définir unestratégie pour permettre l'analyse et l'ajustement des effets d'accumulationau niveau des analyses statistiques multivariées (Steel and Holt, 1996).

Les propriétés statistiques les plus saillantes

Les plans et les analyses traditionnels ne sont pas encore suffisants dansce nouveau régime d'expérimentation. Des plans plus flexibles et des analyses plus avancées sont nécessaires. Quels types de plans? Et quelstypes d'analyses sont les plus utiles? Ils dépendent de l'environnement etdes buts de l'étude. Les études environnementales ont plusieurs propriétéssaillantes:

1. Les essais ne sont plus équilibrés; ils correspondent plus à des sondages, en particulier "multivariables" et "multipopulations" (il y a parexemple des sondages périodiques, des sondages multidomaines, dessondages multinationaux... ). On ne fait plus d'essais courts et équilibrés avec les plans et analyses bien documentés. Il est nécessaired'utiliser les méthodes de sondage et d'aborder les problèmes de planification et d'analyse. Kish (1994) propose deux stratégies pour lesprotocoles de sondages afin d'éviter l'exploitation post hoc ou ad hocdes résultats. Il souligne surtout l'importance et la difficulté de miseen oeuvre d'une standardisation des définitions, des méthodes et desmesures qui sont essentielles pour éviter les biais de comparaisons.De la sou plesse dans le plan d'échantillonnage et dans la taille deséchantillons est par contre importante pour réduire les variances etles coûts.

2. Les données doivent être collectées avec beaucoup de précision. Lescollectes ne sont pas réalisées par les mêmes personnes, ce qui conduità des fautes et des biais fréquents. Il faut former les sondeurs des paysmoins développés à la pratique de la collecte des données (Kish, 1996).

3. Les bases de données sont très grandes et leur création req uiert beaucoup d'habileté. Ainsi, leur utilisation doit se faire avec le plus grandsoin pour des modèles de systèmes multidisciplinaires afin d'éviter les

8

biais et de choisir l'approche la plus efficace (Gaunt, Riley, Stein and

Penning de Vries, 1997).

4. Les méthodes statistiques pour l'évaluation des composantes des projets pluridisciplinaires et celle de leurs interactions sont nombreuses.Les essais en milieu paysan ont souvent des caractères spéciaux quiobligent à aller au-delà des techniques habituelles d'analyse de la variance et à recourir à d'autres méthodes (et ce d'autant plus que lesdonnées ne sont généralement pas distribuées selon des lois normales).L'expérience de l'auteur porte ainsi sur des sujets aussi divers que ladétermination des tailles d'échantillons pour les essais agroforestiersau Brésil (Riley and Smyth, 1993), l'évaluation des plans en cross-overpour les essais aquaculturaux au Bangladesh et en Thaïlande (Smart,Riley and Haylor, 1997), les formations aux méthodes de statistiquesen milieu paysan au Vietnam (Riley and Alexander, 1997), la détermination des tailles des parcelles en terrasses au Népal (Poultney, Rileyand Webster, 1997), les méthodes d'enquête en Colombie, et la planification des essais en milieu paysan en Afrique de l'Est. Dans tous cesexemples, des méthodes récentes ont été utilisées, impliquant l'usagede logiciels permettant de tirer profit des progrès réalisés dans les domaines de l'analyse spatiale, de la géostatistique, de la simulation, del'analyse de séries chronologiques, des modèles linéaires généralisés,de la méthode de maximum de vraisemblance résiduelle, des mesuresrépétées, des méthodes multivariées ...

Les données se présentent souvent comme les préférences et opinionsdes fermiers sous la forme d'un classement par rangs (Chambers,1988) ou d'un classement ordonné par catégories (Sperling and Loevinsohn, 1993 ; Sperling, Loevinsohn and Ntabomvura, 1993). Lestests non paramétriq ues ou les modèles linéaires généralisés sont nécessaires. Les taux de mortalité causée par de grandes applicationsd'insecticide ont été modélisés par régression des indices ainsi quepar des méthodes non-paramétriques (Loevinsohn, 1987).

·5. Le choix d'indicateurs pour chaque composante est crucial et l'influence du cumul de données sur leur signification peut être déterminante.Chaque composante d'un système multidisciplinaire réunit un grandnombre de variables ou indicateurs ainsi que de multiples possibilitésde combinaisons sous forme d'indices. Le choix des indicateurs, enparticulier quant à leur pérennité, est essentiel pour évaluer l'impactdes changerpents apportés à de tels systèmes in s'it'u. Riley et Alexander (1998) présentent un résumé d'indicateurs qui ont été utilisés dansla littérature multidisciplinaire. Fergany (1994) et Cox et al. (1992)

9

discutent les tentatives de mesure du concept complexe de la qualitéde la vie en mettant l'accent sur la combinaison des aspects "objectifs" et "subjectifs". Fergany conclut que les méthodes multivariéessont utiles pour parvenir à une construction analytique fondée sur ungrand nombre d'indicateurs. Cox et al. concluent que les systèmes depoids utilisés dans la littérature donnent des résultats peu robusteset peu interprétables d'un point de vue biologique. Ils recommandentl'utilisation d'indicateurs simples, composante par composante, a,vecdes analyses d'incertitude et de sensibilité, et de ne pas utiliser unseul indice pour l'ensemble de l'étude.

L'échelle de mesure a une grande influence sur les résultats et lesrecommandations d'une analyse. Les analyses fondées sur les moyennes au niveau de la région donnent des conclusions très différentes decelles obtenues par une analyse des données au niveau de l'unité (Steeland Holt, 1996). Il est important de déterminer l'échelle de mesureet les propriétés des indicateurs de chaque composante du systèmeavant de collecter des données (Riley, 1997a).

Le réseau UNIQUAIMS (Riley, 1997b) a ainsi été établi pour discuter tousces problèmes et formuler des recommandations pour une meilleure construction des indicateurs et indices pour les systèmes complexes.

Les besoins statistiques des Pays en Voie de Développement

Quelles conclusions tirer de ce qui précède pour les biométriciens et leschercheurs des pays en voie de développement? Les méthodes statistiquesnécessaires à l'analyse de telles études de système ne sont pas enseignées

clans les programmes nationaux d'éducation, ce qui résulte en des projetsde recherche mal conçus et des analyses biométriques incomplètes ou mêmejamais entamées. Il y a eu des suggestions pour améliorer cette situation,mais sans grand succès. L'article de Hogg et Hogg (1995) porte sur la nécessité d'améliorer sans cesse la qualité de l'enseignement supérieur, sur le rôledes professeurs de statistique dans l'évolution de l'enseignement supérieur,sur certaines stratégies et techniques utilisées par les collèges et les universités pour la gestion de la qualité totale aux niveaux de l'établissementet des départements. Moriguti (1992) estime que les statisticiens, partoutdans le monde, doivent relever un sérieux défi: à moins que leur rôle etleur importance ne soit convenablement reconnus, ils ne pourront remplircorrectement leurs fonctions, tels que l'exigent les problèmes économiques,sociaux et scientifiques du monde d'aujourd'hui.

Les sociétés professionnelles ont eu de bonnes initiatives dans certains

10

pays, mais l'effet n'est ni grand ni durable. Il y a grand besoin d'un effortde tous les professeurs, chercheurs, statisticiens et bailleurs de fonds despays dévéloppés pour améliorer la formatiüIi statistique dans les pays envoie de développement. Pour y parvenir, il faut renouveler les livres, laformation, et il est nécessaire d'inclure les méthodes de consultation et decollecte de données de façon pratique et sans théorie. Il y a un grand besoind'ordinateurs et tout particulièrement de logiciels et de formation. Maissurtout, il y a grand besoin d'une action concertée de tous ces acteurs; enrestant isolées, ces actions ne pourront pas conduire aux résultats espérés.

Remerciements

Je remercie le comité chargé de l'organisation des Journées Statistiquesde m'avoir invitée pour présenter cet exposé. IACR-Rothamsted reçoit desfonds du BBSRC (Biotechnology and Biological Sciences Research Councilof the United Kingdom)

Références bibliographiques

Chambers, R (1988) Direct matrix ranking III henya and West Bengal. RRANotes, l, 13-16.

Cox, D, Fitzpatrick, R, Fletcher, AE, Gore, SI\'I, Spiegelhalter, DJ and Jones, DR(1992) Quality of life assessment: can we keep it simple? (with discussion)Journal of the Royal Statistical Society, A, :353-394.

Fergany, N (1994) Quality of life indices for Arab countries III an internationalcontext. International Statistical Review, 62, 18ï-201.

Fielding, WJ (1990) A review of experimental design in a developing country - acase study from Jamaica. Field Crops Research, 24, 241-250.

Gaunt, J, Riley, J, Stein, A and Penning de Vries, F W T (199ï) Requirementsfor effective modelling strategies. Agricultural Systems, 54, 153-168.

Gilliver, B (1988) Biometrical needs in developing countries. Views from an international agricultural research institute. Proceedings of the XIVth International Biometries Conference, Namur, Belgium, p.llO.

Hogg, RV and Hogg, MC (1995) Continuous quality improvement in higher education. International Statistical Review, 6:3, 35-4ï.

Kish, L (1994) Multipopulation survey designs: five types with seven shared aspects. International Statistical Review, 62, 167-186.

Kish, L (1996) Developing samplers for developing countries. International Statistica! Review, 64, 143-162.

11

Lauckner, FB (1989) A survey of the use of statistics 111 agricultural researchjournals. Tropical Agriculture (Trinidad), 66, 2-7.

Loevinsohn, l'vIE (1987) Insecticide use and increased mortality in rural CentralLuzon, Philippines. The Lancet, June 13, 1359-1362.

Malinvaud, E (1997) Effet des évolutions techniques et des changements de la spécialisation internationale sur les marchés du travail et les systèmes productifs: comment les statisticiens pourraient-ils relever les défis? InternationalStatistical Review, 65, 97- 109.

IVIoriguti, S (1992) The rôle of statisticians. International Statistical Review, 60,227-245.

Poultney, R, Riley, J and Webster, R (1997) Optimizing plot size for field experiments on terraces. Experimental Agriculture, 33, 51-64.

Preece, DA (1984) Biometry in the Third World: science not ritual. Biometries,40,519-523.

Riley, J (1992) Biometrical perspectives ullder global change. ln Proceedings ofthe XVlth International Biometrie Conference, Hamilton, New Zealand, 711 December, 1992, 111-122.

Riley, J (1996) Strengthening Biometry and Statistics in Agricultural Research.Summary Report of aCTA Workshop, University of Hohenheim, Germany,October 1996.

Riley, J (1997a) Impact assessment for participatory research. In Proceedings ofa Workshop on Integrated Farming in Human Development (eds F Dolbergand PH Petersen) Tune Landboskole, Denmark, March 2.5-29, 1996. DallishDevelopment Advisers' Forum, Copenhagen.

Riley, J (1997b) UNIQUAIMS - Unification ofIndicator Quality for the Assessmentof Impact of Multidisciplinary Systems. A Concerted Action funded by theINCO-DC programme of the European Union. Harpenden, RothamstedExperimental Station.

Riley J and Alexander, CJ (1998) Guidelines for an assessment methodology for theoptimum uptake of research. Journal of Sustainable Agriculture. Acceptedfor publication.

Riley, J and Alexander, CJ (1997) Statisticalliterature for participatory on-farmresearcl1. Experimental Agriculture, 33, 73-82.

Riley, J and Smyth, S (1993) A study of alley-cropping data from Northern Brazil.1. Distributional properties. Agroforestry Systems, 22, 241-258.

Smart, TS, Riley, J and Haylor, G (1997) Eliminating pond differences \Vith crossover designs. Aquaculture Research, 28, 621-627.

12

Sperling, Land Loevinsohn, ME (1993) The dynamics of adoption: Distributionand mortality of bean varieties among small farmers in Rwanda. Agricultural Systems, 41, 441-453.

Speriing, L, Loevinsohn, IvIE and Ntabomvura, B (1993) Rethinking the farmer'srôle in plant breeding: local bean experts and on-station selection in Rwanda. Experimental Agriculture, 29,509-519.

Steel, D Gand Holt, D (1996) Analysing and adjusting aggregation effects: the

ecological fallacy revisited. International Statistical Review, 64, 39-60.

13

14

Quelques perspectives relatives à la bionlétrie

pays en voie de développenlentet pays dév~loppés

Pierre Dagnelie G

Résumé

Cette note présente, d'une part, une \'\SIon quantitative, et d'autrepart, une vision qualitative de la biométrie, en mettant l'accent sur lesspécificités des pays en voie de développement, par comparaison avec lespays développés.

La première partie est basée sur une analyse des listes de membres dela Société internationale de Biométrie. Elle met en évidence un certainredressement de la situation des pays en voie de développement, depuis1982, mais elle souligne aussi l'importance du fossé qui sépare toujours cespays des pays développés.

La deuxième partie esquisse quelques perspectives d'avenir de la biométrie et identifie certains dangers potentiels et différents défis, qui devraientretenir l'attention de tous les biométriciens, tant dans les pays en voie dedéveloppement que dans les pays développés.

Summary

This note gives, on one side, a quantitative v'Ïs'Ïon., and on the other S'ide,a qualitative V1:s'Ïon of biometry, stressing the particularities of developing

countries, compaT'ed to developed countries.

The first part is based on an analysis of the directories of the International BiO'Tnet7'ic Society. It reveals sorne improvement of the situation of

GFaculté universitaire des Sciences agronomiques, B-.5030 Gembloux (Belgique),cl agnelie. p@fsa~gx.ac.be

15

developing countries, since 1982, but it also stresses the magnitude of thestill existing gap between developing and developed countries.

The second part sketches some future prospects of biometry and identifies some dangers and challenges, that should be consùlered by ail biometricians, both in developing and developed countries.

1. Introduction

Cette note réunit les textes de cleux exposés présentés, l'un à Carcassonne (France) et l'autre à Québec (Canada), au cours des Journées deStatistique organisées par l'Association pou r la Statistiq ue et ses Utilisations (ABU), et plus particulièrement dans le cacl re des séances de travailde la Société française de Biométrie.

La première partie (paragraphe 2) donne une image quantitative de labiométrie, basée sur une analyse cles listes de membres de la Société internationale de Biométrie l

. La deuxième partie (paragraphe :3) présenteune image qualitative de la biométrie, fondée sur une analyse de quelquestendances récentes, qui apparaissent notamment dans la littérature statistique et biométrique des dernières années". L'ensemble est suivi de quelquescommentaires et conclusions (paragraphe 4).

2. Une VISIOn quantitative de la biométrie

2.1. Méthode

La Société internationale de Biométrie publie des listes de membres(Directories) à des intervalles de trois à sept ans (1949, 19.53, 1957, 1962,1965, 1968, 1971, 1975, 1982, 1986, 1990 et 1996). Nous avons dénombréles membres énumérés clans ces listes, en considérant six groupes de pays,à savoir:

Amérique 1 (((f\m.1))) : Canada et Etats-Unis d'Amérique;

[Cette première partie est une version quelque peu modifiée du texte publiédans les comptes rendus des Journées de Statistique de Carcassonne [Dagnelie,1997]. Elle constitue, à quinze ans d'intervalle, une mise àjour d'une communication faite au cours de la llème Conférence internationale de Biométrie, qui s'esttenue à Toulouse en 1982 [Dagnelie, 1982]. Comme autres références relatives aumême sujet, on peut citer Dagnelie [1983, 1984] et Riley [1992].

"Seul un bref résumé de cette deuxième partie a été publié dans les comptesrendus des Journées de Statistique de Québec [Dagnelie, 1996a]. On trouvera aussides idées semblables et connexes dans d'autres publications récentes [Dagnelie,1994, 1995, 1996b].

16

Europe ((Eul'.}}), y compris la partie européenne de l'(ex-)U.R.S.S. ;

Asie-Océanie 1 ((A.O.1}}) : Australie, Japon èt Nouvelle-Zélande i

A mériq ue 2 (((.l\m.2}}) : autres pays d'Amériq ue ;

Afrique (((f\fl'.}}) ;

Asie-Océanie 2 ((A.O.2}}) : autres pays d'Asie et Océanie.

Les trois premiers groupes sont considérés ici comme constituant l'ensembledes « pays développés)}, et les trois derniers comme l'ensemble des « pays en

voie de développement)}.

Nous n'avons toutefois pas pu trouver d'exemplaire de la liste des mem

bres de 1962. De plus, nous avons écarté les observations relatives à1949, la Biometrie Society, fondée en 1947 à \Vashington, étant à ce mo

ment très largement américaine. Notre analyse porte donc sur dix séries

d'observations, à concurrence de deux séries par décennie, depuis 1950.

D'autre part, nous avons recherché les effectifs des populations des

mêmes groupes de pa.ys, aux différentes da.tes considérées, en consultant

les Annuaires statistiques des Nations unies. Et nous avons calculé les rap

ports « nombres de membres / populations)}, en les exprimant en nombres

de membres par million d'habitants.

Enfin, nous avons aussi exprimé les nombres de membres de la So

ciété internationale de Biométrie par million d'habitants en proportion des

moyen nes mond iales, en défi nissan t ainsi des q uotien ts com parables aux« rapports de chances)} ou « rapports de risques)} (odd-mtios) , utilisés no

tamment en épidémiologie.

2.2. Résultats

Les nombres de membres par million d'habitants sont présentés dans le

tableau et la figure 1, l'échelle des ordonnées de la figure étant une échelle

logarith miq ue. Les valeu rs relatives aux grou pes « Eur.)} et « A.O.l)} étant

très semblables, ces deux groupes sont représentés dans la figure par une

seule ligne, moyenne, afi n d 'évi ter tou te confusion.

Les nombres de membres par million d'habitants exprimés en proportion

des moyennes mondiales sont présentés, eux, dans le tableau et la figure2, les trois dernières colonnes du tableau donnant les inverses des valeurs

inférieures à 1. Comme pour la figure 1, l'échelle des ordonnées de la figure2 est une échelle logarithmique, et les groupes «Eul'.)} et «A.O.l)} y sont

représentés par une seule ligne.

17

Tableau et figure 1. Nombres de membres de la Société

internationale de Biométrie par million d'habitants.

Ann. Am.1 Eur. A.O.1 Am.2 Afr. A.O.2 l\'londe

1953 3,4 0,69 0,84 0,22 0,071 0,018 0,431957 3,3 0,95 1,2 0,48 0,098 0,018 0,51

1965 6,6 1,6 1,5 0,33 0,046 0,029 0,821968 7,2 1,7 1,6 0,41 0,083 0,035 0,86

1971 7,4 1,7 1,5 0,52 0,062 0,0:33 0,861975 8,9 2,0 1,9 0,50 0,051 0,027 0,97

1982 13 2,7 3,4 0,99 0,059 0,025 1,331986 12 3,1 3,1 0,67 0,088 0,043 1,25

1990 12 3,3 2,9 0,45 0,16 0,064 1,231996 9,1 3,6 3,0 0,.53 0,21 0,052 1,09

10

0,1

0,01

2.3. Discussion

1950 1960 1970 1980 1990 2000

Am.1

Eur.-A.O.1

Am.2

AIr.

A.O.2

Bien sûr, les résultats obtenus de cette manière sont très sommaires,et ne sont pas dépourvus de distorsions, parfois importantes. Ainsi, lesvaleurs calculées pour l'ensemble du continent européen sont nécessairementdes moyennes, relatives à des situations parfois très différentes d'un paysà l'autre, notamment d'ouest en est, des Iles britanniques à l'Oural. Demême, il est évident que la Chine, encore peu ouverte à tout ce qui est- ou peut être considéré comme étant - d'origine américaine, influencede façon considérable les informations relatives au groupe (( Asie-Océanie2)). Des analyses plus fines pourraient être réalisées, mais déjà les chiffresglobaux suggèrent un certain nombre d'observations et de commentairesin té ressan ts.

18

Tableau et figure 2. Nomb1'es de membres de la Société internationale de

Biométrie par million d'habitants en proportion des moyennes mondiales.

Proport. inverses

Ann. Am.1 Eur. A.O.1 Am.2 Afr. A.O.2 Am.2 Afr. A.O.2

1953 7,9 1,6 1,9 0,51 0,16 0,041 1,9 6,1 241957 6,5 1,9 2,4 0,9.5 0,19 0,036 1,1 .5,2 28

1965 8,0 2,0 1,8 0,41 0,0.57 0,035 2,4 18 281968 8,3 2,0 1,8 0,48 0,097 0,041 2,1 10 25

1971 8,6 2,0 1,8 0,61 0,071 0,038 1,6 14 261975 9,2 2,0 1,9 0,.51 0,052 0,028 2,0 19 36

1982 9,7 2,0 2,6 0,74 0,045 0,019 1,:3 22 531986 9,3 2,5 2,5 0,53 0,070 0,034 1,9 14 29

1990 9,3 2,7 2,4 0,3ï 0,13 0,0.52 2,7 ï,7 191996 8,3 3,3 2,8 0,49 0,19 0,04ï 2,1 5,3 21

10 -~~--I-----'- ••• -~--- Am.1

Eur.-A.O.1

0,1

0,01

Am.2

Afr.

AO.2

1950 1960 1970 1980 1990 2000

En 1982 et 1984, nous concluions notre travail en affirmant que le

développement de la biom.ét1'ie au cours des derniè1'es décennies s'est faitessentiellement sans le Tiers Monde, et que le retard des pays en voie de

développement par rapport aux pays développés, loin de se résor'ber, ne faitsans doute que s'accentuer. Que faut-il en penser quinze ans plus tard?

Les nombres de membres et les chiffres de populations, qui ne sont

pas présentés explicitement ici, montrent que la part des pays en voie dedéveloppement au sein de la Société internationale de Biométrie a quelque

peu augmenté durant les dernières années, en restant cependant toujoursinférieure à 10 %, alors que la population de ces pays représente environ

80 % de la population mondiale. De plus, des fluctuations irrégulières im

portantes apparaissent en ce qui concerne le nombre de membres du groupe

19

(( Amérique 2)). Ces fluctuations résultent dans une large mesure de varia

tions anormales du nombre de membres brésiliens, dues vraisemblablementau mode de comptabilisation de ces membres. Ce fait nous amène d'ailleursà exclure le Brésil de certaines des comparaisons suivantes.

En ce qui concerne les nombres de membres par million d'habitants(tableau 1), si on concentre J'attention sur les années 1982 à 1996, on peutobserver un certain redressement. Pour cette période en effet, on constateune réduction des nombres de membres par million d'habitants dans lesgroupes (( Amérique 1)) et (( Asie-Océanie 1)) (respectivement de l'ordre de2 % et 1 % par an), et une augmentation pl us ou moi ns im portan te dans lesquatre autres groupes de pays, en excluant le Brésil du groupe (( Amérique2)) (environ 2 % par an pour l'Europe et le groupe ((Amérique 2)), .s % paran pour le groupe (( Asie-Océanie 2)), et 10 % par an pour l'Afrique).

Il n'en reste pas moins que des disparités consid érables su bsisten t toujours (tableau et figure 2). En 1996, la moyenne du groupe (( Amérique 1))

est toujours huit fois supérieure à la moyenne mondiale, la moyenne européenne et celle du groupe (( Asie-Océanie 1)) sont trois fois supérieures àla moyenne mondiale, la moyenne du groupe ((Amérique 2)) est deux fois inférieure à la moyenne mondiale, la moyenne africaine est cinq fois inférieureà, la moyenne mondiale, et la moyenne du groupe (( Asie-Océanie 2)) est environ vingt fois inférieure à la moyenne mondiale. Ma.is le redressement del'Afrique, et dans une moindre mesure du groupe (( Asie-Océanie 2)), est iciégalement bien apparent. En outre, un tel redressement apparaît aussi ence qui concerne le groupe (( Amérique 2)), si on en écarte le Brésil.

On peut bien sûr s'interroger sur l'origine d'une telle évolution. Deuxfacteurs au moins nous semblent devoir être cités. Le premier est l'augmentation des effectifs du personnel de cadre, scientifique notamment, dans lespays en voie de développement, au cours des quinze ou vingt dernièresannées. Le deuxième est la politique qui a été adoptée par la Société internationale de Biométrie, notamment par des réductions des montants descotisations, par des aides au paiement des cotisations, et par la constitution de réseaux régionaux, tout d'abord en Asie (1987), puis en Afrique(1990) et en Amérique latine (1992). Si le premier de ces réseaux est assezrapidement tombé en léthargie, les deux derniers sont toujours très actifset constituent des pôles de développement importants.

20

3. Une vision qualitative de la biométrie

3.1. Evolution récente

Indépendamment des aspects quantitatifs que nous venons d'évoquer,deux éléments nous semblent avoir in11uencé tout particulièrement J'évolution de la biométrie au cours des dernières décennies: d'une part, l'appari tion de l'ordinateu r et le développemen t fulgu ran t de l'informatiq ue, etd'autre part, l'évolution générale des sciences.

Dès la fin des années 50, et surtout pendant les années 60 et 70, l'ordinateur a permis tou t d'abord une meilleu re et une plus large utilisationdes méthodes statistiques classiques (analyse de la variance, régressionsimple et multiple, analyse à plusieurs variables, etc.), puis de nouveauxprolongements théoriques et pratiques de ces méthodes, et puis encorele développement de méthodes nouvelles (méthodes de rééchantillonnage,méthodes robustes, etc.). Depuis les années 70 et 80, la micro-informatique et 1'appari tion de logiciels toujou rs plus di versifiés, plus pu issan ts etplus conviviaux ont mis progressivement l'ensemble des méthodes quantitatives à la disposition de tous les utilisateurs potentiels. A cela se sontajoutées, plus récemment encore, les possibilités qu'offrent les réseaux detransmission de l'infonùation.

Parallèlement à ces développements technologiques, les sciences ont connu une expansion et une diversification considérables, en relation notamment avec l'augmentation du nombre de chercheurs, dans de très nombreuxpays. Cette expansion et cette diversification, associées à J'évolution desmoyens informatiques, ont induit un accroissement important du champd'application des méthodes quantitatives en biologie, au sens large, et corrélativement, de ces méthodes elles-mêmes.

Deux domaines particuliers peuvent en témoigner. D'une part, les aspects agronomiques de la biométrie, qui ont été à l'origine de très nombreuses méthodes statistiques durant la première moitié du vingtième siècle,ont connu au cours des dernières décennies, à la fois, des développementsnouveaux de thèmes anciens et des applications nouvelles [de Turckheim,1995]. On peut citer notamment les problèmes d'expérimentation, la génétique, la biologie moléculaire, les phénomènes spatiaux et spatio-temporels,et l'étude de la qualité des produits agricoles. De même, en ce qui concernele secteur médical, dont la place est devenue prépondérante en biométrieau cours des dernières années, on peut citer les essais cliniques, l'étude·desproblèmes de survie, l'épidémiologie et le diagnostic assisté par ordinateur[Armitage, 198.5, 1995]. Et d'autres secteurs, tel celui de l'environnement,

21

pourraient être évoqués.

3.2. Quelques perspectives

On peut raisonnablement penser que les tendances observées au coursdes dernières années resteront prédominantes à l'avenir. Rien ne sembledevoir arrêter en effet, à une échéance prévisible, le développement des

matériels informatiques, la diminution relative de leurs coùts, la mise aupoint de logiciels nouveaux, et l'expansion des réseaux de transmission dedonnées. On peut toutefois se poser la question de savoir si l'évolutiongénérale des sciences se poursuivra au même rythme que précédemment ousi, au contraire, des limitations ou des restrictions budgétaires pouraientêtre à l'origine d'un certain ralentissement, dans certains pays au moins.

Encore faut-il essayer de prévoir les conséquences d'une telle évolution.

En ce qui concerne les biométriciens tout d'abord, la diversification duchamp d'application des méthodes quantitatives et de ces méthodes ellesmêmes a et aura inévitablement pour conséquence une spécialisation accrue. Et cette spécialisation peut facilement devenir outrancière. D'autrepart, l'augmentation du nombre de chercheurs, observée dans le passé, etla réduction ou la limitation éventuelle des moyens financiers ne peuventqu'accentuer la compétition entre cherclIeurs, c'est-à-dire aussi la courseaux publications dans des revues scientifiques de haut niveau, elles-mêmesde plus en plus spécialisées. Cette compétition et cette course peuvent engendrer un désintérêt croissant du biométricien pour les applications concrètes et pour son rôle éventuel de consultant. Qu'il le veuille ou non, lechercheur-biométricien sera tenté - ou de plus en plus tenté - de ne pas« perdre son temps)) à aider ses collègues d'autres disciplines.

En ce qui concerne les utilisateurs des méthodes quantitatives d'autrepart, la volonté naturelle d'indépendance des uns et des autres, le développement des moyens informatiques, le désintérêt possible des biométricienspour les applications, tous ces éléments peuvent contribuer à développerde plus en plus le travail individuel de personnes qui ne sont pas toujours conscientes des contraintes des méthodes mises à leur disposition, enmatière de conditions d'application par exemple.

3.3. Quelques dangers potentiels

Plusieurs dangers majeurs nous semblent pouvOIr découler de cetteévolution.

22

Le manque d'intérêt des biométriciens pour les applications peut avoirpour conséquence que l'enseignement des méthodes quantitatives soit progressivement confié à des personnes non spécialisées et souvent peu qualifiées, cet enseignement risquant alors de devenir très rapidement un catalogue de commandes ou de procédures de l'un ou l'autre logiciel, sans aucune référence à quelque concept de base que ce soit.

NIais on peut aller plus loin. Si les biométriciens n'accordent plus à leurscollègues l'aide que ceux-ci en attendent, s'ils se consacrent essentiellement- pour ne pas dire exclusivement - à l'élaboration de méthodes nouvelles, publiées dans des revues difficilement accessibles aux non-initiés, ilspourraient être rapidement considérés comme inutiles, et licenciés ou nonremplacés à la première occasion.

Ceci peut paraître une vue de l'esprit, tout à fait outrancière, mais il

n'en est rien. Dans un numéro relativement récent de Amstat News, Jeprésident de l'A merican Statisticai Association pu blie une liste de départements de statistique qui ont été supprimés ou réduits de façon drastique,tant dans des universités que dans des entreprises américaines [Iman, 1994].D'autres auteurs ont des vues concordantes [Bailar, 199.5; Brailsford, 1990;Sandland, 1988], et des exemples similaires pourraient être cités en Europeégalement.

D'autre part, en ce qui concerne les utilisateurs des méthodes quantitatives, le recours à des moyens informatiques extrêmement performants,mais souvent mal maîtrisés, et le travail strictement individuel peuvent conduire, et conduisent déjà souvent, à des erreurs importantes. Il nous estarrivé, au cours des dernières années, d'observer des (( hérésies)} que nousn'avions jamais vues auparavant et que nous n'aurions jamais pu imaginer. Des exem pIes d '(( horreurs)} ((( anarchies and hor1'Ors}}), ainsi que desréférences relatives à ce sujet, sont donnés notamment par Finney [199.5].

3.4. Différents défis

Dans ces conditions, les défis ne manquent pas.

Le premier, et sans doute le plus important, car il conditionne dansune large mesure tous les autres, est d'assurer en biométrie un équilibreraisonnable entre la théorie et les aplications, entre la recherche personnelle et la consultation ou la collaboration. Ce défi est de la responsabilitéexclusive des biométriciens. Il concerne en particulier les enseignants et lesresponsables de départements, qui peuvent orienter les préoccupations etles activités de leurs étudiants et de leurs jeunes collaborateurs. Il concerneaussi les responsables des sociétés scientifiques et des revues, qui peuvent

23

orienter le programme de leurs manifestations (congrès, conférences, etc.)et le conten u des pu blications.

Un deuxième défi est de faire mieux connaître la biométrie et son rôleen dehors des milieux spécialisés, et tout particulièrement auprès des hautsresponsables des universités, des centres de recherche, et des organismesqui su bventionnent l'enseignement et la recherche. Et, par (( faire connaîtrela biométrie et son rôle)), il faut penser surtout à faire connaître le rôlepratique de la biométrie et son impact sur la qualité, et éventuellement, surle coût de la recherche, dans ses différents domaines d'application. Commele précédent, ce défi est celui des biométriciens eux-mêmes, mais ici quelque soit leur niveau de qualification et de responsabilité.

Le troisième défi, qui découle des deux précédents, est de valoriser letravail du biométricien-consultant, en ne considérant pas ce travail commeétant de second rang, et le statut du biométricien-consultant comme un(( sous-statu t)), inférieu l' à cel ui des (( vrais chercheu rs)) [Tranchefort, 199.5].C'est un défi pour les biométriciens eux-mêmes, et surtout, pour les responsables des institu tions d'enseignement et de recherche.

Un autre défi encore, qui concerne directement les biométriciens, estcelui de la formation: formation des futurs et des jeunes biométriciens,qui doit être suffisamment orientée vers les applications et vers la collaboration, et formation des non-biométriciens, qui de plus en plus, l'évolutionde l'informatique se poursuivant, devra être repensée sous l'angle de laformation continue [Dagnelie, 1996b].

Et la liste n'est pas close. Le travail individuel, isolé, d'utilisateurs desméthodes quantitatives peu compétents dans ce domaine risque d'induire ladiffusion et la publication de résultats de recherche mal argumentés, voireerronés: Il est de la responsabilité des jurys des mémoires de fin d'études etdes thèses de doctorat, des jurys des concours de recrutement et de promotion, des comités et des conseils qui supervisent les activités de recherche,et des comités de lecture des revues scientifiques, de toujours vérifier laqualité du travail éventuel de planification d'enquêtes ou d'expériences etd'analyse des résultats - ou de mettre en place des structures qui peuvent effectuer une telle vérification. Des procédures de contrôle de cetype ((( reJereeing)) statistique) existent pour nombre de revues médicales[Altman, 1991; George, 198.5], mais les autres secteurs d'application desméthodes q uantitatives en biologie en sont quasi dépourv us [Lauckner,1989].

Un autre point encore dont les biométriciens doivent être conscientsconcerne la sauvegarde des résultats de recherche. Les tendances individualistes et la micro-informatique amènent nombre de chercheurs à tra-

24

vailler sur leur propre ordinateur, éventuellement portable, voire même àdomicile, au moins dans une certaine mesure. Or dans bien des cas, notamment en matière de recherche sous contrat, les chercheurs changentfréquemment d'emplois. On peut craindre que, dans ces conditions, certaines institutions ou certains départements de recherche soient progressivement dépossédés d'une part non négligeable de leur capital de données,capital dont la pérennité était assurée antérieurement par des centres decalcul ou des ordinateurs d'usage commun. Même si ce problème n'est pasde leur responsabilité, des initiatives pourraient être prises à ce sujet parles biométriciens.

3.5. Les pays en voie de développement

On pourrait penser que les réflexions formulées ci-dessus ne concernent que les pays développés, dans la mesure notamment où les exemplesévoqués et les références citées ont trait essentiellement à ces pays. Il n'enest rien cependant, car un bon nombre des tendances que nous avons esquissées s'appliquent aussi bien, et parfois même plus, aux pays en voie dedéveloppement qu'aux pays développés.

Ainsi, l'évolution des moyens informatiques et l'extension du champd'application des méthodes sta.tistiques et biométriques sont des tendancestout à fait générales. L'extension du champ d'application des méthodesstatistiques et biométriques est même plus prononcée encore, dans le domaine agronomique par exemple, pour les pays du tiers monde, du fait dela beaucoup plus grande diversité des cultures et des systèmes de culturequi y sont pratiqués.

De même, le risque de désintérêt des biométriciens pour les applicationsest non seulement réel parfois dans les pays en voie de développement,mais il peut même y être sensiblement accentué, en raison du plus grandisolement des biométriciens, beaucoup moins nombreux et disposant debeaucoup moins de documentation, et du fait de la plus grande diversité desproblèmes rencontrés, ces deux facteurs rendant la consultation statistiquesensi blemen t pl us difficile.

De même encore, les besoins de formation, et en particulier de formationcontinue, et les problèmes de sa.uvegarde des résultats de recherche sont desquestions cruciales dans les pays du tiers monde.

2.5

4. Quelques commentaires et conclusions

Les deux aspects sous lesquels nous avons envisagé la situation et l'avenir de la biométrie, dans les pays développés et dans les pays en voie dedéveloppement, nous amènent à formuler un certain nombre de commentaires et de conclusions.

D'une part, sur le plan quantitatif, le chemin à parcourir, pour aboutirà un meilleur équilibre entre les différentes régions du monde, reste considérable. Loin de pouvoir être relachés, les efforts entrepris, notammentdans le cadre de la Société internationale cie Biométrie, doivent donc êtremaintenus, et même accentués dans toute la mesure du possible.

D'autre part, sur le plan qualitatif, si l'avenir de la biométrie est extrêmement riche de développements potentiels, cet avenir dépendra sansdoute très largement de la manière dont les biométriciens eux-mêmes feront face aux défis qui les attendent. A cet égard, nous voudrions insisterencore sur les deux premiers défis que nous avons cités, à savoir assurer ou rétablir - un équilibre raisonna.ble entre théorie et applications, et fairemieux connaître la biométrie et son rôle pratique en dehors des milieuxspécial isés.

Dans un cas comme clans. l'autre, il s'agit d'efforts à consentir par tous:chercheurs, enseignants et responsables académiques, des pays développéset des pays en voie de développement. Mais le rôle des (( responsables académiques)) (chefs de départements, directeurs de laboratoires, etc.), des paysdéveloppés surtout, nous paraît particulièrement important. C'est en effetde ces personnes que dépendent très largement, directement ou indirectement, les attributions de subventions, les reconnaissances de mérites et lespromotions des plus jeunes, les contenus des revues, les orientations prises par les sociétés scientifiques, les programmes des colloques, congrès etconférences, etc. Ce sont donc ces (( responsables académiques)) qui sontles mieux placés, à la fois, pour sensibiliser les plus jeunes (étudiants,chercheurs et jeunes enseignants) aux problèmes des pays en voie de développement, pour orienter dans une certaine mesure les activités des uns etdes autres dans cette direction, et d'une manière générale, pour amener lesuns et les autres à faire face aux défis que nous avons évoqués.


Altman D.G. [1991]. Statistics in medicaI journals : developments in the 1980s.Stat. Med. 10, 1897-1913.

Armitage P. [1985]. Biometry and medical statistics. Biometries 41 (4),823-833.

26

Armitage P. [1995). Before and after Bradford Hill: some trends III medicalstatistics. 1. R. Stat. Soc., Sel'. A, 158 (1), 143-153.

Bailar III J.C. [1995]. A larger perspective. Amer. Stat. 49 (1), 10-11.

Brailsford T.W. [1990]. The future of statistics in the next N years (25 < N <150). Amel'. Stat. 44 (2), 1:31.

Dagnelie P. [1982]. La biométrie dans les pays du Tiers f-'Ioncle. In : Actes de {allème Conférence internationale de Biométrie. Versailles, Institut nationalcie la Recherche agronomique, 177-182.

Dagnelie P. [1983). Biometry in the Third World. Tropicttltura 1 (4), 122-127.

Dagnelie P. [1984J. La situation de la biométrie dans les pays du Tiers Monde.Elom. Pm:L'im. 24 (1), 3-21.

Dagnelie P. [1994]. La consultation statistique: quelques réflexions. Biom. Praxim. 34 (2), 173-187.

Dagnelie P. [1995]. Statistique, biométrie, agronomie quelques perspectivesd'avenir. C. R. Acad. Agric. France 81 (8), 63-68.

Dagnelie P. [1996a]. L'avenir de la biométrie. In : Genest C., lVlassé J.C. (éd.).Recueil des résumés des communications des XXVIIIe Joumées de Statistique. Québec, Université Laval, 42.

Dagnelie P. [1996bJ. The teaching ofbiometry. In: Armitage P., David H.A. (ed.).Advanees in biometry : 50 years of the Intemationa{ Biometrie Society.New York, Wiley, 51-64.

Dagnelie P. [1997]. Une vision quantitative de la biométrie dans les pays endéveloppement. In : XXIXe Joumées de Statistique. Carcassonne, Institutuniversitaire de Technologie, 303-306.

de Turckheim E. [1995]. Orientation des recherches en biométrie dans une recherche agronomique d'ensemble. C. R. Acad. Agric. France 81 (8),41-50.

Finney D.J. [1995J. Statistical science and effective scientific communication. 1.Appl. Stat. 22 (2), 293-308.

George S.L. [1985]. Statistics in medical journals : a survey of current policies andproposais for editors. Med. Pedia17'. Gncol. 13, 109-112.

Iman R.L. [1994]. Statistics departments under siege. Amstat News, Aug.-Sept.,6-7.

Lauckner F .B. [1989J. Survey of the use of statistics in agricultural research journais. Trop. Agrie. 66 (1), 2-7.

27

Riley J. [1992]. Biometrical perspectives under global change. In: Proceedingsof invited papers. Hamilton, XVIth International Biometrie Conference,111-122.

Sandland R.L. [1988]. Biometry under threat the reorganisation of DMS III

CSIRO. Biam.. Bull. 5 (4), 32.

Tranchefort J. [1995]. Le métier de biométricien-consultant : illustration dans le

domaine de l'expérimentation. C. R. Acad. Agric. France 81 (8), 51-62.

28

Statistiques et systènle cl 'infornlation

Michel Passouant a

Dans le cadre d 'llne coopémtion avec la SAED1, financée par le Mùûs

tàe Fmnçais de la Coopémtion, lln système de sllivi-évalllation a été misen place afin de collecter, centrnliser, capitaliser, redistribller, des informations stat'istiqlles de sllivi dll développement des périmètres irrigllés dansle Delta du flellve Sénégal. Ce système, opémtionnel depuis 1991, (l étécomplété par une composante cartographiqlle depuis le mois de mars 1996.

Dans le domaine de l'agriculture, la statistique est bien souvent perçuecomme un ensemble de méthodes destinées à tester l'efficacité de nouvellestechniques. La statistique est vue ici comme outil destiné à produire del'information économique et sociale concernant le développement.

Selon cette optique, et paraphrasant une citation d'E. Malinvaud, nousdirons que le travail présenté ici a consisté à convertir en concepts quantifiés, et structurés en base de données, les préoccupations de divers servicesde la SAED, soucieux de suivre le développement agricole dans la vallée dufleuve Sénégal. Le résultat est un système d'information qui propose uncadre de référence cohérent dans lequel viennent s'intégrer les différentesdonnées statistiques du dispositif de suivi/évaluation et dont la base de données présentée ci-dessous ne constitue qu'un des éléments. L'informatique,par un système de gestion de base de données relationnelles, a permis detransformer ces concepts en outils.

La collecte et la gestion (informatisée) des données est effectuée ausein de la SAED. Le système produit des informations statistiques à divers niveaux de d'agrégation. Ces tableaux sont diffusés, selon leur niveaude détail, auprès des conseillers agricoles SAED (qui sont aussi les agentscollecteurs des données), les diverses structures SAED, les ministères detutelle, la caisse de crédit agricole ...

aCentre de coopération internationale en recherche agronomique pour ledéveloppement, Département des systèmes agro-alimentaires et ruraux, BP 5035,ï3 rue J.F. Breton, 34090 Montpellier Cedex l

ISAED : Société nationale d'aménagement et d'exploitation des terres du deltadu Sénégal et des vallées du neuve Sénégal et de la Falémé. BP ï4, Route de Khor,Saint-Louis, Sénégal

29

Les objectifs de la SAED

La SAED a pour mission la planification du développement régional et lacoordination du développement rural intégré sur la rive gauche de la valléedu fleuve Sénégal. Pour ce faire, elle doit disposer d'informations régulières,fiables et représentatives. Donc le souci de la maîtrise de l'information està l'origine de la démarche.

Dans les années 80, la SAED, par sa très forte présence sur le terrain,disposait d'une connaissance très précise et détaillée de sa zone d'intervention. Cependant, cette connaissance était essentiellement qualitative, hétérogène, parcellaire et dispersée, car détenue par chacun des agents de terrain. Dans le contexte de fort désengagement de l'état et de définition denouvelles lettres de missions pour la SAED, se traduisant par son retraitde ses activités productives et commerciales, le dispositif de terrain s'estconsidérablement allégé depuis 1990.

Dans ces conditions, la Direction de la Planification et du Développement Rural de la SAED a souhaité la construction d'un observatoire pourle suivi et l'évaluation du développement cie l'agriculture irriguée. Deuxgrandes composantes forment le système, l'une non abordée ici s'appuiesur la réalisation d'enquêtes représentatives auprès des principaux acteurséconomiques, l'autre, décrite ci-dessous, concerne la constitution d'une basede données de suivi des aménagements hydro-agricoles selon les trois objectifs suivants:

• Observer de manière exhaustive;

• Collecter, gérer et conserver l'information;

• Analyser et présenter les résultats.

La zone géographique couverte concerne la rive gauche du fleuve Sénégal,et comporte, en 1996, 70 000 ha irrigués environ, dont 29 822 ha cultivés.Le nombre d'organisations paysannes, pour cette même année, est de 2 432.

Organisation d li système d'information

La conception du système est réalisée à partir de la construction d'unmodèle conceptuel de données de la forme entité / association bâti selon laméthode MERISE. En plus de types de variables habituellement utilisés eninformatique, des types plus spécifiquement statistiques ont été nécessairestels que la notion de variable qualitative, avec sa nomenclature associée.

30

Modèle de données

La première étape d'analyse a permis d'identifier l'intégralité des unitésstatistiques porteuses d'informations, de les regrouper en populations ouentités pour lesquelles une définition précise a été établie. La deuxièmeétape a recensé les informations nécessaires à la description de ces unitésstatistiques, et débouché sur le dictionnaire des données, comportant description précise des variables sur le plan sémantique et informatique (type,longueurs, contraintes de valeurs ... ). L'étape suivante a identifié les associations entre entités du modèle ainsi construit.

Trois concepts de base ont été définis, en accord avec les utilisateurs,afin de construire le modèle de données:

• les acteurs du développement, rassemblant tout groupe structuré d'individus intervenant dans le développement rural de la vallée, dontrelèvent non seulement les organisations paysannes, unions, GIE...mais aussi la SAED elle-même;

• Les aménagements, définis à partir d'une source d'eau (point de pompage la: plupart du temps) et d'un usage qu'il en est fait. Relèventde cette notion aussi bien les axes hydrauliques, que les périmètresd'irrigation proprement dits ou les drains;

• Les unités de mise en valeur, ou Ul\tIV, définies comme la partie d'unaménagement attribuée à un acteur unique. Ce concept un peu abstrait a été construit, et admis par les utilisateurs, à partir du besoinde spatialiser les cultures et du constat de l'impossibilité d'atteindrele concept de parcelle.

Ni l'agriculteur, ni la parcelle ne sont présents dans le modèle. Il s'agitlà d'un choix d'échelle d'observation lié d'une part aux objectifs assignésau système, et d'autre part à la très grande difficulté, voire l'impossibilité,d 'iden ti fier agric lIlteu rs et parcelles, d'en construire des listes, de les suiv reet de les observer régulièrement, sans parler bien sûr du volume d'informations à gérer en conséquence.

Ainsi le système est organisé autour de trois grands groupes d'entités, oud'unités statistiques, décrivant le fonctionnement des périmètres irrigués:

• les acteurs du développement, regroupés en organisations paysannes,unions, GIE... ;

• les aménagements hyd ro-agricoles ;

31

• ·les superficies mises en valeur (en culture) par les acteurs, appréhendées au niveau de l'UMV.

Sçnll&IIQJI rnal~nol

~

~C_E~'PRUNr

C OPOtvDT_AC_Pf?_EC IIJ..TEt:l

j(uit ë~r'.ti:i'ur

____________ 1 thllcrhu • • Ô<),,~161.c:". U'.''''

ü~!.·"i:Li;Ir.,,:i;'~~

le J,"r"AOE

l~}:s:;o! T_"!_A.9ANCll ,.t:l.,'/.E.>(j3

Image 1 :Modèle conceptuel de données.

Le schéma ci-dessus présente une vue partielle d li modèle logiq ue dedonnées, expurgé de toutes les nomenclatures associées aux variables qualitatives.

Pour ces unités statistiques, deux grands l1lveaux d'observation ont étéidentifiés:

• des variables décrivant l'état stable et permanent de ces unités, tellesque les caractéristiques d'un aménagement hydro-agricole : date decréation, organisation paysanne gestionnaire... ;

• des variables décrivant des activités, ou de suivi de fonctionnement,telles que pour une unité de mise en valeur et pOLIr chaque saison lessuperficies semées, récoltées.

32

Les évolutions du modèle de données

Au cours du temps, le modèle de données, conçu en 1990-91, a étéamené à évoluer. Très rapidement certaines informations se sont révéléesinaccessibles à la collecte (impossibilité technique, refus de réponse, manquede moyens ... ), et les attributs associés ont donc été supprimés. Ensuite unesous-estimation de la force des dynamiques dans le delta a fait apparaîtreun manque de précision du système pour suivre ces évolutions. Des entitésde type historique ont dû être mises en place, en particulier sur le thèmemise en valeur. Enfin de nouveaux objectifs, notamment en termes de suivides emprunts, ont amené l'ajout d'entités en 1993.

Aujourd'hui, en 1997, de nouveaux objectifs apparaissent concernantle domaine hydraulique et l'adjonction d'un module concernant le réseauhydraulique d'irrigation est à l'étude. Il s'agira dans un premier temps dedécrire le réseau, les ouvrages et les axes et canaux. Ensuite ces donnéesseront utilisées pour des études de simulation hydrauliques reliant besoinsen eau, débits de pointe dans les axes et impacts environnementaux. Enfin en dernier lieu il sera opéré un suivi régulier du réseau hydraulique àdeux niveaux en enregistrant d'une part son fonctionnement (d urées depompages, hauteurs d'eau ... ) et d'autre part les interventions d'entretien.

Les traitements

Les traitements du système relèvent de trois types:

• des outils d'administration de la base: intégration de nouvelles tables, catalogage des requêtes, réindexation, contrôles d'intégrités aposteriori. .. ;

• des modules de saisie / modification / visualisation des données avecrespect des contraintes d'intégrités;

• des éditions issues de requêtes qui peuvent être soit des aides aurecueil de données (listes de codes, de bordereaux de collecte), deslistes de signalétiques ou de suivi, ou enfin des tableaux de synthèse.

La simplicité des traitements proposés ici montre clairement le rôle essentiellement d'observatoire dédié au système. Ce type de système d'information, qualifié d'environnemental, est destiné à aSSurer l'interface entre unterritoire (la vallée du Sénégal) et un opérateur (la SAED).

33

Le fonctionnement

L'exploitation du système a été calquée sur l'organisation de la SAED :une décentralisation de la gestion des données, et de leur exploitation, danschacune des quatre délégations et une cohérence globale maintenue par unadministrateur de base de données responsable de la structure de la baseet des nomenclatures.

Le processus de collecte et de distribution de l'information est organiséau niveau de chaque délégation, avec un principe de restitution vers l'agentde terrain à l'origine du recueil de données. L'utilisation, par les conseillersagricoles, des données qu'ils ont recueillies, dans le cadre de leur activitéd'encadrement est le principal gage de qualité.

L'insertion dans l'organisme

La mise en place du système a proposé un cadre unificateur de gestionde l'information à l'ensemble de la SAED, des agents de développements,aux ingénieurs d'étude ou aux cadres de direction. Cela s'est matérialisé parla standardisation et la systématisation du processus de collecte des observations au travers de grilles de saisie uniformes sur toute la vallée. De cefait, il s'est installé une homogénéisation des concepts et de la terminologieutilisés, tant au plan des variables que des nomenclatures.

Système cl 'informations statistiques

Deux fonctions statistiques sont remplies: d'une part la maîtrise et ladiffusion d'informations à couverture exhaustive de la vallée, d'autre partson utilisation comme base de référence dans le cadre d'études statistiquesspécifiques ou d 'enquêtes systématiq ues.

Maîtrise et diffusion de l'information

Les campagnes agricoles sont conservées depuis 1991. La premièrefonction du système, c'est l'enregistrement et la restitution de données.Les requêtes sont confectionnées à partir d'opération de sélection, de trid'agrégation et jointure de tables.

Sur ces données collectées, la production d'états statistiques décrivantl'état du développement rural sur la vallée du Heuve Sénégal s'effectue soitsous forme standard et systématique, soit par des requêtes particulières àla demande.

34

En premier lieu, on distingue les requêtes liées au processus de codification. Sous cette rubrique on trouve des éditions de nomenclatures oulistes de codes (raisons abandon de terre, types d'aménagement, cultureset spéculations, types d'organisations paysannes et au tres acteurs, types dematériel des organisations paysannes ... ), ou des listes d'éléments de signalétiques selon diverses clés de tri et constituées des seules variables identificatrices (bailleurs de fonds, périmètres SAED, zones SAED, villages,aménagements, organisations paysannes et autres acteurs, unités de miseen valeur, communautés rurales).

SAED/BDD

NOt'IENCLATURE DES SECTEUP.S

DELEGATION DE DAGANA Code 1

SECTEUR DE Code

o DAGANA 10DAGAN A 11o 8QUNDOUt·l 12GDTK 13LAHPSAR 14R TOLL 15BAS DELTA 1.;

HOY. DELTA lBHAUT DELTA leBAS DELTA 10DELTA CENT lEHAUT DELTA IFDAGANA THI IGINCOtlNU IX

1 Etat nomenclature: Secteurs.

Pour appuyer la collecte, clans le cas de recherche d'informations annuelles sur des éléments déjà identifiés, des éditions de pré-imprimés sontprévues: collecte des superficies cultivées jsaison jzone, Collecte superficies récoltées jsaison jzane...

En second lieu, on recense des états retraçant soit les éléments de typesignalétique Otl de suivi de campagne: Signalétique aménagement et deleurs unités de mise en valeur pour petits périmètres d'irrigation, Signalétique et de leurs unités de mise en valeur pour les grands aménagements,Equipement des stations des grands aménagements, Signalétique des organisations paysannes possédant au moins une unité de mise en valeur,Superficies cultivéesj récoltées par saison par délégation ...

35

:AED/O~Il~ DHEGAT ION DE OAGA"A/DP~D

SAEO/BDD SITUAllC" DES CULrU~ES PA~ $,l,ISO";>0.;; LES G~A~:lS A~f~GE"EIjT$

lir;JSle 00 JO/OJ/9!1

!C[\,ERli.l,GE 95/96 , OELEGAflON OAGANA SC-Uel.lr de l'lor. DH1A Code: "A"'t~'AGfMEIC' DE ; GHNOE'OIGUE/THLEl Code nl1 11005

lone Superl. EJ<ploitable Superfkie Cultivée et culture Superf. Récol~ée hi!'>on du Sinistre

lBl G DIGUE"lBl G-or::'UE181 G-OIGUElBl (DIGUE

181 G OIGeElB2 TEllEL18ZTEllEl1821ELLELlal TELLEL

11005 10155 Secret sa~iS~[qlle

11005 10J9a Seuet SliU \u iqllt"11005 10J99 Secret stat i st ique'1005 10'Ol Secret Ita\ î,tique

11005 11607 Sel:rel statistique11005 11701 Secret uatistique11005 11](.2 Sec rel 5UtiSlÎQUe110C5 111'S':' Secret u;)tÎstiQ'Je'11005 11782 Secr .. t Slatis! ique

2 Etat standard

10.00 h' 6.00 ho RllSE l.OO h. ENHERBEMEJllt19.85 ho 19.00 h. RIZSE 17.00 h. PB INONDATION12.85 h. 1l.00 "- RIZSE 9.\0 h. PB INONDATIONl6.78 h. 1'.50 ho RIZSE 1'.50 h. PAS DE SINISTRE

ZO.OO ho JO.OO h. RIZSE 16.00 ho PB [}lO"OATION7.00 h. ~ .00 h. RIZSE J.50 h. PB /RR1CATION

50.00 ho JO.OO h. lllZSE 18.00 h. " [Jl.R[GAllON10.J7 h. 7.70 h. RllSE 7.70 h. PAS DE SU/lSHlE39.80 h. lO.J7 h. RIZSE 10.00 h. PB IRRIGATION

2J2\.50 1"6.J9 h. \097.28 h.

Situation de cultures par saison.

En dernier lieu, le système propose la sortie de tableaux de synthèse pourdiverses clés d'agrégation: Superficies par zone et type aménagement, Synthèse mise en valeur d'une campagne par zone ...

ShZD/BOD +----------------------------------------------------------------------+Tableau de synthèse SUIVI DE LA [·lISE EN VALEUR DES D.N.V. DE LA OSLEGATIOn DE DAGIo.NA

BILAN DE L'ANNEE AGRICOLE : 95/96 +----------------------------------------------------------------------+

+----------------------------------------------------------------------------------------------------------+CODE ET NO~1 P.MENAGEI1ENT 1 SIGNALETIQUE 1 MISE EN VALEUR 1 TOTAL 95/96 1

+------------------------------------+-----------------+----------_·----------1ISur.lJet.\Surf. ISurf. ISurf. 1 HIV ] eSF 1 ese ISurf I.e. 1

1 lirr.ini·IExtens. ]Abandon JExploit. ! 1 1 leultiv. 1+----------------------------+--------+--------+--------+---------+--------+--------+--------+-------------1110014 PIP ADJOUMA MBAYE 115.00 haIO.OO ha 1 0.00 ha115,00 ha 16,00 ha 10.00 ha 10.00 ha 16.00 ha 40 %1+----------------------------+--------+--------+--------+---------+--------+--------+--------+-------------]110035 ?IV FOYER THIAGO 112.00 haIO.OO ha 1 0,00 ha112.00 ha 10,00 ha 10.00 ha 10.00 ha 10,00 ha 0 %1+----------------------------+--------+--------+--------+---------+--------+--------+--------+-------------1110039 PIP BAMBARA SOW 1 2,00 haIO.OO ha 1 0.00 hal 2,00 ha 12,00 ha 10.,0 ha 10.00 ha 12,40 ha 120 %1+----------------------------+--------+--------+--------+---------+--------+--------+--------+-------------j110042 PIP GIE GESTU 130,00 haIO.OO ha 130,00 hal 0,00 ha 10,00 ha 10,00 ha 10.00 ha 10.00 ha +++ %1+----------------------------+--------+--------+--------+---------+--------+--------+--------+-------------1110055 PIP GIE NIAW DIOP 1 2,00 haIO.OO ha 1 0,00 hal 2,00 ha 10,00 ha 12.50 ha 10,00 ha 12.50 ha 125 %1+----------------------------+--------+--------+--------+---------+--------+--------+--------+-------------1110056 PlV GIE DEGGO NDIAKHAYII0.00 ha15.00 ha 1 0.00 ha115.00 ha 10,00 ha 14,12 ha 10,00 ha 14,12 ha 27 %1+----------------------------+--------+--------+--------+---------+--------+--------+--------+-------------1110057 PlV SV NDIAKHAYE 130,00 haIO,OO ha 1 0.00 ha130,00 ha Il.00 ha 15,00 ha 10.00 ha 16,00 ha 20 %1+----------------------------+--------+--------+--------+---------+--------+--------+--------+-------------1

NB les superficies pour la mise en valeur sont les superficies cultivées et non les superficies récoltées.L'i~tensité culturale (I.e.) est calculée en faisant la so~~e des superficies de chaque saison diviséepar la superficie exploitable et multipliée par 100.

3 Etal de synthèse Suivi de la mise en valeur,

36

Les études

Enfin le système ainsi consti t ué fou l'ni t le pain t cl 'ancrage de tou tes lesétudes statistiques réalisées par la SAED :

• d'une part en fournissant une base de sondage complète préalable àla constitution d'échantillons pour les enquêtes spécifiques;

• d'autre part un système cie référence pour conduire les extrapolationsnécessaires aux enq uêtes par sondage.

Système d'informations géographiques

Il est très vite apparu que les unités d'observation du système possédaient une très forte connotation spatiale. Parallèlement à la mise en placedu système statistique, une identification des aménagements et des unitésde mise en valeur par photo-interprétation d'images SPOT a été réalisée envue de constituer un atlas des aménagements. Cette étude a été effectuéepar la SAED en association avec BDPA-SCETAGRF.

Les deux approches, télédétection et base de données socio-économiques,ont été réalisées sur les mêmes objets géographiques: aménagements et uIl ités de mise en valeu r. L' utilisation d'un système de cod ification d 'iden tification uniq ue et commu n a permis un con trôle des informations d'u ne parten terme d'exhaustivité (des aménagements oubliés dans le recensement ontété identifies grâce à l'imagerie satellitale) et d'autre part en terme de données recueillies (les superficies ont pu être planimétrées informatiquementet comparées aux valeurs saisies, au niveau aménagement et unité de miseen valeur).

L'intégration au sein d'un SIG a permis une fusion complète des deuxsources d'information en apportant toutes les fonctionnalités de la représentation cartographique et de l'analyse spatiale pour fournir LIn système complet de gestion du territoire.

2Bureau de Développement de la Production Agricole. BDPA-SCETAGRI, 27rue Louis Vicat, 75738 Paris Cedex 15, France

37

Image 2 :Carte des types d'am.énagements.

La qualité de l'information

La qualité du système se conçoit selon les trois axes suivants

• en terme de pertinence et de structure du système dispose-t-on desvariables nécessaires?

• en terme d'occurrences d'entités les individus statistiques observéssont-ils adéquats?

• en terme de contenu des variables ou champsexactes?

les valeurs sont-elle

Pour répondre au premier critère, la construction d'un modèle de donnéesrigoureux, alliée à une programmation modulaire a permis une adaptationrégulière du système aux réalités clu terrain et aux nouvelles demandes des

utilisateu l's.

38

Ainsi au cours des six années de vie de l'application, il a fallu intervenirsur la structure du modèle de données selon trois directions. D'abord desretraits de variables ont dû être réalisés, car comme dans tout systèmede ce type la mobilisation de données liées aux flux physiques (intrants,produits ... ) ainsi qu'à des paramètres de valeurs et de prix s'est révéléeirréaliste. L'information était de caractère soit peu fiable, soit inaccessible.Au contraire, des ajouts de variables et d'entités ont été effectués, et leprojet d'intégrer le domaine hydraulique en est un exemple récent. Enfin,durant toute cette période, il a été réalisé une mise à jour permanente desnomenclatures.

Le respect des contraintes d'intégrité de la base de données, est assurépar la programmation de l'application informatique.

Sur le plan organisationnel, la faculté de restituer l'information au plusprès de son lieu de collecte, c'est-à-dire le conseiller agricole, a été un choixdicté pal' un double souci de qualité et redistribution des informations ausein de l'organisme. La décentralisation en délégation l'épand à cet objectif.

A sa mise en place, le premier objectif assigné au système a été l'exhaustivité: disposer d'une liste de tous les individus des populations statistiquesanalysées.

Ensuite, il fallait arriver à une precIsion sémantique correcte: exactitude des superficies recensées, par exemple. Cet objectif a été atteint demanière progressive. Les erreurs se compensant, on est rapidement arrivé àune précision correcte à l'échelle de la délégation, puis de l'arrondissement.Le recou pement avec la télédétection a permis d'arriver à des chiffres corrects, en termes de superficies, au niveau du périmètre et ensuite pourchaque aménagement, mais il peut encore su bsister des erreurs sur des données ponctuelles qui, si elles peuvent choquer au niveau individuel, gênentpeu une exploitation statistique.

Aujourd'hui ces imprécisions de données ne sont plus acceptables etla démarche pragmatique qualité, des premiers temps, ne suffit plus. Laprogression constante de la qualité des informations doit être poursuivie,mais avec d'autant plus de difficultés que l'information accumulée est volumineuse, et que plus la qualité augmente, plus sa progression est coûteuse.En effet, la mise en place du SIG nécessite une approche plus active. LeSIG présentant les éléments individuels (qu'il s'agisse de leur forme géographique ou de leurs attributs numériques) les erreurs et inexactitudes apparaissent beaucoup plus clairement. Il va donc être amorcé d'une part uneévaluation de l'information en termes d'abord de présence ou absence effective, puis d'exactitude par comparaisons avec des sources externes. D'autrepart, dans un deuxième temps, l'étude va porter sur la détermination des

39

paramètres explicatifs de cette qualité. La démarche qualité s'appuie surtrois directions. La première, que l'on pourrait qualifier de traditionnelle,réalise des pointages manuels des données stockées. La deuxième comparedifférentes sources d'information, en J'occurrence les enquêtes de terrainet les images satellites. La troisième travaille sur les données recueilliesd'abord pour vérifier l'intégrité référentielle, puis leur respect de règles statistiques de cohérence et vraisemblance.

Les utilisateurs

Ce système d'information est l'un des maillons de l'observatoire del'agriculture irrigué dont la mise en place a été confiée à la SAED dansses lettres de mission.

Les informations produites sont destinées en premier lieu à la SAED,aux organismes publics chargés de la planification et de la coordination dudéveloppement rural et aux bailleurs de fond. lVIais de nouvelles demandes,dans le double contexte de libéralisation et de décentralisation, commencentà émerger en provenance des collectivités locales (communautés rurales ... )ainsi que des différents opérateurs économiques (Caisse nationale de créditagricole du SénégaL).

Conclusion

Ce type de système d'information concerne des organisations qui privilégient les fonctions de gestion (du territoire) par rapport à la fonction deproduction (de biens et de service). A ce titre donc, les flux d'informationscirculent en priorité entre le système et le milieu extérieur, et les fonctionnalités proposées répondent à des besoins de gestion et de présentation del'information.

Que ce soit dans sa composante base de données fournissant des étatsstatistiques, ou dans sa version SIG qui complète ces résultats par desreprésentations cartographiques, ce système est un instrument de suivi etde connaissance.

L'étape suivante devrait être une évolution vers un véritable systèmed'aide à la décision s'appuyant sur des outils de modélisation pour proposer des méthodes, soit d'optimisation, soit de simulation et constitution descénarii prospectifs.

40


P. d'Aquino - "ivlise en place d'un Système d'Informations Géographiques sur leDelta du Fleuve Sénégal" - 1995 - CIRAD-SAR.

BDPA-SCETAGRI - "Atlas numérique des aménagements hydro-agricoles de ladélégation de Dagana - Hivernage 1993- 1994" - Décembre 1995.

J.F Bélières - "Appui au service du suivi évaluation de la SAED année 1998 rapport de fin de mission" - Février 199ï - CIRAD-SAR.

J.F Bélières, M. Passouant, M. Faye, A. Kane - "Présentation de la banque dedonnées pour le suivi des aménagements hydro-agricoles et des organisationspaysannes" - 1994 - SAED et CIRAD-SAR.

J. Ceupens, ivI. Kane - "Besoins en eau des aménagements hydro-agricoles du Deltaet débits d'équipement des grands axes hydrauliques" - Projet Gestion del'EAU, Bulletin 1èchnique n 12, 199ï - SAED DPDR St Louis, Sénégal.

O. Gay te, J.P. Cheylan Th. Libourel, S. Lardon - "Conception de systèmesd'information sur l'environnement" - Hermès 199ï.

R. Laurini, F. Milieret-RaITort - "Les bases de données en géomatique" - Hermès1993.

E. ivlalinvaud - "Statistiques aujourd'hui - Histoire demain" in "Pour une histoirede la statistique" - INSEE 19ïï - Economica 198ï.

J. Mairesse - "Histoire aujourd'hui -Statistiques demain" -in "Pour une histoire dela statistique" - INSEE 19ïï - Economica 198ï .

.1. Parnot, i\'1. Passouant - "Système d'information géographique sur le delta dufleuve Sénégal - description du système" 1996 - CIRAD-SAR : BDPASCETAGRI

P. Rouet - "Les donnés dans les systèmes d'information géographique" - Hermès1991.

SAED-DPDR - "Note de présentation sur la mise en place de l'ObservatoireSocio-Economique de la Vallée" - République du Sénégal, Ministère del'Agriculture, SAED Direction de la Planification et du Développement Rural - Février 199.5.

G.Théodore, M. Voile - "Les statistiques agricoles" 1Il "Pour une histoire de la

statistique" - INSEE 19ïï - Economica 198ï.

41

42

L'évolution des systèn1es d'enquête des pêchesartisanales en Afrique de l'Ouest, entre

questions halieutiques et solutionsméthodologiques

Pierre Moranda

Introduction

Jocelyne Ferrarisb

Nos parcours de biométricien(ne) nous conduisent depuis plusieurs années à participer à la mise en place et à l'amélioration de systèmes d'enquête dédiés à l'étude ou au suivi de pêcheries artisanales en Afrique del'Ouest. Nous évoquons ici quelques tendances récentes dans la manièrede concevoir ce type de travaux. Pour assurer une meilleure compréhension, nous replacerons ces tendances dans le cadre de l'évolution des idéesscientifiques en matière d'étude et de gestion des ressources halieutiques,sans négliger les effets de la prise de conscience progressive des spécificitésdes pêcheries artisanales. Les points de discussions seront alimentés pardifférentes études de cas (figure 1) portant sur des pêcheries artisanalesdu domaine maritime (Sénégal et Ghana) comme du domaine continental(Mali) .

La pêche artisanale, un secteur d'activité dynamique, important pour l'économie de nombreux PVD

Dans de nombreuses régions tropicales, la pêche artisanale est l'unedes principales sources de protéines, et c'est même quelquefois la première.Dans le cas des pays à façade maritime comme le Ghana et le Sénégal, lapêche artisanale prend place parmi les deux ou trois premiers secteurs del'économie, et elle domine généralement la pêche ind ustrielle. De plus, ce

aERMES-Orstom, Technoparc, 5 rue du carbone, 45072 Orléans Cedex 02bCentre Orstom de Nouméa, BP A5, Nouméa, Nouvelle Calédonie

secteur d'activité exigeant en majp-d'oeuvre constitue une source de travailet de revenus pour des millions de personnes.

Figure l

Situation des trois pays d'Afrique de l'Ouest de l'étllde,

Les caractéristiques principales des pêcheries artisanales des trois payspris en exemple dans cette étude sont résumées clans le tableau 1 ci-dessous.

PAYS Institution Début Zone Nombre Nombre Nombre Productionnationale des de péche de de de (milliers de

de travaux concernée ,'dlages pêcheurs pirogues tonnes)recherche d'enquête

Ghana FRUB 1972 550 km 189 96500 8 ïOO > 300000

Sénégal CRODT 19ï4 ïOO km 96 35000 5 ïOO > 300000

Delta 1ER 198ï 35000 environ 60000 non 40000

central i\'lopti km 2 1 500 1 pertinent à

du Niger 120 000 2

(Mali)

Tableau 1

Caractéristiques prillcipa.lcs des trois pêcheries f\l'tisallalcs de l'étude.

1 : Pour le Delta Central, le nomb.'e indiqué ici correspond" la totalité des villages et

des cainpenlcilts de pêcheurs, ces dcrniel"S pouvant être teulp0l'ail'es, c'est-tl-dire occupésde façoll saisonnière.

2 La production du Delta Centl';)'] est halltclllcnt variable d'ullc unnée à l'autre, car très

SOlllllisc aux aléas de lu conjoncture hydroclitnatiqllc.

44

Les fondements de l'halieutique comme discipline de recherche appliquée : du modèle de gestion à la nécessitéd'enquêtes quantitatives

Jusqu'au début des années 70, les études relatives aux pêches artisanales étaient plutôt monographiques et qualitatives, et elles visaient pourl'essentiel à la connaissance des poissons ou bien à celle des techniques depêche (ex. : Daget, 1949, 1954). Avec la prise cie conscience de l'importanceéconomique de ces pêcheries est apparu le besoin cie nouvelles connaissancesmoins "naturalistes" et clavantage reliées à cles objectifs cie gestion et ciedéveloppement (Du ranci et al., 1991). Par ce mou vemen t, les recherchessur les pêches artisanales s'intégraient pleinement au projet déjà anciencie l'halieutique scientifique, centré sur l'étucle et la cléfinition cles conclitions permettant une bonne "gestion" cles stocks cie poissons. Ce projettrouve son origine dans l'observation de l'évolution négative cie nombreuxstocks marins et, plus généralement, dans la crainte cie voir les ressourcesvivantes aquatiques s'épuiser par suite cI'une exploitation trop intensive.Pour juguler ce clanger, la discipline halieutique se propose de déterminerle niveau d'effort de pêche qui permet de maximiser les prises sans compromettre les capacités de renouvellement cie la ressource (notion de "TvISY"1na.Timll1H sustainable yield).

A travers ce modèle (illustré idéalement par la figure 2) que l'on qualifiera de "classique", la connaissance des deux grandeurs que sont l'effortde pêche et les captures fournit la clé du diagnostic de l'état d'une pêcherieavant de conduire quasi-immédiatement à des recommandations cie gestion.Cette vision a concluit logiquement à la mise en place de vastes programmesde collecte d'information focalisés sur l'estimation et le suivi temporel desdeux variables essentielles du modèle pré-cité (voir notamment Laurec et a!.,1983). Ce double investissement fort cohérent en modélisation et en acquisition de données a fini par gagner le domaine des pêches artisanales, faisantécho à l'accroissement des préoccupations de gestion et de développementconcernant ce secteur.

4.5

MSY ==>

Cf)Q)......~.-0..coU

xx x

xSurexploitation

x

seuil de Effort de pêchesurexploitation

Figure 2

Celte courbe illustre le modèle-paradigme de la gestion des ressources

halietLtiques. Dans le cadre de ce paradigme, gérer signifie contenir l'effort de

péche au niveau ou en deçà du seuil qui détermine la baisse des captures, en

admettant implicitement que le danger principal /nenaçcmt chaque pécherie est de

dépasser ce seuil, autrement dit de tom.ber dans l'état de "surexploitation". Les

croi:L' (*) symbolisent des couples (effort, capture) estimés pour différentes années

par le système d'enquéte. C'est grâce à ces points que l'on peut ajuster le modèle

(courbe continue) et déterminer les niveaux d'effort ou de capture cl ne pas

dépasser.

C'est pourquoi les pêcheries artisanales (y compris celles des reglOnstropicales qui nous intéressent particulièrement) allaient à leur tour devenir, à la fin des années 70, la cible d'enquêtes "quantitatives", caractérisées par la mise en place de systèmes de collecte d'information organisésselon des méthodologies explicites (Caddy et Bazigos, 198.5). Bien souvent,ces mêmes enquêtes répondaient aussi à un besoin d'informations chiffréesémanant des autorités nationales, soucieuses d'établir le bilan économiquecom plet du pays.

46

Par ailleurs, il est intéressant de souligner que ce sont en général les centres de recherche halieu tiq ue CJ ui ont ini tié et développé un peu partou t cessystèmes d'enquête. Ceci est lié au fait que les structures de l'administration des pêches ne disposaient pas, dans la plupart des pays, de compétencessuffisantes pour assurer seules la mise en place de dispositifs de collecte etde traitement de données statistiques. Ceci n'empêche évidemment pas dereconnaître ['importance de leur participation.

Les systèmes d'enquête appliqués aux pêcheries des PVD :le cas du Ghana, exemplaire des spécificités des pêches artisanales et des difficultés liées

Le système d'enquête mis en place au Ghana illustre bien la focalisationd'un suivi statistique sur le double objectif d'estimation des captures et desefforts. De plus, ce système d'enquête permet de montrer les spécificitésdes pêcheries artisanales et les difficultés de méthodologie d'enquête quien découlent. Développé en 1972 selon un protocole préconisé par la FAO(Banerji, 1974), ce système est mené en collaboration par deux servicesdu Département des Pêches: le "Marine Branch" pour les enquêtes deterrain et le "Research Utilization Branch" pour le suivi et l'analyse desdonnées (Koranteng, 1982). La pêcherie étant dispersée sur 276 plagescie débarq uemen t le long clu littoral, une stratification spatio- tem porelle etstructurelle est nécessaire pour cerner les différentes sources de variabilitéde l'activité de pêche, par le croisement de trois facteurs: le mois, la régionet le type d'engin. Ces critères de stratification assurent une couverture del' hétérogénéi té de la prod uction, liée notam men t à l'existence de différentsengins de pêche (classés en .5 groupes), à la présence de multiples espècesde poissons (dont les présences et abondances sont soumises aux variationsdes caractéristiques environnementales, dans le temps et l'espace) et enfinà. des spécificités régionales dans les pratiques de pêche, en relation avecles appartenances ethniques (4 régions: Volta, ethnie 'Ewe' spécialisée ensenne de plage; Greater Accra, ethnie 'Ga' spécialisée dans la pêche àligne; région centrale, ethnie 'Fanti' maîtrisant les filets tournants et fixes;région 'Western', sans spécificité ethnique).

La stratégie d'échantillonnage, résumée à la figure 3, répond à un planstratifié avec plusieurs niveaux d'observation au sein de chaq ue strate: laplage est d'abord sélectionnée par probabilité proportionnelle à la taille duparc piroguier au sein de la région et pour un type d'engins: les mêmes sitessont conservés au cours du temps; la sélection du jour d'enquête est ensuiteréalisée sur une base raisonnée, en fonction des contraintes logistiques, àraison de 2 semaines consécutives par mois et de 5 jours par semaine, pour le

47

suivi d'un type d'engins au sein d'une plage; enfin, pour un groupe d'enginsdonné, les pirogues sont sélectionnées sur une base systématique en fonctiondu nombre de sorties de lajournée (estimé le matin), en veillant à une bonnerépartition au cours des heures de débarquement pour couvrir la variabilitéhoraire avec au maximum 10 pirogues par jour (contrainte imposée parla feuille de terrain). Un recensement triennal assure l'inventaire du parcpiroguier, sur la base de l'engin de pêche principal par pirogue, tout aulong du littoral; il procure la base de sondage pour le choix aléatoire del'échantillon du premier degré, .53 plages de débarquement, et le calcul desfacteurs d'extrapolation à l'ensemble de la population statistique.

PLAN D'tCIIA(\'-ILLOXNACE: rlA.., Slr1Itir,,! 1] NIVEAUX

1 Capture to"'ld'jour d"CI1qu(tc Ci) IJlloc (i) pour rcncin Il ccl. réciQn 1 1

1 Cllplurc loule mcn~udlc lrile {il pour rcn~n h ct la ré:;ion _1

~ Nomtu( de smlia tchJ.fltilJonnéeJ

Nom~dc 5011[0loulu

1\" MY oh.ijoh.;j=~.

oh.IJ

n1 ah .ij

l y .....-.- Clplurc de IJ. pirQ'ue l

,.1 ah.IJk

.- t:ambrc de iol,lf~ dt p6chc

/\ d

Y _ DI Yah.; - cr j.1 ahij

UNnts PRIMAIRES: Pt.ll.tc:5 de déwqutm(nt 8ProbabjliliJ proponionnt:l/cs au notr.brc de. Prolll(J par ri,ion II par a1lill: : tü.'l

Utm-ts" SECONDAIRES: Jours 0&isonnl (1 stlf'tOinr:vmoù)

UNnts TERTIAIRES: . PifOC'JCS 0Splimi3fÎqW (orJ,~ d·orrùù : rna..r1mllm fDljouf)

t_Nombre de joun d'cnqu~~

1 CaplurC' [ol.al~ par mais, par rotin C't pu rt~ian 1

1 Variables

"';amb~ de pirozues cn sortie d<; ptehc:

Caplure <:cs pirozuu lU dtbuquemcnl (K.ilo):

MallJj

r·'·ti"

Namb~ de pirogues de lart~ion a

Nomb~ de pl.l&cltcha.nlÎllanntc..s

_t

/\

Yoh.i

Nah.;

~ Nombre dcpiraguc..s'" du sil.C 1

Figu re 3

Présentation du système d'enquête des pêches artisanales au Ghana.

L'effort d'acquisition de l'information porte sur deux variables

• l'effort de pêche (c'est-à-dire le nombre de sorties de pirogues parstrate), obtenu soit par double comptage des pirogues restées sur laplage (avant et après le départ en mer), soit par comptage des arrivéesle soir au débarquement ou par enquête auprès des pêcheurs.

48

• les captures, qui sont évaluées par espèce à partir du nombre de caissesdébarquées ou par mesure individuelle à l'aide de peson.

Les données d'enquête sont tout d'abord compilées manuellement, ce quiassure un certain contrôle des données. Après ce premier traitement, quiaboutit à des statistiques journalières, l'information est envoyée au niveaucentral et c'est seulement à ce moment là qu'a lieu la saisie dans la basede données. De ce fait, la base ne contient pas le niveau de détail le plusfin, c'est-à-dire les valeurs mesurées pour chaque débarquement de pirogue.Les données sont ensuite extrapolées à l'ensemble du mois et de la régionpour le type d'engin considéré.

Bien que fonctionnant de façon régulière, ce système ne donne pasentière satisfaction car des problèmes importants se posent dans le calcul des extrapolations à partir des facteurs donnés par les recensementstriennaux. En effet, la pêcherie artisanale ghanéenne, qui se caractérisepar une production majoritairement constituée de poissons pélagiques, estde ce fait fortement soumise à des contraintes environnementales liées auphénomène d 'u pwelling (remontée d'eaux froides favorisant la prod uctivité). Ce phénomène est à l'origine de fortes variations de la disponibilitéde la ressource, lesquelles se répercutent à leur tour sur la structure de lapêcherie puisqu'elles incitent les pêcheurs à se déplacer et/ou à modifierleurs choix d'engins de pêche. La figure 4 illustre cette variabilité observéeau niveau des parcs piroguiers au cours du temps (Ferraris et Koranteng,199.5). Ces fluctuations saisonnières du nombre moyen de pirogues parplage et par région entraînent un problème de variation des effectifs danschaque strate (alors que les calculs d'extrapolation voudraient que ces effectifs soient relativement stables entre deux recensements trisannuels). Undébut de solution a consisté à mettre en place de nouvelles enquêtes, parallèlement au système principal, afin d'identifier l'origine et la destinationdes pirogues migrantes et de tenter d'expliquer les changements de comportements de pêche.

A travers la description de ce système d'enquête utilisé au Ghana, onmesure à quel point la mise en place de ce genre de dispositif est difficiledans le contexte des pêcheries artisanales (en comparaison par exemple decelui des pêcheries industrielles), et ceci pour nombre de raisons: l'absencede véritables bases de sondage au niveau des unités de pêche (généralementnon immatriculées), l'illétrisme générale des pêcheurs (pas de possibilitéde log-book), la multiplicité et la dispersion dans l'espace des points dedébarquement du poisson, l'instabilité de la structure spatiale et techniquedes pêcheries - sans compter les habituelles ambiguïtés sur la définition del'unité d'observation (pêcheur, bateau, action de pêche... ).

49

---CErm1AL

GnEATm ACCRA

Région

- - - - - - - - Vrc5lEP;j

---VOLTA

\ ,

40

12

~ 10:JDleï'i.,u.,.DEoz

or-- r-- r-- <Il <Il Dl Dl 0 0<Il

"?co <Il <Il <Il "? Dl <Il Dl 0 Dl Dlè a. è "? a. "? a. q> Dl

C è a. è ~ a.10 ïii Cl 10 ïii Cl lO 'ôi .,10 "c:; QI .,....,

~(f) ....,

~(f) ....,

~(f) ....,

~(f)

10 10....,~

(f)

Figure 4

Nombre moyen de pirogues à filet tournant par plage et par région.

Ces difficultés ne sont pas propres au Ghana. On les retrouve danstous les PVD, et elles viennent s'ajouter à la faiblesse générale des moyenslogistiques et informatiques disponibles. Tout cela a contraint les scientifiques à faire preuve d'originalité par rapport aux schémas orthodoxes del'échantillonnage, à la recherche de compromis acceptables entre l'application de la théorie et la prise en compte des contraintes liées à l'objet étudiéet aux moyens mobilisables (Laloë, 1992; Laë et al. , 1994). Très souvent, ila fallu concevoir des plans d'échantillonnage à plusieurs degrés et fort composites, où seuls les niveaux supérieurs (ex. : les points de débarquement) seprêtent bien à l'adoption d'une démarche rigoureuse (l'établissement d'unebase de sondage suivie d'une stratification) alors que les niveaux inférieurs(ex. : les retours des sorties de pêche) doivent souvent être sélectionnés defaçon plus sou pie (méthode des quotas). Des estimations d'effort de pêcheet de capture ont généralement pu être produites, mais elles n'ont que trèsrarement été assorties d'un niveau de précision (Laloë, 1985).

50

Les enquêtes mises en place au Sénégalnouvelles questions

l'émergence de

Au Sénégal, le système d'enquête mis en place à partir de 1974 est trèssimilaire à celui du Ghana, quoi que plus simple de par la structure moinséclatée de la pêcherie sur le littoral: 8 ports principaux, qui représententplus de 70% de la production nationale, sont suivis pour tous les enginspar des enq uêteu rs affectés à une plage particulière (Ferraris et al., 199.5).Pour mieux cerner les phénomènes de migration liés à la variabilité environnementale très marquée en deux saisons, le recensement est effectué deuxfois par an. L'échantillonnage des efforts et des captures est basé sur unplan stratifié à trois niveaux d'observation:de la strate Port*Engin*Quinzaine sont sélectionnés respectivement

- le jour (jours ouvrés de la quinzaine),

- la pirogue à son retour de pêche, en fonction de l'ordre des arrivées,

- le poisson, choisi "aléatoirement" pour les mesures biologiques.

Les statistiques sont produites pour les 8 ports principaux du nord dulittoral puis des extrapolations sont effectuées par région en fonction desdonnées de recensement, en prenant pour hypothèse que les ports secondaires présentent les mêmes comportements que les ports principaux. Dessolutions d'optimisation du système actuel ont été proposées, notammentpour couvrir les ports secondaires, tel que l'échantillonnage en deux étapesou en treillis (Hoenig et Chouinard, 1993). Ces solutions n'ont toutefoispas été adoptées, non pas seulement pour des raisons logistiques et financières mais surtout parce que des problèmes plus importants se posaient, enrapport notamment avec la dynamique de l'exploitation (incertitudes surles variations des effectifs par strate) et avec la méconnaissance de l'impact

de cette exploitation sur les stocks (difficultés d'estimation des mortalitésinduites). Et il est apparu que ces aspects devaient être traités en priorité.Compte-tenu des faibles moyens financiers disponibles dans un PVD commele Sénégal, il paraissait en effet déraisonnable de vouloir optimiser le système d'enquête dans le seul sens de la précision d'estimation des captureset des efforts.

Ivlais il faut souligner que ce point de vue n'est pas seulement issu deconsidérations matérielles : il s'est trouvé renforcé par les changementsprofonds qui, à partir des années 80, ont affecté l'halieutique scientifique.En effet, l'intérêt du modèle "classique" de gestion, destinataire naturel desrésultats des enquêtes de capture-effort, se voit de plus en plus contesté à

.51

partir de cette période. En fait, c'est le caractère excessivement réducteurde ce modèle qui est remis en cause: on prend conscience que l'abondancedu poisson n'est pas essentiellement déterminé par la mortalité par pêche,et l'on se dit par ailleurs qu'il faudrait s'intéresser à tout ce qui, en dehorsde l'abondance du poisson, motive l'effort des pêcheurs. Pour finir, onconvient de reconnaître que la mauvaise santé d'une pêcherie peut avoirbien d'autres causes que la raréfaction de la ressource l

. Ainsi déstabilisé,le cadre de synthèse de l'halieutique scientifique se voit dans l'obligationde s'élargir et d'intégrer de nouvelles questions, et notamment de mieuxprendre en compte la dynamique d'activité des unités de pêche (bateauxou pêcheurs) ainsi que leurs motivations sociales et économiques. C'est eneffet ce qui arriva, et le cas des recherches halieutiques au Sénégal est à cetégard exem plai re.

En ce qui concerne la pêcherie de ce pays, on peut dire que les nouveaux besoins d'information ont été identifiés dès le début des années 80par des chercheurs du CRüDT (Centre de Recherche Océanographique deDakar-Tharoye) qui ont choisi de s'intéresser davantage à la dynamique del'activité des pêcheurs. Pour appréhender cette dynamique, il apparut bienvite qu'il était nécessaire d'identifier les unités de pêche (les pirogues) et deles suivre tout au long de l'année, ce qui impliquait une organisation nouvelle du travail d'enquête. C'est ainsi qu'en 1982, un premier suivi d'unitésde pêche a été mis en place sur l'ensemble des ports dans le cadre d'unprogramme de recherche socio-économique (Weber, 1982). Ce programmevisait d'une part la connaissance des comptes d'exploitation et d'autre partla mise en évidence du déterminisme "autre que biologique" (!) de l'effortde pêche, selon les termes de la demande formulée alors par les biologistes.Ce suivi durera un an. En 1992, un nouveau suivi d'unités de pêche estmis en place pour 12 mois, parallèlement au système d'enquête de base,afin de préciser et formaliser les notions de tactiques et stratégies de pêche(Ferraris, 1995). Du côté des traitements, des efforts originaux sont menéssllr les différents corpus d'information disponibles pour, d'une part, dresserune typologie des actions de pêche et des comportements "tactiques" (c'està-dire les choix de l'engin de pêche, du lieu de pêche et des espèces-ciblespour une sortie donnée) et, d'autre part, faire apparaître des classes destratégies d'unités de pêche, basées sur le calendrier des activités réaliséesau cours de l'année. La figure 5, par exemple, illustre la décomposition desefforts des "pirogues à ligne" du port de Kayar, dans l'une des strates du

llVlentionnons ici, pour mémoire, les problèmes de marché (niveau de la demande), de prix payés au producteur, de qualité du produit de la pêche, de conflitsentre pêcheurs pour l'accès à la ressource, de disponibilité et de coûts de matérielsde pêche.

52

système d'enquête en 1992. On a pu mettre en évidence différents types detactiques sur la base de la classification des captures au débarquement etde leur relation avec le choix d'un engin et d'un lieu de pêche.

Décomposition des efforts des pirogues lignes en tactiques

5000

5000

en 4000Cl.",0enCl 3000"0

'".D2000E

0z

1000

aco '" 0

"TAc-nOUE"

E;J Poulpe

o /lutre

mVoilier

~ Denté

o Pageot

I!l Mérou

Mois

Figure 5

Variations temporelles du 110mbre des actions de pêche classées en "tactiques Il

reflétant le choix d'un lieu de pêche, d'un engin et d'ulle cible.

Dans cette nouvelle optique, les informations sur le bilan économiqueannuel des exploitants, sur l'activité journalière des commerçantes de laplage, sur l'évolution des prix, etc. prennent progressivement place commedes éléments indispensables de la compréhension de l'évolution des pêcheries. Ainsi donc, c'est par une véritable explosion des types d'unités d'observation que s'est traduit le changement de perception scientifique de la pêcheartisanale.

Ce changement de perception entraîne aussi, en retour, un nouveauregard sur la complexité des plans de collecte: dorénavant, cette complexitéapparaîtra non plus comme une regrettable contrainte technique mais biencomme la légitime et nécessaire réponse du biométricien des pêches au soucide rendre compte d'une réalité elle-même complexe - que l'on n'osera plusdorénavant réduire à un jeu de deux grandeurs. Dans cette nouvelle optique,les différents degrés du plan de collecte tendent à devenir eux- mêmes des

53

unités d'observation à part entière, méritant bien d'être décrites pour leurintérêt propre: les ports, les plages, les lieux de pêche, les équipages oules pirogues, le déroulement des actions de pêche deviennent tout aussipassionnants que le poids des caisses de poisson rapportées par les pêcheurs.

Le cas du Mali: la recherche de solutions méthodologiquesintégrées et le mûrissement de l'idée d'observatoire

En 1986, un projet pluridisciplinaire (Quensière, 1991) est lancé parl'ORSTOM et l'INRZFI-P pour étudier la dynamique des pêcheries continentales du Delta Central du Niger, lesquelles n'avaient plus été l'objetde recherches depuis les années 50. Pour combler les énormes lacunes deconnaissances qui s'étaient accumulées depuis lors, le projet débute par unimportant effort d'acquisition de données. Pour ce faire, il adopte d'embléela nouvelle perspective halieutique "élargie" (apparue quelques années plustôt au Sénégal et ailleurs) et cherche en plus à suivre une méthodologie decollecte véritablement intégrée, de façon à minimiser les coûts et à gagneren possibilité de croisement de l'information. Ce sont ces choix qui président à la conception et à la réalisation (en 1987) d'une lourde enquête dite"préliminaire". Cette enquête, déployée sur 45 zones-échantillons (sur unepartition du Delta totalisant 247 zones), conduit à la visite de plus de 330villages et campements de pêcheurs, au sein desquels près de 2000 ménages(sélectionnées par échantillonnage systématique) vont subir un questionnaire approfondi, qui concerne tant leurs caractéristiques démographiquesque leurs activités agricoles ou halieutiques. Le plan de sondage (Morandet al. 1991 ; Laë et al. 1994) comporte plusieurs degrés: strate, zone, agglomération etc. Après cette première phase d'acquisition, organisée sousforme de tâche collective et pluridisciplinaire, les chercheurs des différentesdisciplines ont mené durant un à trois ans des enquêtes beaucoup plusspécialisées, prenant généralement la forme de suivis de panels de villagesou de ménages, et centrées autour de questions propres à leurs thèmes deprédilection.

A l'issue de ce projet, les chercheurs rédigent un ouvrage de synthèse(Quensière ed.sc., 1994) où ils recommandent notamment la mise en placed'un organe de suivi permanent. Il s'agit cette fois de concevoir un dispositif de collecte durable (donc léger) que les institutions nationales maliennespourront maintenir. L'objectif prioritaire n'est plus d'approfondir la connaissance sur le fonctionnement de la pêche, mais de détecter les tendances

2INRZFH : Institut National (malien) de la Recherche Zootechnique, Forestièreet Hydrobiologique, intégré en 1989 à l'lER (Institut d'Economie Rurale).

54

évolutives et les changements qui affectent ce secteur au fil des années, etd'en informer (par un processus de restitution périodique) les instances dedécision régionales et nationales (Morand et al., 1997).

Tenant compte des acquis des recherches pluridisciplinaires menées durant les années précédentes, le nouveau dispositif est organisé de façon àpermettre une géoréférenciation très complète de l'information collectée. Ils'agit en effet de mieux apprécier l'évolution interannuelle des modalitésdu déploiement spatial de l'activité halieutique (migration saisonnière desfamilles, rayon d'action journalier des pirogues, répartition spatiale des dispositifs fixes ... ). Car ce déploiement, qui revient de facto à un partage del'espace (et donc de la ressource), conditionne tout autant qu'il traduit ladynamique de l'activité productive. Par contre, on a renoncé (pour raisond'économie de moyens) à une couverture exhaustive pour mieux concentrerl'effort d'enquête sur trois zones considérées comme illustratives de la diversité des situations de la pêche dans la région. Ces trois zones totalisent410 km 2 , rassemblant 13 villages et 57 campements de pêcheurs.

La mise en place du suivi de la pêche sur ces trois zones a commencé parl'identification d'un modèle de données, dans lequel apparaissent 12 typesd'unités d'observations (ou entités). Chacune de ces unités d'observationcorrespond à un type de regard porté par l'observateur sur un objet physiqueou sur une action du monde réel. Bien sûr, ces regards ne méritent pas forcément d'être renouvelés de façon systématique ni avec la même fréquence.C'est pourquoi les unités d'observation sont hiérarchisées en fonction de lafréquence avec laquelle on souhaite les produire (fig. 6). Par ailleurs, lesentités ou unités d'observation ne sont pas, en général, indépendantes lesunes des autres. Beaucoup sont structurellement liées par des formes dedépendances hiérarchisées: ainsi, l'observation d\l11 individu-poisson (I)ne se fera qu'après avoir effectué une observation sur la globalité du lotde poissons capturés (P), et cette dernière observation prendra elle-mêmeplace dans le cadre de la réalisation d'une observation d'une levée de nasses de barrage (L) ou d'un retour de sortie de pêche (R). Dans ce derniercas, la réalisation des observations (sur les retours de pêche) est elle-mêmesubordonnée à une enveloppe encore plus large: l'observation (pendantune demi-journée) de l'activité variée qui se déroule sur et autour d'unsite de débarquement (S). C'est seulement après avoir identifié ce modèlec'est-à-dire après avoir précisé les types d'unités d'observation qui le composent, les différentes fréquences d'observation souhaitables, les relationsstructurelles entre ces unités - que l'on passera à l'étape de la définitiondes modes appropriés de recensement ou de sondage.

55

rREQUENCE du RECUEIL dc l'INFORMATION

fi :"une fois f,: une à Iroi~ f,: périodicité f,:aussi soul'elll

UNITES D'OIlSERVATION

(entités du modèle de donllées)

pour toutes, ~u fois p~r ail,

début du projet" Cil référellce

à une saisoll.

bimcstrielle

fixe

que possible,

lorsque k

moment est

f~\'orabk,

A 1: sites d'agglo, (cadrage initial)

Al: état d'occupation d'une agg\o

M2:activités de péclle d'un ménagcdepuis une semaine

M3:activités de valorisation d'unménage depuis Ulle selllai~e

Il: dispositifs de pêche fixe(barrages)

L: levées des nasses de barragc

S: sites de débarq, (activités sur)

R:, sorties de pêche (au retour)

C: sites de pêche collective

J: jours de pêche collcctivc

P: lots de poissons capturés

-- -- --0-· --- ------ -------- -- -- -- ------ -- ---- -- -. --. ----- -- -- --.-. ---.- -- -..

-- ------ ------ .-.--- -- -- -- --- -- --.- - -- -. -0-- -- --..----- -' ..--.

· ----. -- -- -----. -- -- ---. -. -- -- -.-- ---- -... --.- ...--0------ -.....---- -. -- ---

----.-------.---.------------ -- ---.-- .----. ---. --·-Ll· -- -- --.----------- ----.

· -----.---.-----.-.--- o. --0- -- .... -- -- -- -- -- -. -- .. -- -- -. --.- -- ---- -. -...

-.----------- ----------.---.----------- ------ ------ -- -.-. ---------- -- -- 'il-- ..-

----------------. --.-.----------.---------- -------- .--- ------ ---------- 'il. ---.

--- -- ------ -- -- --.-.- -- .--. -- ----.- -- -- ------ ..-"' .. -. -. -- -- -- -- -- --··6· --.-

·--. ---- --.-. --. ---. -- -- -- -- -- -0 ---- -- --.- .. -- --.- -- -- ---- ------ ---..--- -- -.-

-----.---------.----- ---- ------ .----. ------ --. --' ---- --.-------------. 'il --.-.-

.-.-------.----.-----------.------- -- -- --.----------- ----·----·----0 ou 'il--

_1:_in_d_i\_·id_u_s-,-.p_o_is_SO_ll_S ._-._--_--_--_--_--_--_--_--_--_.-_-._--_--_--_--_--_--_._--_-._--_--._._.-_.-_-._--_-._--_--_--_·-_--_--_6_--_--_.__.-J

Figure 6

Fréquence Ji de réalisation des diJfàents types d'opérations de l'ecueil

d'information pour le suivi de la pêche au Mali. Les modes de sélection des

unités sont indiqués par les signes 0, D.. ou \l, selon le codage suivant:

en 0 : pas de sélection,. il s'agit d'un recensement, qui a lieu à la fréquence indiquéepm' la colonne ,.

en D.. sélection par échantillonnage misonné ,.

en \l sélection par échantillonnage aléatoire ou systématique.

Remarque .- le signe (0, D.. ou \l) ne décrit que le mode de sélection utilisé

pour le type d'unité correspondant à la ligne, et il ne faut pas oublier que le mode

de sélection utilisé pour le type d'unité de niveau supérieur (en termes de niveau

d'organisation de l'information) peut être tout à fait diffërent - c'est même très

souvent ce qui se produit.

56

Selon nous, cette évolution dans la façon de concevoir une enquête, quiconsiste à placer en préalable la définition d'un modèle de don nées clair, estrendue nécessaire par l'accroissement de la complexité de l'iilformation collectée - en rappelant que cet accroissement est lui-même une conséquence del'élargissement (évoquée plus haut) du champ problématique de l'halieutique scientifique. Une telle évolution s'accompagne aussi de nouveaux pointsde vue dans la façon d'aborder la phase de traitement et de restitutionde l'information: en l'occurrence, il semble que le défi prioritaire ne soitplus aujourd'hui de parvenir à une estimation extrêmement précise de deuxparamètres quantitatifs, mais consiste plutôt à trouver la manière la plusefficace de résumer une grande masse d'information hétéroclite. Concrètement, il s'agit de faire en sorte que les résumés produits soient présentésde façon à favoriser la perception des variations tem pol'elles par un publicélargi, c'est-à-dire comprenant non seulement des scientifiques, mais aussides gestionnaires et des techniciens. Pour cela, une réflexion particulièredoit être développée pour mettre au point des formats de restitution lisibles (graphiques, tableaux, fiches descriptives ... ) en exploitant au mieuxles possibilités du support de diffusion employé, qui peut être un bulletinpapier périodique ou un site internet régulièrement mis à jour. Le motd 'obseTvatoire convient bien pour qualifier cette façon très intégrée de concevoir l'ensemble du processus recouvrant l'acquisition de l'information, sontraitement puis sa diffusion vers des destinataires extérieurs (Chavance etDiallo, 1997 ; J\!Iullon et Piron, ce volume). Ce renouvellement de la méthode de production et de restitution des données scientifiques semble entous cas nécessaire pour que puissent émerger en halieutique de nouvellesthéories et pratiques gestionnaires, renonçant à d'illusoires optimisationspour mieux favoriser la dynamique de réponse des pêcheries aux changements de leur environnement.

Conclusion

Les trois pêcheries données en exemple permettent d'illustrer l'évolutionrécente des méthodes d'enquête dans le domaine des pêches artisanales tropicales. Il s'agissait plus précisément de montrer comment on est progressivement passé de systèmes de collecte 'monolithiques' focalisés sur la seuleestimation des efforts et des captures (cas du Ghana) à des systèmes plusmodulaires et mieux à même de prendre en compte les multiples sources devariabilité propres aux pêcheries artisanales (cas du Sénégal). On termineenfin avec l'expérience malienne qui démarre sur l'essai d'une méthodologied'acquisition très intégrée pour aboutir à la mise en place d'un observatoirepermanent défini comme un outil de gestion. Il faut rappeler cependant

57

que bien d'autres pôles de recherche africains en halieutique ont participé

et participent encore à cette évolution, notamment en Côte d'Ivoire et enGuinée-Conakry.

Bien sûr, la présentation en des termes aussi brefs de nombreuses annéesde travaux ne peut qu'être schématique. Il serait tout aussi faux de dire queles problèmes de structure de l'information étaient inconnus il y a quelques

années au Ghana que d'affirmer que les questions d'estimation inférentiellene se posent plus aujourd'hui au Mali. C'est plutôt l'ordre de traitement des

problèmes qui a changé, avec une attention nouvelle accordée aujourd'huià des aspects qui restaient autrefois dans l'ombre.


Banerji S.K. (1974) : Fisheries statistics in West Africa. FAO, Rome WS/EïlOO.

Caddy J.F and G.P. Bazigos (1985) : Practical guidelines for statistical monitoringof fisheries in manpower limited situations. FAO Fish. Tech. Pap. (257) :86 p.

Chavance P. et A. Diallo (1997) : Un observatoire des pêches. Pourquoi et comment? pp. 19-26 in "J'vlethodes d'Etudes des Systèmes Halieutiques etAquacoles". Ferraris .1., Pelletier D. et Rochet M.J. eds sc., Colloques etSéminaires, Orstom.

Daget J. (1949) : La pêche dans le Delta Central du Niger. Journal de la Sociétédes Africanistes, 19(1) : 1-79.

Daget .1.(19.54) : Les poissons du Niger supérieur. Dakar. Mém. IFAN, 36, 391 pp

Durand .J.R., J. Lemoalle, J. Weber Eds. (1991) : La recherche face à la pêcheartisanale. Col. Colloques et Séminaires, Orstom. 1070 p.

Ferraris J. (1995) : Démarche méthodologique pour l'analyse des comportementstactiques et stratégiques des pêcheurs artisans sénégalais. In "Questionssur la dynamiques de l'exploitation halieutique", F. Laloë, H. Rey et J.L.Durand Eds, Colloques et Séminaires, Orstom, pp 263-293.

Ferraris J. and ICA. Koranteng (199.5) : Statistical analysis of canoe fishery datain Ghana with particular reference to sardinellas. In "Dynamics and useof sardinella resources from upwelling of[ Ghana and Côte d'Ivoire", F.X.Bard et ICA. Koranteng Eds. Colloques et Séminaires, Orstom, pp 205-222.

Ferraris J., B. Samb et l'vI. Thiam (1995) : Les statistiques de pêche au CRODT:description des systèmes de collecte et de traitement des données. In ":Méthodologie d'évaluation des ressources exploitées par la pêche artisanale auSénégal". M. Bary-Gérard, T. Diouf et A. Fonteneau Eds, Colloques etSéminaires, Orstom, pp 73-94.

.58

Hoenig J.l'vl. et G. A. Chouinard (1993) : Quelques suggestions pour l'échantillonnage des pêcheries artisanales avec référence particulière à la pêche Sénégalaise. pp. 95-103, in L'évaluation des ressources exploitables par la pêcheartisanale sénégalaise Eds M. Barry-Gérard, T. Diouf et A. Fonteneau, Colloques et Séminaires, Orstom95-103.

Koranteng K. (1982) : Schemes for collecting catch and effort data for the estimation of fish production in the marine fisheries sector in Ghana. FRUB,Information Report, N 22, Tema.

Laloë F. (198.5) : Etude de la précision des estimations de captures et prises parunité d'effort obtenues à l'aide du système d'enquête de la section "Pêcheartisanale" du CRODT au Sénégal. Doc. Scient. Cent. Rech. Océanogr.Dakar-Thiaroye, N 100, 36 p.

Laloë F. (1992) : Collecte d'information sur la pêche artisanale au Sénégal. pp.37-44 in Séminfor 5 "Statistique impliquée". Laloë ed. sc., Colloques etSéminaires, Orstom.

Laurec A., Leguen J.C. et S. Frontier (1983) : Collecte de l'information pourune gestion rationnelle des stocks halieutiques. pp. 383-415 in "Stratégied'échantillonnage en écologie", S. Frontier ed.sc., Masson et Les Presses del'Université Laval.

Laë R., P. lvlorand, C. Herry et J.Y. Weigel (1994) : IvIéthodes quantitatives:échantillonnage et traitement des données.pp. 449-4ïï in "La Pêche dansle Delta Central du Niger", J. Quensière ed. sc., IER-ORSTOM- Karthala,495 pp.

i'vlorand P., J. Quensière et C. I-Ierry (1991) : Enquête pluridisciplinaire auprèsdes pêcheurs du Delta Central du Niger: plan de sondage et estimateursassociés. in Seminfor IV "Le transfert d'échelle". ORSTOM editions. pp.195-211

Morand P., Y. Poncet et T. Niaré (1997) : Le montage d'un Système de Suivi de laPêche dans le Delta Central du Niger. Intérêt et application de l'approche"système d'information". pp. 27-32 in "Methodes d'Etudes des SystèmesHalieutiques et Aquacoles". Ferraris J., Pelletier D. et Rochet M.J. eds sc.,Colloques et Séminaires, Orstom.

Mullon C. et M. Piron (1997) : Sur la méthodologie de mise en place des observatoires socio-économiques. P.V. du Congrès de l'ASU, Carcassonne, 1997.

Quensière J. (1991) : Systémique et pluridisciplinarité: l'exemple du programmed'étude de la pêche dans le Delta Intérieur du Niger. in Seminfor IV "Letransfert d'échelle". ORST01'vl editions. pp. 475-492

Quensière J. (1994) : La Pêche dans le Delta Central du Niger, J .Quensièreed.sc.,IER-ORSTOlvl-Karthala, 49.5 pp. Paris .

.59

Shimura T. (1980) : Système normalisé d'enquête statistique des pêche à l'usagedes pays côtiers clu COPACE. Projet COPACE, décembre 1980.

Weber J. (1982) : Les enquêtes socio-économiques au Centre de Recherche Océano-;

graphique de Dakar-Thiaroye. Arc. Cent. Rech. Océanogr. Dakar, N 110,87 p.

60

Sur la méthodologie de mise en place desobservatoires socio-écononliques

Introduction

Christian Mullona Marie Pironb

De nombreux projets d'observatoires se montent actuellement pour produire une information scientifique plus pertinente dans des domaines aussi divers que la climatologie, le suivi de la pêche ou la socio-économie.Il s'agit de permettre aux politiques, aux décideurs ou développeurs, dedisposer régulièrement et rapidement de séries d'indicateurs à même deles informer sur les réalités qu'ils gèrent et de leur fournir les élémentsnécessaires à toutes prises de décision ou interventions. Parallèlement, leschercheurs et chargés d'études trou vent dans les observatoires, l'occasiond'approfondir une méthodologie permettant d'appréhender une réalité complexe nécessitant une approche à la fois dans le temps et sur plusieursniveaux d'observation, à même de mieux servir des évaluations et une démarche prospective (Piron, 1996).

Ce qui est spécifique d'un observatoire, en tant que système d'information, réside tout autant dans la nature diversifiée des informations qu'ilrassemble que dans les procédures qu'il met en jeu. En effet, les informations regroupées sont bien souvent de nature statistique, collectées suivantdes protocoles, la plupart du temps explicites, de recueil et d'estimation,et sont sont dotées par là même de propriétés de représentativité, de pertinence ou d'exhaustivité. Par ailleurs, les procédures mises en œuvre, visenten même temps à définir un cycle rapide du recueil à la publication des données et à instaurer un processus cumulatif de la connaissance. Il se posealors un problème délicat de méthodologie, en particulier de méthodologiestatistique, d'une part pour produire les indicateurs pertinents et d'autrepart pour valoriser et conserver l'information recueillie. Aussi, avant laquestion de l'aide à la décision, question a priori cruciale, c'est celle de

a Laboratoire Ermes-Orstom, 5 rue du Carbone, Orléans FrancebCentre Orstom de Petit Bassam, 04 BP 293, Abidjan Côte d'Ivoire

l'aide à la connaissance qui est essentielle, et donc les questions relativesaux procédures appropriées de gestion, de mise en valeur et de restitutionde l'information qui en font de la connaissance.

La notion d'observatoire est de plus en plus souvent invoquée et ce n'estpas toujours sans effet de mode. Cependant, nous pensons que l'approfondissement du concept même d'observatoire peut être mis à profit etutilisé pour dégager une méthodologie applicable à de nombreux projets deproduction systématique de statistiques; ceci, en tenant compte d'apportsspécifiques des nouvelles technologies et en s'appliquant à préciser ce quirelève de la (( méta-information )), c'est-à-dire des moyens de représenteret mettre à jour l'information sur l'information (Tarradellas, 1997). La(( méta-information )) est un des thèmes de recherche émergents dans lesrecherches en méthodologie statistiq ue.

Notre analyse et nos propositions s'inscrivent par conséquent dans lasuite logique de la communication de P. Morand et J. Ferraris sur la mise enplace d'observatoires des pêches artisanales dans les pays en développement(Morand et Ferraris, 1998) et dans celle de M. Passouant sur l'élaborationdes systèmes de suivi-éval uation pou l' cen t raliser, capitaliser, redistri buerdes informations statistiques concernant le développement agricole dansla vallée du fleuve Sénégal (Passouant, 1998). En effet, on retrouve deséléments de la problématique qu'ils présentent dans de multiples domainesde l'observation scientifique dans les pays en développement. Une histoireparallèle pourrait être ainsi écrite à propos de la mise en place de dispositifspermanents d'observation dans le domaine des pêches et dans celui desconditions de vie des populations. Des problèmes comparables, quelque soitle domaine d'application, se posent dès lors que l'on cherche à concevoir, àgérer et à restituer une information très diversifiée et dont la structure estde plus en plus complexe et hétérogène.

En référence à nos expériences en la matière dans divers pays en développement et plus particulièrement dans le domaine des sciences sociales,nous cherchons à dégager ce qui nous semble être spécifique d'un observatoire d'une part, à présenter les problèmes méthodologiques que leur miseen place soulève d'autre part et enfin à proposer quelques éléments potentiels de solution. Ceci nous amène alors à formuler des questions sur lasignification de certains concepts de la théorie statistique et à s'interrogersu l' l'évol ution du rôle des statisticiens.

62

Exemple d'un observatoire socio-économiqueEnquêtes Légères Auprès des Ménages du Bénin (ELAM)

Pour illustrer notre propos, nous nous appuierons sur un exemple demise en place d'un observatoire socio-économique au Bénin, le programme(( Enquêtes Légères Auprès des .tvlénages : ELAM )} (INSAE, PNUD, 1993)initié en 1990 par l'INSAE et le PNUD du Bénin. Cet observatoire vise àréaliser le suivi des caractéristiques et comportements des ménages urbainsen situation d'ajustements structurels et s'inscrit directement clans les Programmes d'Ajustement Structurel lancés sur l'Afrique sub-saharienne parle Fonds Monétaire Internationale (FIvII) dans les années sa.

Face à la crise économique et sociale de ces années là, dont l'un desaspects les plus visibles, notamment au Bénin, a été le retard de paiement des salaires des fonctionnaires et la compression des effectifs dans lesentreprises publiques, les programmes d'Ajustement Structurel visent à relancer l'activité économique et notamment celle du secteur privé, à assainirle secteur public et à rééquilibrer le budget de l'Etat. Leur mise en place aété accompagnée d'importants clispositifs d'enquêtes pour mieux mesureret com prend re les conséq uences économiq ues et sociales cie l'aj ustement. Ils'agissait à la fois de produire des séries régulières et fiables de statistiquesadministratives dans les domaines de la santé, la nutrition, l'éducation,l'emploi, etc., et d'étudier l'impact des mesures d'ajustement macro-économiques sur les infrastructures économiques et sociales et sur les ménages.On citera en particulier les enquêtes sur les conditions de vie des ménages,(( Living Standard IVleasurement Study (LS.tvlS) )} ou (( Dimension Social del'Ajustement (DSA) )} initiées par la Banque fvlondiale. Or l'exploitation deces enquêtes, lourdes, sophistiquées et coûteuses, multi-objectifs et multiniveaux, n'a pas été pas à la hauteur des espoirs attendus et s'avère nepas répondre aux objectifs prévus. Cela provoqua par contre-coup un renouveau de la réflexion sur les observatoires et les enquêtes légères, et ilest apparu alors nécessaire de doubler, de faire suivre ou de faire précéderces opérations par des enquêtes plus légères contribuant ainsi au développement des observatoires comme alternatives et non plus comme complémentsdes enquêtes lourdes (Charmes, 1992).

Ce constat a amené à orienter le dispositif ELAIvl vers des objectifs etdes recueils de don nées plus modestes, tant au niveau des échan tillons quedes critères à retenir, permettant ainsi d'une part d'élaborer, rapidement,un système de suivi d'indicateurs sur j'évolution économique et sociale dela population et des groupes qui la composent et d'autre part de maîtriserl'évolution du dispositif dans le temps et de le pérenniser de fait. Ce dispositif fonctionne autour de trois personnes permanentes depuis la création

63

de l'observatoire, de deux ou trois experts et d'une vingtaine d'enquêteurset superviseurs au moment des enquêtes. Il en est à son dixième passage,affinant et affirmant, au fur et à mesure des passages, sa méthodologie. Ilcompte, à partir de 1995, deux passages par an sur un échantillon partiellement renouvelé tous les deux passages. L'échantillon initial était composéd'individus appartenant à des groupes a priori vulnérables (400 ménages lapremière année) et qui répondaient à des questionnaires spécifiques selonleur statut d'activité; le questionnaire initial était composé de cinq modules de base d'environ une quinzaine de questions chacun. Puis l'échantillona été généralisé à l'ensemble des ménages urbains (2000 ménages lors dupassage de 1996 répartis sur les quatre grandes villes du Bénin). Toujoursselon le principe de modules légers, aux modules de base se sont ajoutés desmodules supplémentaires, liés à la conjoncture (réfugiés du Togo, dévaluation du franc CFA en 1994) ou à partir d'une demande ou d'un aspect socialprécis qu'il s'agit d'approfondir (dépenses des ménages, éducation et scolarisation). Naturellement et inévitablement pour des opérations menées surde longues périodes, la définition des échantillons évolue en fonction des résultats précédents et des réorientations des objectifs des enquêtes. Il en estde même, mais à un niveau moindre, pour les questionnaires. La durabilitéde ce dispositif est due à une souplesse de l'élaboration de l'échantillon età un questionnaire qui évolue naturellement et au rythme du contexte dupassage.

Ce dispositif d'enquêtes, parce que conçu comme une structure légère,fonctionne maintenant comme un observatoire permanent du changementsocial sur le milieu urbain béninois. Il permet d'acquérir une connaissancedes populations concernées par les mesures prises et soumises aux situationsde crise, de mutation, de transition et de mieux comprendre les mécanismesdu changement social, les modifications de comportements économiques etsociaux. Il est considéré comme un instrument au service de l'ensembledes décideurs et des développeurs, qui assure et diffuse, trois mois aprèsla collecte, le suivi des principaux indicateurs économiques et sociaux telsque le taux de sous-emploi, de scolarisation, etc. (INSAE, PNUD, 1993).Un de ses résultats est de faire émerger aujourd'hui la demande explicitepar ces mêmes décideurs et développeurs en question d'une analyse socioéconomique plus approfondie.

Spécificité des observatoires

Le recours au terme d'observatoire pour qualifier les dispositifs de cetype, recours assez systématique aujourd'hui, n'est pas vraiment nouveau;le terme peut s'appliquer à des situations très diverses. Néanmoins, considé-

64

rant le développement actuel des observatoires, aussi bien dans les domaines

de la socio-économie, de la pêche, de la gestion des ressources naturelles, dela dégradation des sols ou des évolutions climatiques, il ressort, selon nous,que ce qui en est spécifiq ue, en tant que système cl 'in formations statistiq ues(f.-Œullon et Boursier, 1994), est de mettre l'accent tout à la fois sur lapermanence du système, la pertinence de l'information en fonction d'unproblème précis, un cycle court entre le recueil et la production, l'ouverturedu dispositif vers un public élargi.

La permanence du système

U ne constante des observatoires réside dans le caractère durable, répétitif, cumulatif du dispositif mis en place pour le suivi des observations et del'information, pour la production régulière de séries d'indicateurs.

La périodicité des opérations de collecte et de restitution peut varier enfonction du domaine d'étude et des unités d'observation et la référence à unpanel n'est pas obligatoire. C'est le cas par exemple du dispositif ELAMqui porte su r l'observation de ménages et renou velle son échan tillon tousles deux passages. La périodicité de ce dispositif a été annuelle les troispremières an nées puis est deven ue bisan nuelle.

La notion de permanence implique des notions de capitalisation et devalorisation des données. Sur le plan de la mise en œuvre cela pose laquestion de la mise en œuvre d'un processus cumulatif d'ulle informationd'abord homogène, puis, bien souvent, de plus en plus diversifiée. Sousquelle forme faut-il conserver l'information? dans l'état dans lequel elle aété collectée? dans celui de sa restitution? dans un état intermédiaire?Ainsi, mettre en œuvre un observatoire demande de concilier deux exigencesparfois contradictoires: dans un premier temps, celle d'assurer le suivi desdonnées, et, dans un deuxième temps, celle d'assurer la conservation desdonnées.

La pertinence de l'information en fonction d'un problème précis

Un observatoire couvre un domaine précis et limité et vise à en produire des indicateurs sur l'évolution. Cette notion d'indicateur est essentielle ; c'est en focalisant les objectifs d'un observatoire sur la productiond'indicateurs que l'on évite de se lancer dans des opérations de conservationet de capitalisation tous azimuts.

Dans le domaine socio-économique, l'exigence conjointe de pertinenceet de permanence se traduit par la nécessaire prise en compte du caractère

65

évolutif des indicateurs. Il est parfois nécessaire de réajuster la définitiond'un indicateur; la souplesse dont il fait preuve à cette occasion est uncritère essentiel de sa fiabilité et de sa pertinence. Dans le cadre ELAM, desindicateurs ont été révisés voire supprimés compte tenu de leur caractèreinadapté ou peu fiable ; de même les populations d'étude ont égalementété modifiées lorsque l'on a abandonné la notion de groupes vulnérables,finalement moins justifiée, pour cibler la population urbaine du Bénin.

U 11 cycle court

Une des exigences d'un observatoire est d'instaurer un cycle court, del'ordre de quelques semaines à quelques mois dans le domaine socio-économique, entre le recueil des données et la production d'indicateurs', ceci afinque l'information ne devienne pas obsolète et puisse apporter une aide àla décision. C'est ce qui fait réellement la différence entre un observatoireet d'autres systèmes d'information statistique comme les dispositifs lourdsd'enquêtes intégrées. C'est aussi ce qui permet d'assurer la permanencedu dispositif. Dans un observatoire, des bulletins restituant l'informationattendue sont mis à disposition relativement rapidement. Pour ELAM parexemple, la diffusion des résultats sous forme de tableaux standardisés etautomatisés d'indicateurs prioritaires a lieu, deux fois par an, trois moisaprès la collecte.

Néanmoins, il arrive un stade où l'on a besoin d'informations plusfines et d'analyses plus approfondies pour valoriser autrement la massed'information accumulée et réfléchir sur la pertinence des indicateurs. Bienentendu, cette dernière phase ne doit pas être pour autant négligée, mais ilne faut pas trop l'anticiper.

L'ouverture du dispositif

Un observatoire doit être ouvert et s'adresser à un public ciblé et diversifié, composé à la fois des développeurs, des politiques, des chercheurs, dugrand public. Il doit offrir différents niveaux d'approche, allant de la consultation d'indicateurs synthétiques jusqu'à l'examen des données d'enquête.Pour favoriser sa permanence, il est souvent souhaitable qu'un observatoiresocio-économique s'inscrive dans un réseau impliquant des structures nationales, et du même coup une forme d'ouverture vers un public spécifique.

Cette ouverture du dispositif va de pair avec le cycle court et une diffusion rapide des résultats. Là encore, la volonté de fournir et diffuser nonseulement les résultats, les synthèses mais aussi des éléments sur les données

66

brutes ayant servi à les établir est preuve d'une volonté de valorisationdes données. On peut penser aussi que plus les résultats seront utiliséspar un public diversifié d'experts, de chercheurs ou de journalistes, plus lapertinence des indicateurs sera vérifiée.

Difficultés de nuse en œuvre des observatoiressocio-économiques

Un certain nombre de difficultés apparaissent alors dans la mise enplace des observatoires, difficultés qui sont trop rarement évoquées dans lesrapports de prospective et d'évaluation auxquels les projets d'observatoiredonnent lieu.

Les constats développés ci-après viennent de notre expérience qui concerne les observatoires socio-économiques, où, nous semble-t-il, les conceptsutilisés recouvrent une réalité particulièrement complexe et où leur interprétation n'est pas exempte de subjectivité. Dans les domaines de recherchecomme l'hydrologie, la climatologie, l'écologie ou l'épidémiologie, un besoinancien d'informations structurées a cond uit au développement de méthodesadaptées de recueil, de traitement et de synthèse et, aujourd'hui, un accordexiste sur la nature et le contenu des indicateurs pertinents qui apparaissenten quelque sorte immédiats. Néanmoins, nous pensons que les difficultéspropres aux observatoires socio-économiques se retrouvent dans les autresdomaines d'application des observatoires, même si elles y sont moins saillantes.

Ces difficultés consistent en ce que dans la mise en place d'un observatoire, il faut tout à la fois, tenir compte de l'évolution de la nature desphénomènes étudiés, prendre en compte l'hétérogénéité des informations etde leurs sources et faire face à l'ambiguïté du circuit d'information.

Tenir compte de l'évolution de la nature des phénomènes étudiés

Dans un observatoire socio-économique, les unités d'observation ou lesnomenclatures doivent pouvoir évoluer, les bases d'échantillonnage ne sontpas stables, les demandes des utilisateurs changent souvent. Il y a undilemme entre, d'une part, la nécessité de fixer, au moins pour une périodedéfinie, les unités statistiques afin de pouvoir les comparer dans le tempset, d'autre part, l'évolution rapide des structures des phénomènes étudiésqui imposent de prendre en compte de nouvelles unités. En effet, par définition, un observatoire est conçu pour saisir les évolutions et les changements et s'adapter à cela. Or, on ne coordonne pas facilement les processus

67

d'accumulation de l'information et le processus de restructuration.

Ainsi, en période de crise, l'instabilité sociale est très importante entraînant des changements socio-économiques rapides. On représente l'évolutiondes phénomènes en termes de catégories qui, si elles sont pertinentes aumoment de leur mise en place, deviennent assez vite obsolètes et caduques.C'est le cas, par exemple, des nouvelles catégories d'emploi, stable, précaireou sous-emploi, qui n'étaient pas prévues à l'origine et dont l'intégrationdans les dispositifs d'observation socio-économique s'est révélée nécessaire,il y a seulement cinq ans.

Cette évolution des catégories conduit nécessairement à un glissementdes unités d'observation: le concept de ménage, unité de base et deréférence pour beaucoup d'enquêtes socio-économiques, a été largementrévisé durant les dix dernières années, la crise ayant hiérarchisé autrementla place des différents membres de la famille face aux activités. Cet incontournable problème de l'évolution des unités d'observation est certainementle plus délicat, le plus difficile à résoudre avec les méthodologies statistiquestraditionnelles.

Prendre en compte l'hétérogénéité des informations et de leurssources

Un observatoire, pour produire les indicateu rs et réaliser des éval uations, doit pouvoir intégrer des informations prod uites par d'au tres organismes selon des protocoles très variables et à des échelles différentes etpouvoir com parer ou mettre en perspective ces informations. li n 'y a pas,dans ce cas, de contrôle possible de la structuration de l'information. Onpeut prévoir des procédures standardisées d'intégration. Mais là encore,la diversité des situations, leur renouvellement permanent empêche de lesdéfinir et de les mettre en place de façon opérationnelle. li y a une réelle difficulté à devoir intégrer et restructurer une information que l'on ne maîtrisecomplètement ni dans sa structuration ni dans sa production.

li faut pouvoir également concilier des informations de nature et deformes différentes, comme des données statistiques issues d'enquêtes ou dedonnées administratives mais aussi des données textuelles comme des monographies, des bases documentaires, des rapports. Dans l'exemple de l'étudedes secteurs d'activité dans les pays en développement, le secteur informel,part importante de l'activité, échappe par nature aux statistiques administratives et à toute base de sondage; il doit faire l'objet d'une analyse propre,laquelle est souvent basée sur des recoupements entre des informations aussidiverses que des enquêtes quantitatives, qualitatives ou des rapports.

68

Faire face à l'ambiguïté du circuit d'information

Les difficultés d'ordre institutionnel et organisationnel sont loin d'êtrenégligeables et conditionnent la mise en place et la réussite d'un observa

toire.

En effet, le rôle entre les différents acteurs du processus de la prod uctionde l'information est souvent mal établi. Il s'instaure trop souvent unedivision du travail préjudiciable entre les personnes chargées du recueil etcelle chargées de l'exploitation puis de la valorisation de l'information. Acela s'ajoute souvent une rotation importante des responsables qui porteun préjudice sérieux à la continuité et donc à la permanence du dispositif.

Un autre problème réside dans la difficulté à faire circuler l'informationd'une manière générale c'est-à-dire entre instituts mais aussi à Fintérieurd'un même institut et ceci pour diverses raisons. Ceci représente un véritable handicap dans le montage et la permanence d'un observatoire.

Besoin de méthodologie

Difficultés

Pour accompagner alors la mise en place des observatoires, émergeactuellement le besoin de définir une méthodologie qui permet de conciliertoutes les spécificités des observatoires avec leurs difficultés ce qui correspond à un véritable défi. Il faut en effet pouvoir concilier:

• permanence et évolution du système, c'est-à-dire gérer l'accumulationet la restructuration des données.

• pertinence et hétérogénéité des données: un observatoire peut vitedonner lieu à une base de données volumineuse, de plus en plus complexe et, du coup, inexploitable, ne satisfaisant plus au critère depertinence de l'information.

• rapidité et q'Ualité de la production: il [au t être à la fois rapide dansla restitution et prendre aussi le temps de réfléchir sur les bons indicateurs ce qui nécessite une phase d'analyse plus approfondie.

• objectifs d'action et de recherche: ces derniers son t explici tes dans lediscours, mais ne sont pas toujours pris en compte dans les faits. ilapparaît que les demandeurs ne sont pas impliqués ou ne s'impliquentpas toujours dans les choix des indicateurs et dans les résultats, ce

69

qui crée un risque de décalage entre le système d'information et ceque l'on en attend .

• besoins actuels et besoins flLturs : de fait, il faut tenir compte de ceque, sur le marché de l'information, l'offre anticipe souvent la demande.

Limites de la méthodologie statistique

Pour définir une méthodologie adaptée aux contraintes et aux exigencesdu système d'information compte tenu des difficultés énoncées ci-dessus,on se réfère, classiquement, à une méthodologie statistique qui préconise,à partir d'objectifs précis, une analyse préalable du système d'informationvisant à définir les unités d'observation, les protocoles de recueil, le contenudes bulletins, etc., et sinon à les figer une fois pour toutes, du moins à enlimiter les possibilités d'évolution.

Or dans la pratique, notamment dans le domaine des observatoiressocio-économiques, ces protocoles de recueil des données semblent inadaptés à la mise en place d'observatoires. Le compromis qu'ils permettent entrela complexité du dispositif de recueil d'informations et la représentativitédes conclusions que l'on peut en tirer, est bien difficile à atteindre. Eneffet, lorsqu'ils sont adaptés à la complexité de la situation et à la multiplicité des questions que cette situation engendre, lorsqu'ils cherchent àanticiper l'analyse de ses évolutions, ces protocoles conduisent à des enquêtes statistiques, avec plusieurs passages et intègrent, au sein d'un mêmequestionnaire, une multitude d'objectifs à différents niveaux d'observation,difficiles à exploiter pour des raisons tout à la fois conceptuelles et organisationnelles, et, de ce fait ne répondent pas aux exigences de permanence,de pertinence et de rapidité attribués aux observatoires.

Par ailleurs, ces protocoles tentent de répondre aux principes stricts etrigoureux de la théorie des sondages, ce qui offre, certes, l'avantage d'uneffort méthodique de planification et de contrôle dans l'élaboration du plande sondage mais qui risque de compromettre l'interprétation et la qualitédes résultats. Aussi, plutôt que de s'efforcer à jouer sur une grande précisiondes données et à optimiser celle des résultats, il vaut mieux envisager unecollecte et des traitements prenant en compte explicitement le contextede la donnée recueillie. En effet, nous pensons qu'un protocole établi entoute rigueur statistique est illusoire dans le domaine des sciences socialeset surtout dans les pays en développement où l'on connaît les difficultésde la mise en place des plans de sondage probabilistes nécessaires à touteestimation précise souhaitée. Aussi, plutôt que de s'efforcer à jouer sur

70

une grande précision des données et à optimiser celle des résultats, il vautmieux contrôler et afficher la procédure de collecte prenant en compte lecontexte de la donnée recueillie.

Toutes ces difficultés et contraintes rencontrées dans la mise en placedes observatoires, difficultés et contraintes bien souvent récurrentes auxprotocoles de collecte, sont souvent passées sous silence dans l'interprétationet la présentation des résultats alors que nous pensons qu'elles doivent êtreutilisées de façon positive.

Propositions pour la nnse en place des observatoires SOClO

économiques

Nous proposons, clans le cadre des opérations de mise en place d'observatoires que nous avons en projet, de mettre en œuvre un certain nombrede recommandations, la plupart du temps de simple bon sens, faciles àdéfinir, peu coûteuses à implanter et qui visent, dans le contexte spécifiquedes observatoires, à instaurer un cercle vertueux clans lequel un meilleurusage cles informations procluites aboutit à une amélioration clu systèmed'informations statistiques, en terme cie qualité des données, de rapidité deproduction et d'évolutivité à moyen terme. Ces propositions sont:

• de mettre à la disposition d'un pu blic élargi l'information traitée sousles différentes formes qu'elle prend aux cours des phases de recueil,d'analyse intermédiaire, de pu blication de résultats, ce pu blic ne selimitant pas à celui ciblé dans le projet d'observatoire, mais comprenant enquêteurs, chargés d'études, journalistes, grand public.

• d'associer systématiquement à toute information la description duprocessus qui l'a produite: préciser son auteur, sa date de création,le protocole d'enquête, la source statistique, et faire figurer des carnetsde note, des rapports, etc. On souligne ainsi la nature fondamentalement statistique de l'information en livrant simultanément les données et leur mode d'élaboration c'est-à-dire leur mode d'utilisation.

• d'intégrer dans la base de données la trace des interrogations auxquelles elle a donné lieu. Cela garantit la pertinence et aussi la qualité desinformations consultées et cela permet de savoir quel type de publicse trouve intéressé par tel type d'information.

71

Avantages

Ce que nous attendons ainsi de la mise en œuvre de telles recommandations, c'est en particulier d'améliorer sur trois points essentiels, les observatoires socio-économiques dans les pays en développement. De tellesméthodes permettent, nous le pensons:

• une meilleure sensibilisation des décideurs au contenu de l'informationet à sa nature, une meilleure compréhension de la complexité desproblèmes et une meilleure appréhension de leur niveau de responsabilité ; rappelons que pour un décideur une information prend de lavaleur en fonction de l'intérêt qu'elle suscite chez ses pairs, chez sesadministrés.

• une meilleure intégration et implication des différents participants àla constitution de l'information; permettre aux enquêteurs de consulter les différentes transformations de l'information qu'ils ont recueillie doit aboutir à une meilleure reconnaissance des opérationsde collecte; ils connaissent les informations réellement consultées etpeuvent mesurer la valeur de leur travail, en amont et en aval.

• une meilleure évolution du système d'information, plus souple et naturelle. On peut ainsi envisager des procédures d'extraction d'indicateurs toujours positionnés selon des procédures de restructurationplus ou moins standardisées, plus ou moins automatiques, qui ne figent plus les informations et les types d'informations.

Mise en œuvre

Le principe suivi pour l'élaboration de ces recommandations est de rendre le plus transparent possible l'ensemble du système d'information. J\ouspensons que leur mise en place est rendue possible par les nouvelles possibilités de traitement de l'information en œuvre dans les réseaux d'informationmultimédia. Les systèmes envisagés intègrent une base de données et undocument consu ltable par navigation et prévoient des procéd ul'es au tomatiques:

• d'extraction de l'information, de la base de données au documentconsultable,

• d'intégration, dans la base de données, d'information sur les navigations qui sont faites sur le document consultable.

72

Il s'agit, en premier lieu, d'ajouter à un système d'information existantsous forme de base de données relationnelles, de système d'informationgéographique, ou même d'une organisation plus adaptée comme les systèmes d'informations statistiques (Tarradellas, 1997), un certain nombrede fichiers d'index, décrivant la structure de l'information, sa nature et lesusages qui en sont faits. Les données se présentent alors sous la forme defichiers contenant:

• les informations de base normalisées sous la formecontenué ;

auteur, date,

• des index associés dictionnaires de données, auteurs, sources, protocoles ;

• des données sur les utilisations normalisées sous la forme lecteur,date, navigation.

Il s'agit, ensuite, de mettre en œuvre un certain nombre de procéduresmanuelles ou automatiques, aboutissant à la création cie documents électroniques en ligne. Aujourd'hui, un langage de description de page commeHTML est un standard et différents logiciels de créations de pages HTML possèdent toutes les fonctionnalités pour intégrer des informations produites par les logiciels les plus courants en matière de traitement de texte,d'édition graphique ou de gestion de données. Il est nécessaire, en plus, dedéfinir entre les différentes pages un système de renvois, en fait des boutonsde navigation, autorisant des parcours adaptés aux exigences du public visé.

Il s'agit, enfin, d'observer comment est consulté le document. Les logiciels de navigation permettent de garder la trace des consultations.

Il est bien entendu souhaitable, mais ce n'est pas une condition nécessaire, d'implanter un tel système dans un environnement Internet ou Intranet. Dans les pays en développement, un certain retard en matière detélécommunications demande d'envisager des solutions assez robustes. Ilest à peu près certain que ce retard sera comblé sous peu et que cettecondition pourra alors être satisfaite.

Conclusion: un nouveau rapport à l'information?

A partir de cette présentation des observatoires, de leur spécificité, deleur évolution actuelle, des mesures pratiques à mettre en œuvre, il noussemble que, pour aller plus loin, il est nécessaire de se poser la question del'articulation entre deux points de vue possibles sur les observatoires, l'un

73

relevan t de la théorie statistiq ue, l'autre de la socio-économie de l'information.

Les données d'un observatoire sont essentiellement de nature statistique. Un fait n'est intégré dans la base d'information, non pas en tantque tel, mais parce qu'il est supposé représentatif d'un phénomène qui luidonne toute sa signification. La théorie statistique fournit, à propos, desphénomènes quantifiables, des définitions précises de la représentativité etde la mesure; en retour, elle requiert la mise en place de protocoles.

A J'occasion de la mise en place des observatoires, on appréhende cIefaçon spécifique le problème de la qualité de l'information. Il y a cIeuxfaçons de caractériser celle-ci :

• une façon intrinsèque, relevant cIe la théorie statistique - qelle dessondages en grancle partie -, associant à toute donné des mesures devalidité (des intervalles de confiance) ou cIes qualités d'exhaustivitéet de représentativité. Les techniques associées demandent, pour êtremises en œuvre, un certain nombre cie précautions lors du recueil del'information;

• une façon extrinsèque, relevant de l'économie cIe l'information baséesur l'examen des usages qui en sont faits, sur le coüt auquel les concepteurs ou utilisateurs sont prêts à la facturer, sur les interrogationset les commentaires auxquels elle donne lieu, tant de. la part des concepteurs de l'information que de la part des utilisateurs.

Dans les phases de constitution et cl 'exploitation cl 'un observatoire socioéconomique, nous sommes en permanence confrontés à cette distinction etdevons rendre complémentaires caractérisation intrinsèque et caractérisation extrinsèque de la qualité de l'information. Nous pensons qu'il y a làl'occasion de pouvoir effectivement les mettre en œuvre conjointement. Eneffet, dans nos recommandations, les difficultés rencontrées, mais aussi tousles enseignements de la collecte et la connaissance cIu terrain, qualitatifs etnon quantifiables, les usages de l'information, les navigations auxquelleselle donne lieu, sont explicitement nommés et intégrés dans la base de données, avec l'objectif d'en tirer profit pour améliorer la qualité du systèmed'information.

Au sujet de certains concepts de la théorie statistique

Pour approfondir l'intégration de la méthodologie statistique et de principes de l'économie de l'information, on cIoit s'interroger sur certains con-

74

cepts de la théorie statistique et les rapprocher de certains concepts dela théorie de l'information. On peut essayer, par exemple, d'examiner simultanément les sens que prennent dans ces différents contextes des motscomme pertinence, représentativité, exhaustivité. Dans le cadre de lathéorie statistique:

• une statistique, c'est-à-dire une façon d 'esti mer une caractéristiqueinconnue dans une population à partir de l'observation d'un échantillon de cette population est dite représentative si son espérance estégale à la 'caractéristique inconnue;

• la pertinence d'une statistique a trait à son efficacité: pour une tailled'échantillon donnée, elle fourni t des petites marges d'erreur;

• une statistique est dite exhaustive ou suffisante si elle contient toutel'information sur la caractéristique inconnue qui est contenue dansl'échantillon; tout ce que l'on peut apprendre sur celle-ci à partir del'échantillon, on peut l'apprendre à partir de la valeur de la statistiqueen question.

Il s'avère que ces mots ont un sens différent dans le contexte de la communication d'information:

• une information est représentative d'un phénomène donné si sa connaissance entraîne une partie de la connaissance de ce phénomène;

• une information est pertinente pour la représentation d'un phénomènedonné si sa connaissance coûte peu par rapport à la connaissancequ'elle apporte de ce phénomène;

• une information est exhaustive de la représentation d'un phénomènedonné si sa connaissance entraîne toute la connaissance disponible surce phénomène.

Devant composer entre ces deux aspects, c'est-à-dire entre statistique etinformation, dans notre contexte des observatoires socio-économiques ouverts, et plus généralement dans le contexte des bases de données consultéespar un large public, nous dirons que:

• une donnée est représentative de la demande d'information sur unsujet si elle est souvent consultée dans le contexte de ce sujet;

• une donnée est pertinente pour la demande d'information sur un sujetsi elle est souvent consultée et d'accès rapide dans le contexte de cesujet;

75

• une donnée est exhaustive de la demande d'information sur un sujetsi les avis sont positifs.

Cet intérêt pour la confrontation de différentes significations d'un mêmemot dans des contextes théoriques différents n'est pas vain ; il nous apparaît caractéristique de la démarche interdisciplinaire. C'est en rappelantces significations, en insistant sur leurs différences que l'on saura affronterles réelles difficultés d'organisation dans la mise en place d'observatoiressocio-économiques, principalement celles qui tiennent à l'intégration desstatisticiens dans une équipe dédiée à la production d'informations.

Ces différences de signification sont, selon nous, porteuses de problèmesspécifiques, qu'il reste à formuler explicitement, et de développements théoriques originaux.

U ne autre fonction de statisticien ?

Les possibilités de mise à disposition plus immédiate de l'informationqu'offrent aujourd'hui les systèmes et les réseaux de communication informatiques transforment la nature de la relation à l'information, modifientégalement les divisions du travail mises en œu vre pour sa collecte, sa structuration et sa restitution, et par là même changent les attentes vis-à-visdes statisticiens professionnels. Ceux-ci ne peuvent plus se cantonner dansun rôle d'experts, garants de la représentativité des informations soumisesà leur jugement, garants de l'efficacité et de la pertinence cie protocoles derecueil et de modélisation. Ils doivent analyser les différents processus enjeu dans le développement des bases d'informations en réseau et examiner,de leur point de vue, c'est-à-dire en terme de représentativité, la dynamiquede ces processus.

Il nous semble qu'en abordant la phase de constitution d'un observatoire socio-économique, nous participons à un mouvement plus général quiest celui de la transformation de la fonction de statisticien dans la sociétéet qui a été abordé au cours de la table ronde consacrée, lors du colloque del'ASU de Carcassonne, aux métiers de la statistique. Le rôle privilégié dustatisticien devient de donner de la valeur, du sens, à de l'information. Unstatisticien est ainsi celui qui, en précisant un intervalle de confiance, relativise une donnée brute; celui qui, en examinant un protocole d'enquête,trouve un biais et propose un moyen de le corriger; celui qui, en examinant un pas d'échantillonnage temporel, sait faire la distinction entre unetendance à long terme et une fluctuation à court terme, etc. Après sonintervention, l'information a changé de nature, a pris du sens, de la valeur.Son rôle évolue dans des contextes nouveaux comme celui des observatoires,

76

·-

mais également celui des bases d'informations scientifiques sur les réseauxmultimédia. Nous sommes certains que, pourvu qu'ils ne se cantonnent pasdans une attitude défensive vis-à-vis de ces nouvelles technologies, danscette optique, nous allons assister à une réévaluation du rôle des statisticiens dans l'élaboration de l'information scientifique.


Charmes J., 1992. Les observatoires comme alternative ou complément aux enquêtes lourdes. Projet PNUD BEN/8ï/023.

INSAE, PNUD, 1993. Suivi des caractéristiques et comportements des ménageset des groupes vulnérables en situation d'ajustement structurel, ELAlvI III,1990-1993, ï6p.

P. lvlorand et A. Kodio, 1996. lvlise en place d'un système de suivi de la pêchedans le Delta central du Niger: concepts et méthodes - Centre régional dela Recherche Agronomique de lvIopti, Mali, 1996

P. lvlorand et J. Ferraris 1998. Les systèmes d'enquête des pêches artisanales enAfrique: une co-évolution entre représentation du mondre réel et méthodologie d'observation. Congrés de l'ASU, Carcassonne.

C. lvlullon et P. Boursier, 1994. Éléments pour une analyse critique des systèmes d'information géographiques. Systèmes d'information géographiqueet Analyse spatiale, n 2.

1'1'1. Passouant. 1998. Statistiques et système d'information - Congrés de l'ASU,Carcassonne.

IV!. Piron. 1996. Systèmes d'information et observatoires en sciences sociales: quelimpact sur les démarches de recherche? Cahiers des Sciences Humaines, v.32,11. 4, Paris.

E. 1. Tarradellas. 199ï. lvlétainformation statistique et nouvelles technologies;

Congrés de l'ASU, Carcassonne.

77

78

Aspects statistiques du ciblagedes politiques et programmes nutritionnels

dans les pays en développement

Pierre Traissac a Bernard Maire a Francis Delpeuch a

Des subventions généralisées aux programmes ciblés

Pour maintenir ou accroître les revenus des populations tout en facilitant un meilleur approvisionnement alimentaire, nombre de pays classésparmi les pays en développement se sont orientés vers des programmes delarge soutien à la consommation en subventionnant systématiquement lesprix des denrées de base. Le bilan de ces politiques est cependant mitigé:malgré un certain taux de réussite, ils ont des coûts élevés et entraînent desfuites importantes vers les non nécessiteux.

Les programmes de stabilisation économique et d'ajustement structurel,qui sont plus que jamais à l'ordre du jour, conduisent de surcroît à diminuerde façon parfois rapide les subventions alimentaires lorsqu'elles représententune part significative des dépenses des Etats. Néanmoins, l'ambition de laplupart des programmes d'ajustement économique n'est pas tant d'opérerune simple réduction des dépenses publiques que d'effectuer une véritableréallocation de ressources vers les plus démunis dans les domaines de lanutrition, de la santé ou de l'éducation au travers d'un ciblage efficace(Pinstrup-Andersen, 1991).

Des arguments plus directement d'ordre nutritionnel militent égalementpour la mise en œuvre de politiques et programmes nutritionnels ciblés.En effet, dans un nombre croissant de pays du Sud (pays à revenus intermédiaires et de manière générale dans les grands centres urbains despays en développement), on voit s'amorcer une "transition nutritionnelle",avec émergence d'une population présentant des problèmes de surcharge

aORSTOM ; Laboratoire de Nutrition Tropicale. Montpellier -Centre Collaborateur de l'OMS pour la Nutritioll- BP 5045 34032 MONTPELLIER Cedex 1e-mail: [email protected]

pondérale et des troubles qui y sont liés, alors même que subsistent faim,malnutrition et carences spécifiques, pour une autre partie de la population(Maire et al. 1992; Popkin 1994).

Le contexte du eiblage

De manière générale, qu'il s'agisse de lutter contre la pauvreté ou d'améliorer directement la situation nutritionnelle, le ciblage est un processus quis'inscrit dans un ensemble, par exemple une politique ou un programme;le choix de la population cible et de la stratégie de ciblage ne peut se faireindépendamment de cet ensemble.

Si la nature du ciblage dépend du programme mis en œuvre, la réussited'une politique ou d'un programme est avant tout fonction de la pertinencedes interventions projetées, par rapport aux problèmes identifiés. Ainsi, ence qui concerne l'amélioration de la situation nutritionnelle, le concept évident d'un lien entre malnutrition et pauvreté à un niveau global, a conduittrop fréquemment à une vision réductrice des programmes d'interventionnutritionnelle en les transformant en programmes d'assistance aux pluspauvres. Or, il a été montré, à de nombreuses occasions, que les causes demalnutrition sont complexes, différent selon l'environnement physique, socioculturel ou économique des communautés, des ménages ou des individuset varient dans le temps. Outre les disponibilités alimentaires insuffisantes(quantité, qualité) au niveau des ménages, peuvent être mises en cause lesmaladies infectieuses, l'accès aux soins, la prise en charge insuffisante desmembres vulnérables du ménage etc. Seule une analyse préalable des déterminants des malnutritions et la définition précise du "risque nutritionne]1"dans le contexte étudié pourront conduire à la caractérisation des groupescibles du programme, d'indicateurs pour les identifier, et d'une stra,tégiepour les atteindre.

Stratégies classiques de eiblage

Si le concept même de ciblage s'impose facilement, sa réalisation n'enest pas pour autant une tâche aisée. Son succès dépend en effet des réponses apportées aux questions évoquées ci-dessus: qui sont les personnes àrisque et comment les atteindre? Il n'existe pas de méthodologie simplequi permette de définir immédiatement ces personnes, quel est leur niveau

1 Risque nutritionnel est à prendre ici au sens large, i.e., risque de décès, de maladie, de déficit fonctionnel (capacité physique, immunité, développement mental)ou plus simplement de faim, par suite d'une alimentation insuffisante ou inadaptée.

80

de risque, ni comment on pourra les faire bénéficier d'un programme spécifique, et à quel coût. Faute de réponses toutes faites, les responsablespolitiques peuvent être saisis d'une appréhension légitime lorsqu'ils envisagent des programmes ciblés, malgré les bénéfices espérés. Néanmoins,les expériences accumulées clans un passé récent fournissent aujourd'huides éléments d'appréciation suffisamment variés et nombreux pour être àmême de dresser un tableau assez complet des choix possibles et de leursimplications (Grosh, 1994).

Si l'on excepte les programmes de subvention des produits de base, quicorrespondent pratiquement à une absence de ciblage, tous les autres programmes s'adressent en fait à l'une des deux grandes modalités de ciblage :l'auto-ciblage, par lequel les individus à risque se portent eux-mêmes surun produit ou un service programmé à leur intention, et le ciblage direct deces personnes par le programme lui-même. Dans ce dernier cas, le repéragepeut se faire sur des groupes de personnes comme sur des individus selon lanature du programme: ciblage sur critères socio-économiques de quartiersou de ménages, ciblage des groupes vulnérables tels que femmes enceintesou jeunes enfants, jusqu'au ciblage individuel selon l'état de santé (Maireet al. 1995). En pratique, on utilise souvent les différentes stratégies defaçon combinée: par exemple, ciblage initial de quartiers pauvres, puis, ausein de ces quartiers, ciblage spécifique des femmes enceintes et des enfantsde moins de 5 ans.

Evaluation et mesure de la performance d'une stratégie deciblage

Que ce soit en matière de subventions ou d'interventions alimentaireset nutritionnelles, l'objectif de toute stratégie de ciblage est d'améliorerl'efficacité par rapport aux coûts, en touchant spécifiquement des groupeset/ou des individus à risque. Les critères d'évaluation doivent donc mesurerla capacité du ciblage à inclure la population cible dans l'intervention maisaussi sa capacité à exclure la population non-cible. Les méthodes d'analyseproposées pour l'évaluation du ciblage (Habicht et al. 1984) sont prochesdes méthodes d'analyse de sensi bilité/spécificité et de valeurs prédictivesqui sont utilisées en épidémiologie pour mesurer la performance d'un test dedépistage2 ,les capacités de prédiction d' li ne fonction de risq lie ou encore les

2Si l'on s'intéresse par exemple au dépistage d'une maladie M (M+ : individumalade, M - : individu non malade) au moyen d'un test T (T+ : test positif, T- :test négatif) on a les définitions suivantes: sensibilité du test Se = PtT + /M +)(capacité du test à détecter les malades), spécificité du test Sp = PtT - /M -)(capacité du test à identifier les non-malades), valeur prédictive positive \1 pp =

81

qualités d'un système de surveillance (Dabis et al 1992) . Par analogie, les

ménages ou les individus d'une population concernée par une interventionciblée vers une catégorie à risque peuvent être classés dans un tableau decontingence 2x2 (cf. tableau 1) selon qu'ils sont bénéficiaires (B+) ou non(B-) et à risque nutritionnel (R+) ou non (R-). Ainsi la proportion depersonnes ou de ménages à risque qui bénéficient de l'intervention, ce quicorrespond à la sensibilité (Se = P(B + /R+)), représente la couverturepar le programme de la population à risque. On peut noter que ce critèrede sensibilité ne sert cependant pas à évaluer directement la qualité dumécanisme de ciblage. Il évalue surtout la capacité du programme à toucherles personnes à risque et donc dépend avant tout de la nature et de lamise en œuvre de l'intervention: ainsi, dans le cas d'une interventionpassant par l'utilisation d'un système de santé, la couverture du programmedépendra de la couverture de la population par ce système, mais aussi de lafréquentation de ce système par les personnes à risque, ainsi que de la façondont ce système identifie ces personnes pour leur attribuer l'intervention.

Tableau 1 Classification selon le critère de ciblage et la participation auprogramme.

Bénéficiaires 1 Ouiclu programme 1 Non

Risque nutritionnel

Oui 1 NonR+ R-

B+ a bB- c d

Le deuxième critère utile, qui correspond à la valeur prédictive positive(V pp = P(R + /B+)), mesure le taux cie ciblage de l'intervention: c'estla proportion des bénéficiaires du program me qui son t cles person nes àrisque. Un problème limite néanmoins l'interprétation de ce critère; eneffet, plus la proportion de personnes à risque dans la population est élevée,plus grande est la probabilité que le taux de ciblage soit élevé. Aussi, ila été proposé d'ajuster le taux de ciblage par rapport à la proportion depersonnes à risque dans la population en calculant un rapport relatif deciblage qui est obtenu en divisant la prévalence de personnes à risque chezles bénéficiaires du programme par la prévalence de personnes à risque chezles non bénéficiaires (Yip et al. 1991) soit k' = P(R+/B+)/P(R+/B-).

P(M + /T+) (probabilité d'être effectivement malade lorsque déclaré tel par letest) et de manière symétrique valeur prédictive négative VPN = P(M - /T-).On utilise également les rapports k = Se/(l - Sp) (un individu a k fois plusde chances d'être positif au test s'il est malade que s'il est non malade) et k' =V P P/(l- V P N) (risque relatif de maladie: un individu a k' [ois plus de chancesd'être malade s'il est positif au test que s'il est négatif).

82

Ce rapport relatif de ciblage peut s'interpréter comme un risque relatif enépidémiologie.

Très souvent, la règle de décision sur laquelle est basée le ciblage découledu choix d'une valeur seuil sur une grandeur continue: indice de niveauéconomique ou ligne de pauvreté dans le cas d'un ciblage au niveau desménages, probabilité de risque nutritionnel pour un ciblage individuel parexemple. A chaque valeur seuil correspond une répartition différente desindividus dans les 4 cases du tableau de contingence 2x2 et donc une valeurde sensibilité et de spécificité. On représente généralement les résultatsassociés aux différents seuils de coupure par une courbe dite courbe ROC(Receiver Operating Characteristic Curve) ROC (Ranley et McNeil 1982)comportant en abscisse le taux de faux positifs soit 1 - Sp = P(B + / R-)et en ordonnée le taux de vrais positifs ou sensibilité Se = P(B + /R+)(cf. figure 1).

'1 "1

---------------==--7i~

10.0

0.2

0.4

0.6 -

0.8

Se 1.0

0.0 0.2 0.4 0.61-Sp

0.8 1.0

Figure 1

Exemple de courbe ROC.

Le choix du seuil dépend de l'aspect que l'on souhaite privilégier (sensibilité ou spécificité) et des coûts -au sens mathématique et général du

83

terme- associés aux mauvais classements. Si l'on sait évaluer les "coûts"associés aux "mauvais classements" soit C(FP) pour un faux positif (individu atteint à tort par le programme) et C(FN) pour un faux négatif(personne à risque mais n'ayant pas bénéficié du programme), on peutmontrer que le "coût" global estC = P(R+)C(FN)(1 - Se) + (1 - P(R+))C(FP)(1 - Sp) si P(R+) estle taux de personnes à risque dans la population. Le choix optimal (coûtglobal minimum) est le point de la courbe ROC dont la pente est[C(FP)/C(FN)] x [(1 - P(R+))/P(R+)]. Si les "coûts" sont égaux, lechoix optimal est le point de la courbe de pente [1 - P(R+ )]/P(R+) : si laprévalence d'individus à risque est faible (ie : pente élevée), il ne faut passe placer dans le haut de la courbe car cela conduirait à un nombre trèsgrand de faux positifs. Par contre, si on pense qu'il est très important defaire bénéficier du programme les personnes à risque et peu important decibler à tort des personnes non à risque, on choisira des valeurs de coûtsC (FP) faibles et C (FN) élevés. La formule nous incite alors à choisir unun seuil de coupure déplacé vers le haut de la courbe (pente plus faible)car on privilégie la sensibilité par rapport au cas précédent (coûts égaux).

Si le choix du point de la courbe ROC minimisant le coût global estmathématiquement facile, il est par contre difficile de pondérer en termesfinanciers et humains, les coûts associés aux deux types de mauvais classements sur lesquels est basé le calcul.

Collecte des données pour le ciblage des interventions nutritionnelles

Pour la mise au point d'un programme d'intervention ciblé et/ou sonévaluation il est nécessaire de disposer d'une information récente et fiable.Cette source d'information doit porter sur la totalité de la population de lazone concernée par le programme ou sur un échantillon représentatif. Unesolution serait de faire appel à des systèmes d'information existants (systèmes d'information sanitaire, surveillance nutritionnelle), lorsqu'ils fonctionnent sur une base représentative. Un grand nombre de pays ne disposent pas de tels systèmes et il convient alors d'envisager l'évaluation surla base d'enquêtes qui peuvent être relativement légères mais qui doiventêtre réalisées sur un échantillon aléatoire représentatif de la population dela zone d'extension du programme.

La conception même de ces enquêtes par sondage doit tenir compte descontraintes propres aux pays en développement: on ne dispose pas toujoursdes éléments nécessaires ni de la précision requise pour la construction et

84

la réalisation du plan d 'échan tillonnage (recensements absents ou anciens,

modifications rapides du tissu urbain par exemple). Des techniques particulières doivent être envisagées au cas par cas. Par exemple, échantillonnagesur photos aériennes comme cela a pu être fait dans des camps de réfugiésà la structure très régulière, ou, bien qu'ils aient été utilisés dans un autrecontexte, les sondages aréolaires utilisant des images satellites comme basede sondage en milieu urbain (Dureau et al. 1989). D'autre part, la nécessité de prise en compte du plan de sondage, parfois complexe, pose desproblèmes d'estimation des paramètres des modèles utilisés pour l'analysedes résultats de l'enquête3 (Pfefferman 1993).

De plus, certaines informations, en particulier de nature économique,comme les revenus, sont particulièrement difficiles à apprécier quand ils'agit par exemple de personnes travaillant dans le secteur informel. Sepose alors le problème d'estimer le niveau économique à partir d'indicateursindirects du reven u (Traissac et al. 1997).

Enfin, l'étude de la perception des programmes et interventions nutritionnelles par les populations elles mêmes, fait souvent appel, en plusdes enquêtes quantitatives classiques, à des techniques qualitatives issuesdes sciences sociales telles que groupes focalisés ou entretiens semi-dirigés(techniques souvent regroupées sous le nom de méthodes 'RAP' : RapidAssessment Procedures; Scrimshaw et Gleason 1992 ; Kumar 1994). Lagestion et l'analyse des informations posent ici des problèmes particulierspuisque les données de base recueillies lors de ces enquêtes sont pour unelarge part de nature textuelle (Lebart et Salem 1994 ; Miles et I-Iuberman1994).

Les COLI ts su pplémen tai l'es en traînés par de telles enq uêtes sont à considérer par comparaison au COLIt total des interventions. Ils peuvent etdoivent être intégrés dans la conception même des programmes.

Pour ce qui concerne le point particulier de la validation des modèles,notamment statistiques, utilisés pour le ciblage, même si l'idéal est de collecter un deuxième échantillon complètement indépendant du premier pourvalider la règle de classement, ces COLItS et les difficultés pratiques de collecte de données font apparaître l'intérêt de techniques telles que celles del'échantillon test ou de la validation croisée. En effet, pour la construction

3En effet, la plupart des modèles et des formules présentés dans les ouvragesclassiques de statistique de même que les logiciels couramment utilisés pour leurmise en œuvre font implicitement l'hypothèse que les unités statistiques ont étééchantillonnées selon un sondage aléatoire simple. Lors des enquêtes sur le terrain,ce mode d'échantillonnage étant, pour diverses raisons, impossible à mettre enœuvre, il est souvent utilisé des plans de sondage à un ou plusieurs degrés, engénéral associés à une stratification préalable de la zone d'étude.

85

d'une règle de ciblage, c'est-à-dire du processus permettant de décider àpartir d'un certain nombre de ses caractéristiques si une personne (ou unménage) va être ou non bénéficiaire du programme, on procède en généralde la façon suivante: dans un premier temps à partir d'un échantillon (ditéchantillon de base ou d'apprentissage) d'unités statistiques (personnes ouménages) pour lesquelles on connaît à la fois les caractéristiques potentiellement prédictives du risque nutritionnel et la réalité de ce risque, on bâtitun modèle expliquant au mieux ce dernier en fonction des caractéristiques.

L'objectif final est bien évidemment d'utiliser de façon opérationnellela règle ainsi construite pour décider, à partir d'un certain nombre de caractéristiques simples, si la personne ou le ménage va être bénéficiaire del'intervention, sans observer directement son état nutritionnel. Néanmoins,dans un deuxième temps, on s'attache à valider le modèle en comparant cequ'il prédit à ce qui est observé en réalité, pour des unités statistiques pourlesquelles on connaît à la fois les caractéristiques et le risque nutritionnel,mais n'ayant pas été utilisées pour la construction de la règle.

En effet, si l'on utilise les unités statistiques de l'échantillon de basepour valider le modèle et notamment pour estimer des quantités telles quesensibilité, spécificité ou encore le taux d'erreur de classement (ou coùt total) il est clair que l'on va obtenir des estimations biaisées des valeurs réelles(ie celles concernant la population à laq uelle on s'intéresse), puisq u'on utilise les observations mêmes qui ont servi à construire la règle. La méthode de l'échantillon test consiste à tirer au hasard un certain pourcentage(par exemple 30%) d'unités statistiques de l'échantillon de départ qui neparticiperont pas à la construction de la règle (échantillon test) et serontutilisées pour la validation. Une généralisation de cette approche est lavalidation croisée4

: on divise l'échantillon de départ en un certain nombre de sous échantillons (par exemple 10) et l'on répête autant de fois laprocédure décrite ci-dessus, chacun des sous-échantillons étant à tour derôle échantillon test. On fait ensuite la moyenne des valeurs obtenues pourestimer les quantités d'intérêt (spécificité, sensibilité etc.).

Exemples d'utilisation de méthodes statistiques (discrimination, classement), pour construire une règle de ciblage

Les méthodes utilisées pour la construction d'une règle de ciblage doivent être évaluées sur un ensemble de critères incluant leurs qualités sta-

4Cette méthode est en particulier intéressante lorsque l'échantillon dont ondipose n'est pas suffisamment grand pour permettre de constituer un échantillontest sans trop réduire la taille de l'échantillon d'apprentissage.

86

tistiques mais prenant également en compte la nature opérationnelle duciblage. Dans cette optique, on doit privilégier la simplicité d'emploi dumodèle utilisé sans néanmoins que cela soit au détriment des qualités de larègle de classement. La recherche du meilleur compromis simplicité/performance doit prendre en compte les points suivants:

• nombre de prédicteurs aussi réduit que possible: nécessite une analyse conceptuelle approfondie préalablement à la collecte de l'information de base, même si dans une certaine mesure les procéduresde sélection de variables type pas à pas peuvent aider à simplifiercertains modèles statistiques,

• facilité d'obtention des valeurs des prédicteurs: la règle de ciblagene sera véritablement opérationnelle que si le coût de l'information àcollecter pour décider si une personne ou un ménage doit être bénéficiaire du programme est faible,

• forme du modèle: dans une optique opérationnelle on pourra, àperformances égales, préférer une règle de ciblage plus intuitive ouplus simple pour les décideurs ou les personnels chargés de la mise enœuvre sur le terrain.

Pour ce qui concerne les méthodes statistiques elles mêmes, si l'on s'intéresse, par exemple, au ciblage cie certains groupes ayant un risque nutritionnelspécifique (enfants avec un retard de croissance, enfants de faible poids denaissance, adultes présentant une insuffisance pondérale), ou de ménagescomportant ces personnes à risque, on se situe dans le cadre général clesproblèmes cie discrimination et de classement : on cherche à prédire, àpartir d' un certain nom bre de clescri pteu rs socio-économiq ues du ménageet cie caractéristiques de l'individu simples à collecter, la nécessité de fairebénéficier ou non l'unité statistique considérée (individu, ménage) du programme ciblé. Des méthodes telles que la régression logistique (Eosmeret Lemeshow 1989), l'analyse factorielle discriminante (Tomassone et al.1988), et les arbres de régression et de discrimination CART (Breiman et al.1984) sont classiquement utilisées pour ce type de problème et disponiblesen standard dans la plupart cles logiciels statistiques spécialisés commeSAS (utilisé pour mettre en œuvre les deux premières méthodes) ou S+(dont nous avons utilisé les fonctions clédiées à la construction d'arbres cierégression) .

Dans le cadre de leur utilisation pour construire une règle de ciblage, ona comparé (Traissac 1995) ces trois méthodes sur la base de leurs caractéristiques statistiques intrinsèques ainsi que leurs performances sur un échantillon de 3852 ménages (enquête nationale budget COl1sommation réalisée

87

par l'Institut National de la Statistique de Tunisie et la FA05 en 1990). Sebasant sur les données de cette enquête, qui comportait également un voletd'anthropométrie nutritionnelle, on a cherché à établir une règle pour leciblage des adultes présentant une insuffisance pondérale, soit IIVICG < 18,5kgjm 2 (OMS 1995), à partir de caractéristiques socio-économiques simplesdu ménage (habitat, assainissement, environnement, taille du ménage, etc.)et de l'individu lui-même (âge, éducation, etc.), i.e. une cinquantaine devariables au total. Sont présentés dans la suite uniquement les résultatsconcernant les hommes adultes (n=3138 répartis en 2198 pour ['échantilloncie base et 940 pour l'échantillon test, avec L1ne prévalence d'insuffisancepondérale de 4,5 % sur l'échantillon de base7

).

Pour chacune des trois méthodes, le modèle est ajusté sur l'échantillonde base tandis que les performances de la règle d'affectation, notammentla courbe ROC, le choix d'un seuil à partir de cette courbe, les valeurs desensibilité, spécificité et valeurs prédictives qui en découlent, sont estiméesà partir de l'échantillon test. Pour ['évaluation des performances de la règled'affectation, on a posé des "coûts" égaux pour les deux types d'erreurs cieclassement. Par la suite on a donc choisi cles seuils de coupure qui neprivilégient pas un des aspects par rapport à l'autre (valeurs de Se et Spproches) .

Régression logistique

Si l'on décrit l'insuffisance pondérale par une variable binaire (Y = 1si IMG < 18,5, Y = 0 sinon), on peut se poser le problème cie discrimination en terme de modèle de régression logistique de Y en fonction desdescripteurs -,'le du ménage et de l'individu. Dans le modèle de régressionlogistique, qui appartient à la famille des modèles linéaires généralisés, pourchaque observation, la valeur Yi de la variable réponse est supposée êtreune réalisation d'une variable aléatoire binomiale B(1,Pi) dont l'espéranceE(Y;) = Pi = P(Yi = 11·X jj , X 2i , ... , X pj ) dépend des variables explicatives

50rgan isation des Nations Unies pour l'alimentation et l'agriculture6HvIC : indice de masse corporelle aussi appelé indice de Quételet.

HvIC = poids / taille2 (taille en m, poids en kg).7La Tunisie présente une situation caractéristique des pays en transition nu

tritionnelle avancée avec un fort pourcentage de personnes en surpoids soit HI'IC2: 25 (OMS 1995) et une faible proportion d'individus présentant une insuffisancepondérale. Ceci explique en grande partie que l'âge prédomine dans les critères deciblage de la maigreur comme nous le verrons par la suite. Cela ne remet pas encause l'intérêt des méthodes présentées. Il nous semblait important de les illustrersur un exemple concret, basé sur des données fiables et représentatives à l'échellenationale.

88

sous la forme d'une fonction logistique:

ou, ce qui est équivalent,p

Log[pd(1 - Pi)] = bo+L bjXjij=l

(1)

(2)

Elle est adaptée à modéliser un certain nombre de situations ou la variable réponse prend ses valeurs dans l'intervalle [0,1]. Les variables Xipeuvent être indifféremment quantitatives ou les indicatrices de variablesqualitatives. On peut également introduire dans le modèle des variablescodant des interactions spécifiques. Un des intérêts de cette méthode pourles personnes de culture épidémiologique est le suivant: dans le cadre d'unmodèle additif (i.e. en l'absence d'interactions) si bi est le coefficient de lavariable Xi dans le modèle, on peut montrer que ebi(d-c) est l'odds-rati08

mesurant la modification du risque (ici d'insuffisance pondérale) quand lavaleur de Xi passe de c à d, ajusté pour la présence des autres variablesdans le modèle. L'estimation des paramètres est faite par la méthode dumaximum de vraisemblance. L'utilisation d'un algorithme de type pas à pasascendant a conduit à retenir 6 variables. Aucun terme d'interaction n'aété inclus dans le modèle pour des raisons de simplicité. Dans une optiquede prédiction, pour chaque individu, en utilisant les paramètres estimés, età partir de ses valeurs pour les variables explicatives, on peut calculer lavaleur de la fonction [1] qui lui est associée. On obtient une probabilitéestimée d'insuffisance pondérale compte tenu de ses caractéristiques. Onpeut construire un score de ciblage simple d'emploi à partir des estimationsdes coefficients bi

9 (cf. tableau 2).

La courbe ROC (cf. figure 3) correspondant aux divers choix de seuilspossibles (probabilité à partir de laquelle on considère que l'individu doit

8Un indice d'association permettant de juger de l'effet d'un facteur de risque Fdichotomique (F+ : facteur présent, F- : facteur absent) sur une maladie M estle risque relatif RR = P( M + / F +) / P( M + / F -). Dans la mesure ou le RR n'estpas calculable dans tous les types d'études épidémiologiques, on utilise d'autresindicateurs tel que l'odds-ratioOR = [P(M + /F+)/P(M - /F+)]/[P(M + /F-)/P(M - /F-)]. Bien quece dernier indice ait dans touts les cas une interprétation spécifique, il est aussisouvent utilisé car il donne une bonne approximation du RR lorsque la maladieétudiée est rare dans la population (Bouyer et al. 1995). Ces notions se généralisentsans difficulté dans le cas d'une exposition à plusieurs niveaux.

9Les coefficients sont multipliés par 100 pour simplifier la présentation. Unevaleur positive correspond à un risque de maigreur augmenté.

89

être ciblé) pour la règle d'affectation basée sur la régression logistique, aconduit à retenir une valeur associée aux estimations lO de S'e, S'p, liP P,lIPN présentées dans le tableau 3. Avec ce choix, tout individu présentant un total supérieur ou égal à 300 points est considéré comme devantbénéficier du program me ci blé.

Tableau 2 S'core de ciblage,Score de départ

Individu

r~ql'ession logistique.

1 +264 1

Age < 20 ans +99Activité nulle ou légère +57Enfant ou petit enfant du chef de ménage +52

1 Ménage1 Nombre d'enfants dans le secondaire public ~2 +52

Radio -58l"Lachine à laver -106

Total

Analyse factorielle discriminante

Le vocable analyse discriminante regroupe un grand nombre de méthodes parfois assez différentes du point de vue de leurs fondements mathématiques. L'analyse factorielle discriminante utilisée ici est basée sur larecherche d'une combinaison linéaire des variables explicatives (appelé axediscriminant) maximisant un critère de séparation entre les deux groupes,par exemple le rapport variance inter / variance intra. L'affectation d'uneunité statistique à l'un des deux groupes en fonction de ses valeurs pourles différentes variables se fait en calculant la coordonnée de sa projectionsur l'axe discriminant puis en fonction du choix d'un seuil. En générall'affectation se fait au groupe dont elle est le plus proche du barycentre surcet axe. Cette règle d'affectation géométrique (distance de Mahalanobis) aégalement une interprétation probabiliste (maximum de vraisemblance) sila distribution des variables explicatives est multinormale. Bien que cetteméthode soit initialement prévue pour des variables quantitatives, dans uneoptique de ciblage on aura souvent un mélange de descripteurs quantitatifset qualitatifs. Une possibilité simple est de réaliser un codage disjonctif

lOBien que nous ne les distinguions pas par des notations spéciales, les valeursde ces paramètres présentées dans la suite sont obtenues à partir de l'échantillonconsidéré et non des valeurs en population telles que présentées au paragraphe 4,dont elles sont des estimations.

90

complet des variables qualitatives (c'est ce qui a été utilisé).

De même que pour la régression logistique, un algorithme de type pas àpas ascendant (i.e. avec introduction progressive des variables) a été utilisépour rechercher la meilleure discrimination possible à partir d'un nombre

réduit de variables: oS variables ont été retenues. De même la constructiond'un score de ciblage pour utilisation sur le terrain peut se faire simple

ment à partir des coefficients de la combinaison linéaire définissant l'axediscriminant. Nous ne présentons pas dans le détail les résultats obtenusavec cette méthode. Néanmoins, l'étude de la courbe ROC (cf. figure 3)correspondant aux divers choix de seuils possibles a conduit à retenir unevaleur associée aux estimations de Se, Sp, V PP, 11 PlV présentées dans letableau 3.

Arbre de régression et/ou de classification (CART)

On cherche à prédire la variable dichotomique codant l'insuffisancepondérale à partir des variables explicatives, en utilisant un arbre binaireau lieu d'une équation de régression. Le princi pe général de tou tes lesméthodes de segmentation, dont CART fait partie, est de construire untel arbre à partir des séries de noeuds que représentent l'ensemble, puisles sous-ensembles successifs, d'unités statistiques que délimite chaque segmentation. Les notions essentielles ici sont celles de coupure et d'impuretédes nœuds:

• Coupure: étant donné une variable continue X, on appelle coupureun critère binaire du type X < c (par exemple âge < 18) qui permetde répartir sans ambiguïté les individus en deux groupes: ceux pourlesquels X < c et ceux vérifiant X 2: c. Si la variable X est qualitativeune cou pure sera défi nie par un sous-ensem ble des modalités .

• Impureté d'un nœud: un nœud est dit d'autant plus pur, pource qui concerne la variable dichotomiq ue ét udiée (ici l'i ns uffisancepondérale), qu'il contient une classe plus largement majoritaire. Différents choix sont possibles pour l'expression mathématique de cetteimpureté. Il semble que ce choix n'ait en général pas grande influencesur les résultats.

A partir de ces éléments, l'algorithme fonctionne de la façon suivante: àl'étape 1 on dispose de l'ensemble des individus de l'échantillon de basequi constituent le premier nœud de l'arbre. On recherche alors la coupurequi permet de scinder en deux l'ensemble des individus de façon à obtenir

91

une réduction maximale de l'impuretéll . La recherche se fait de manière

exhaustive par examen de toutes les variables explicatives et balayage del'ensemble des valeurs prises par chacune de ces variables pour déterminer lacoupure qui permette une réduction maximale de l'impureté. L'algorithmese déroule ensuite de manière récursive: pour chaque nouveau nœud ainsicréé, on recherche la question binaire qui favorise un découpage en deuxnouveaux nœuds et conduise à une réduction maximale d'impureté etc.Il est à noter que dans chacun des deux nœuds crées lors d'une coupure,des variables différentes peuvent être utilisées pour les coupures suivantes:

c'est-à-dire que les interactions entre variables sont gérées de manière implicite par la méthode, sans qu'il soit nécessaire de les spécifier commec'est le cas par exemple dans un modèle de régression logistique lorsqu'on

souhaite les prendre en compte12.

Se pose le problème de l'arrêt du découpage: un arbre de bonne tailleest un arbre fournissant le taux d'erreur cie classement le plus petit pos

sible avec le nombre cie nœucls le plus réduit possible. Si l'on considèrel'échantillon de base, le taux d'erreur le plus petit possible sera obtenu enpoursuivant le découpage jusqu'à ce que chaque noeud terminal ne contienne qu'un seul individu. Ce choix n'est néanmoins pas acceptable.

Il conduit à des arbres très grands, peu pratiques à utiliser. De plus,l'inconvénient majeur est que pour tout autre échantillon, l'utilisation decet arbre rique de conduire à un taux d'erreur très important. Il est eneffet peu probable de trouver deux échantillons ayant exactement la mêmestructure. On procède de la façon suivante: on laisse se développer l'arbreassez loin, chacun des nœuds terminaux ayant un effectif très faible. Parutilisation d'un échantillon test ou par validation croisée, l'arbre est ensuiteprogressivement élagué par le bas en remontant. On obtient ainsi une suited'arbres emboîtés que l'on compare pour choisir l'arbre de taille adéquate

optimisant le critère choisi (taux d'erreur de classement par exemple).

llSoit i(t) l'impureté d'un noeud t et tg et td respectivement les noeuds gaucheet droite créés par la coupure. La réduction d'impureté estDi = i(t) - p(tg)i(tg) - p(td)i(td) où p(tg) et p(td) sont les proportions d'individusdu noeud t qui tombent dans tg ct td.

Dpour permettre à un modèle de régression (logistique ou autre) de prendreen compte de telles interactions, même si bien évidemment elles ne sont en finalpas toutes retenues dans un modèle élaboré avec une procédure de type pas-àpas, celles-ci doivent être spécifiées au départ pour tous les couples possibles devariables (soit p(p - 1)/2) pour ce qui concerne seulement les interactions d'ordre2. Lorsque l'on dispose d'un grand nombre de variables explicatives potentielles(une cinquantaine dans le cas de l'exemple présenté), cela conduit à des modèlesqui ne sont pas faciles à spécifier.

92

Pour chacun des nœuds terminaux de l'arbre ainsi créé, on obtientune estimation de la probabilité d'insuffisance pondérale par la proportion d'individus de l'échantillon test présentant la caractéristique. Pource qui concerne la prédiction, partant du sommet, l'individu chemine lelong de l'arbre en fonction des questions binaires et des valeurs qu'il prendpour chacune des variables retenues, jusqu'à ce qu'il arrive dans un nœudterminal. On obtient alors une estimation de la probabilité d'insuffisancepondérale de l'individu en fonction des variables explicatives. L'affectationà une des deux sous-populations est alors liée au choix du seuil fait aprèsexamen de la courbe ROC (cf. figure 3). Voir également le tableau 3 pourles caractéristiq ues de la règle d'affectation choisie.

Un graphique très simple d'emploi peut-être directement déduit del'arbre de classification produit par la méthode (figure 2) pour savoir quellessont les personnes qui devraient bénéficier d'un éventuel programme ciblésur l'insuffisance pondérale.

Âge<=22 ans

NON

NOlllbr • de piècesdu log ment <=2

levé OUI NONal/cele Soutien fil aneler

extérieur , u ménage Risque faibled'il/suffisance

pondérale

OUI NON

Risque faible Risque élevéd'insuffisance d'insuffisance

pondérale pondérale

OU1

Risque éd'insuffis

pondéra

Figure 2

Arbre de décision pour le ciblage, CART.

93

Interprétation des résultats et comparaison des différentesméthodes:

Il n'est pas dans les objectifs de cette présentation de faire une interprétation détaillée des résultats obtenus: on peut néanmoins remarquerque pour les trois méthodes (y compris l'analyse factorielle discriminantedont les résultats ne sont pas présentés) sont mis en évidence une combinaison de critères individuels (âge, activité physique) et d'indicateurs indirectsdu niveau économique du ménage (taille du logement, possession de biens,etc.). De manière générale, si l'on rapproche les valeu rs 0 btenues pou l'

des indicateurs tels S'e, S'p de celles habituellement obtenues pour des testsdiagnostiques, celles-ci peuvent effectivement sembler faibles. Cela pourraitvouloir dire qu'on ne dispose pas nécessairement des informations adéquatespour le ciblage. Néanmoins, il faut nuancer cette conclusion car d'une partle contexte n'est pas le même, et d'autre part, il s'agissait d'utiliser aumieux dans une optique de ciblage, des données déjà existantes.

La comparaison fine des propriétés mathématiques des différentes méthodes ainsi que de leurs performances respectives sur de nombreux jeuxde données (O'Gorman et al. 1991, Breiman et al. 1984) sort également ducadre de cette présentation. Néanmoins, dans le contexte qui nous occupe,pour ce qui concerne la possibilité de création de scores de ciblage simples d 'em ploi, la régression logistique et l'analyse discriminante semblentéquivalentes. Par contre l'interprétation des paramètres de la régressionlogistique en terme d 'odds-ratio, qui est une des raisons de la popularitéde cette méthode chez les personnes de culture épidémiologique pourra lafaire préférer dans certains contextes. Pour la présentatiol.1 de résultats àun décideur et pour l'utilisation sur le terrain, la compréhension de l'arbrede régression/discrimination issu de CART est encore plus aisée pour despersonnes qui n'ont pas une culture statistique et/ou épidémiologique.

Du point de vue du type de données, il est clair que l'on est dans les limites extrêmes de validité de la méthode lorsqu'on utilise l'analyse factoriellediscriminante sur les indicatrices de variables qualitatives comme cela aété fait ici. La régression logistique et CART permettent par contre degérer sans problèmes des prédicteurs quantitatifs et qualitatifs. L'avantagemajeur de CART est de gérer de façon im plicite la sélection des variableset les interactions entre les prédicteurs, avec tous les avantages que celacomporte en termes pratiques et de performances.

D'autre part, on pourrait s'attacher à comparer précisément les performances des trois méthodes, par exemple par des tests basés sur les surfacesdélimitées par les courbes ROC (Hanley et McNeil 1982). Sans rentrer dans

94

tous les détails, en ce qui concerne l'exemple de la Tunisie, on peut_commenter les performances respectives des méthodes telles que représentéespar les courbes ROC (figure 3) et pour le choix des couples (Se, Sp) quiont été faits (tableau 3) : si les résultats ne sont pas très différents d'uneméthode à l'autre, l'analyse discriminante semble logiquement donner lesrésultats les moins bons (cf. remarque ci-dessus), suivi par la régressionlogistique et enfin CART. Il est moins aisé de comparer objectivement cesmodèles sur la base de plusieurs critères simultanément tels que parcimonie,performances, lisibilité des résultats mais on peut remarquer que le modèlequi donne la meilleure prédiction (CART) est également celui qui utilise lemoins de variables et dont la forme d'expression des résultats est la plussimple.

CART

--- A. F.D .

.......... R. L .

'10.0

0.2

0.4

0.6 -

Se 1.0-l-----------~

0.8

0.0 0.2 0.4 0.61-Sp

0.8 1.0

Figure 3

Comparaison des courbes ROC.

9.5

Tableau 3 : Comparm:son des perform,ances des règles d'affectation (seuilschoisis après examen des courbes ROC').

1 Se Sp k vpp VPN k'Analyse discriminante 0,60 0,58 1,41 0,08 0,95 1,41Régression logistique 0,61 0,62 1,62 0,09 0,97 2,48CART 0,69 0,58 1,64 0,09 0,9 { 2,83

Conclusion

Le ciblage des programmes et des interventions nutritionnelles peut contribuer à une meilleure équité dans un contexte général de ressources limitées et notamment de réduction des ressources affectées à ces programmes:crise économique, ajustement structure!. Il est souvent l'une des conditionspour l'accès de tous à la santé et à une alimentation adéquate en quantitécomme en qualité.

Différents types de ciblage peuvent être envisagés; le choix repose surune caractérisation précise des groupes cibles, sur les indicateurs disponibleset les stratégies d'atteintes utilisables selon le contexte. NIais quel que soitle type de ciblage envisagé, celui-ci doit être basé sur des données fiables,récentes et représentatives, avec les problèmes de collecte spécifiques quipeuvent se poser dans les pays en développement. De même, quel que soitle type de ciblage, on doit se poser le problème de J'évaluation et de lamesure des performances de la stratégie de ciblage, en pa.rticulier en termede coûts.

Les méthodes statistiques classiquement employées pour les problèmesde discrimination peuvent être utiles pour construire des outils de ciblage.Au-delà du type de données qu'il est possible de traiter et des performances,certaines caractéristiques comme par exemple la possibilité de calculer unodds-ratio, ou encore une meilleure lisibilité des résultats pour les décideurs,peuvent faire préférer une méthode à une autre suivant le contexte, commecela a été illustré sur l'exemple tunisien présenté ci-dessus. D'autres méthodes peuvent encore être envisagées, telles que les méthodes neuronales.Elles devront être évaluées suivant les mêmes critères.

A chaque niveau de mise en oeuvre des méthodes statistiques (de l'observation jusqu'à l'analyse), au-delà des aspects purement techniques, lechoix de l'une ou l'autre, dans les pays en développement, se fera souventsur la base de critères et de contraintes spécifiques.

96


Bouyer J., Hémon D., Cordier S., Derrienic F., Stücker L, Stengel B., Clavel J.Epidémiologie. Principes et méthodes quantitatives. Les Editions INSERM,Paris, 1995.

Breiman L., Friedman J.H., Olshen R.A., Stone .J.C. Classification and RegressionTrees. Wadsworth Inc., 1984.

Dabis F., Drucker J., Moren A. (eds.), Epidémiologie d'Intervention. Arnette,Paris, 1992.

Dureau F., Barabary O., Michel A., Lortic B. Sondages aréolaires sur image satellite pour des enquêtes socio-démographiques en milieu urbain. ivIanuel deformation. Orstom Ed., Paris, 1989.

Grosh M.E. Administering targeted social programs in latin America. From platitudes to practice. The World Bank, Washington D.C., 1994.

Habicht J-P., l'vIason J. B., Tabatabai H. Basic concepts for the design of evaluationduring programme implementation. /11: l'vIethods for the Evaluation ofthe Impact of Food and Nutrition Programmes, Sahn D. E., Lockwood R.and Scrimshaw N., eds., The United Nations University, Tokyo; Food andNutrition Bulletin, 1984; Suppl 8 :1-25.

Hanley J. A., l'vIc Neil J. B. The meaning and use of the area under a ReceiverOperating Characteristic (ROC) Curve. Radiology, 1982 ; 143 : 29-36.

Hosmer D. W., Lemeshow S. Applied Logistic Regression. J. Wiley, New-York,1989.

I(umar K. Rapid appraisal methods. The World Bank, Washington D.C., USA;1993.

Lebart L., Salem A. Statistique Textuelle, Dunod, Paris, 1994.

l'vlaire B., Delpeuch F., Cornu A., Tchibindat F., Simondon F., Massamba JP., Salem G., Chevassus-Agnès S., Urbanisation et transi tion nutritionnelleen Afrique sub-saharienne : les exemples du Congo et du Sénégal, Rev.Epidémiol. Santé Publ., 1992 ; 40 : 252-58.

j\IIaire B., Delpeuch F., Padilla M., Le Bihan G. Le ciblage dans les politiques etles programmes nutritionnels. /11: Les politiques alimentaires en Afriquedu Nord; d'une assistance généralisée aux interventions ciblées. 3.5-57,FAO/CIHEAivI-IAMM/ORSTOM, I(arthala, Paris, 1995.

Miles M. B. and Huberman A. M. Qualitative data analysis. An expanded sourcebook. 2nd ed., SAGE Pub!., Thousand Oaks, USA, 1994.

O'Gorman T. W., Woolson R. F. Variable selection to discriminate between twogroups: stepwise logis tic regression or stepwise discriminant analysis ? TheAmerican Statistician, 1991 ; 4.5(3) : 187-93.

97

01vIS, Utilisation et interprétation de l'anthropométrie, Organisation TvIondiale dela Santé, Genève, 1995.

Pfeffermann D. The raIe of sampling weights when modeling survey data, International Statistical Review, 1993; 61 : 317-37.

Pinstrup-Andersen P. Targeted nutrition interventions, Food Nutr Bull, 199113(3) : 161-9.

Popkin B. !VI. The nutrition transition in low-income countries : an emerging crisis.Nutr Rev 199 ; 52(9) : 285-98.

Scrimshaw N. S. and Gleason G. R., (eds). RAP : rapid assessment procedures.Qualitative methodologies for planning and evaluation of health relatedprogrammes. International Food and Nutrition Foundation for DevelopingCountries (INFDC), Boston, l'vIa, USA; 1992.

Tomassone R., Danzart !VI., Daudin J. J., l\'fasson J- P. Discrimination et classement, Masson, Paris, 1988.

Traissac P., Delpeuch F., j\'Iaire B., Martin-Prével Y., Cornu A., Trèche S. Construction d'un indice synthétique de niveau économique des ménages dansles enquêtes nutritionnelles. Exemples d'applications au Congo. Rev. Epidemio!. Santé Pub\, 1997 ; 45(sl)114-5.

Traissac P. Eléments de méthodologie statistique pour la discrimination et leclassement. Application au ciblage des interventions. In : Les politiquesalimentaires en Afrique du Nord; d'une assistance généralisée aux interventions ciblées. 393-431, FA OjCII-IEAM-IAMMjORSTOTvl, Karthala, Paris,1995.

Yip R., Fleshfood L., Spi liman T.C., Binkin N.J., Wong F.L., Trowbridge F.L.

Using linked pr6gram and birth records to eval uate coverage and targeting

in Tennessee's WIC program. Public Health Rep., 106(2) : 176-181, 1991.

98

Statistique et hydrologie à travers quelquesexemples appliqués à des problématiques des

pays en voie de développement

Hélène Lubès-Niela

Introduction

Hayet Khodja a Robert Sabatier b

Le présent article a pour objectif d'illustrer l'implication de la statistique dans des programmes hydrologiques tournés vers le développementen coopération. Le séminaire "Statistique impliquée" (Laloë, 1992) poursuivait ce même but étendu à des disciplines scientifiques très diverses, etmettait d'abord en lumière des problématiques de recherche pour lesquellesle recours à des domaines variés de la statistique, plus ou moins traditionnels, pouvait apporter des éléments de réponse, voire des solutions auxquestions posées par une spécialité donnée. C'est cette même volonté dedonner la priorité au problème et à la démarche suivie plutôt qu'à l'outillui-même qui a conditionné la rédaction du papier présenté ici. Le choix desillustrations qui vont suivre montre souvent que les techniques statistiquesmême les plus simples contribuent très significativement à "résoudre" desproblèmes dont la complexité relève de la réalité naturelle des phénomèneshydrologiques pour lesquels tous les instruments d'observation actuels nedonnent qu'une image tronquée et souvent déformée.

Quatre thèmes hydrologiques au cœur des problématiques affichées dansles pays en voie de développement ont été retenus: les effets de la déforestation sur le comportement hydrologique, la prévision des crues, la variabilitéspatiale et temporelle des précipitations, et la caractérisation des variations des régimes de pluie. Ils sont représentés ici au travers de quatreprogrammes de recherche qui s'inscrivent dans des contextes géographiques

aLaboratoire d'Hydrologie, ORSTOM, B.P. 5045, 34032 Montpellier cedex l,France

bLaboratoire de Physique Moléculaire et Structurale, Faculté de Pharmacie,Université Montpellier l, 34060 Montpellier cedex 1, France

différents et ont tous mis en ouvre une démarche statistique. Les trois premiers problèmes ont été traités par des hydrologues plus ou moins au faitdes techniques statistiques et de leur pratique, tandis que le dernier a faitl'objet d'un dialogue entre hydrologues et statisticiens praticiens (Escoufier,1992).

Les synthèses des trois premières études ont été rédigées à partir d'ouvrages ou d'articles de référence. Il s'agit essentiellement d'une compilationde citations de ces documents dont nous espérons n'avoir pas dénaturé lesens global. La dernière étude qui a fait l'objet d'un récent article (Khodjaet al, 1997) est présentée de manière plus détaillée.

Les effets de la déforestation sur le comportement hydrologique (Fritsch, 1990)

A l'origine de cette étude il faut placer l'idée généralement répandueque la forêt exerce un effet modérateur sur les écoulements, et que parconséquent son élimination peut considérablement modifier les termes dubilan hydrologique. Pourtant de nombreux travaux menés dans des paysAnglo-Saxons ne corroborent pas ce qui pourrait passer pour une évidence.

Les effets du défrichement de la forêt amazonienne, et de la mise enculture, sur le comportement d'unités hydrologiques ont donc été analysésgrâce au suivi hydrologique d'une expérimentation sur des petits bassinsversants de Guyane Française, en zone tropicale humide, pendant près dehu it an nées. L'objectif était de q uan tifier les modifications du com portement hydrologique provoquées par la suppression de la forêt naturelle amazonienne, et induites par des utilisations ultérieures de l'espace, à finalitésagricoles, sylvicoles et pastorales.

Le dispositif expérimental soigneusement élaboré était composé de dixpetits bassins versants d'une su perficie com prise entre 1 et 2 hectares.

Le protocole expérimental comprenait une première phase de deux ansdite "Epoque Verte" durant laquelle les observations hydrologiques ontporté sur le milieu naturel forestier. Ensuite la couverture générale dehuit bassins versants, appelés bassins expérimentaux, a fait l'objet de diverses manipulations: défrichement en "Epoque Rouge" et implantationultérieure d'aménagements agricoles, sylvicoles ou pastoraux en "EpoqueJaune", tandis que deux bassins appelés bassins témoins, ont été conservésen forêt naturelle durant tout le suivi.

Pour évaluer les effets provoqués par une modification des caractéristiques d'un bassin versant, deux sources d'informations distinctes ont dû

100

être confrontées:

• les débits réellement observés sur le bassin expérimental après l'application du traitement (défrichement, nouvel aménagement),

• les débits que l'on aurait observés dans les mêmes conditions climatiques, si le système n'avait pas été modifié. Le résultat recherché estobtenu par différence entre ces deux termes.

Les écoulements effectivement mesurés pendant les "Epoques Rouge"et "Jaune" de l'expérimentation ont été donc comparés aux écoulementsqui auraient été observés dans le même temps si le bassin considéré avaitconservé sa couverture forestière originelle. La méthode de comparaisonadoptée repose sur le principe des bassins appariés (paired watershed technique) qui fait largement appel à la régression linéaire. Pour chaque bassinexpérimental, la meilleure régression a été recherchée dans les deux bassinstémoins en utilisant les données de "l'Epoque Verte". Deux variables ontété considérées, dans un premier temps la variable "écoulement total de lacrue", puis la variable "écoulement à l'échelle décadaire" (sommation descrues individuelles dont la durée se mesure en heures) moins sensible à latrop grande variabilité des phénomènes mesurés au niveau de la crue.

La précision et la robustesse de ces modèles ont été testées par calageset validations croisées; cette précision s'est avérée variable et fonction dela typologie du bassin basée sur des critères pédo-morphologiques. Lesrésultats de régression ont ensuite permis de reconstituer le comportementhydrologique "forestier" des bassins expérimentaux pendant toute la duréedes essais à partir des données des bassins qui ont continué d'être observésdans les conditions originelles de forêt primaire.

L'utilisation de ces modèles a conduit aux conclusions suivantes.

En "Epoque Rouge" les volumes écoulés ont été supérieurs à ceux quiauraient pu être observés en forêt naturelle, dans des proportions allant de60% à 130% selon le bassin versant considéré.

En "Epoque Jaune" les écoulements ont diminué tout en restant supérieurs à ceux du milieu naturel pendant les premières années. Un retourà des valeurs comparables à celles du milieu naturel a pu être noté surdes bassins présentant au moins quatre années d'observation dans cettepériode.

Le travail dont seulement q uelq ues traits viennent d'être soulignés estavant tout hydrologique mais ses conclusions reposent sur les résultats del'analyse statistique. JI utilise la régression linéaire et différentes méthodes

101

de validation comme un instrument de mesure plus ou moins précis deseffets d'une modification du milieu sur des variables représentatives desaspects du comportement hydrologique potentiellement affectés par cettemodification.

La prévision des crues (Cappelaere et al. 1996)

Le bassin amazonien s'étend sur plus de 6 millions de km 2 et apporte209000 m3 /s en moyenne à l'océan Atlantique.

Les apports combinés des tributaires méridionaux et septentrionaux,aux régimes différents, associés à l'effet régulateur des zones d'inondation,génèrent à l'aval de Manaus, un hydrogramme de l'Amazone à crue uniqueet étalée d'avril à juillet. Les populations et leurs activités, aussi bienrurales qu'urbaines ou semi-urbaines, subissent régulièrement des effets trèsimportants et prolongés, dont la gravité varie en fonction de la sévéritéde la crue: celle-ci détermine en effet les surfaces inondées, les hauteursde su bmersion, ainsi que les du rées au dessus d'une hau teu l' don née. AManaus même, ce sont 25000 personnes qui sont régulièrement touchéespendant des périodes de 3 à 5 mois. Selon l'importance de la crue desrisques dramatiques sont encourus par la population. La prévision descrues a donc été jugée indispensable par les autorités.

Les objectifs de prévision qui ont été définis portent sur des délais de10, 1.5,20,30,40 et 60 jours avec une bonne précision sur les cotes prédites,de quelques dizaines de centimètres seulement pour un délai de 60 jours.Pour élaborer le modèle de prévision, les hauteurs journalières de 39 siteslimnimétriques répartis sur les cours de l'Amazone et de ses formateursétaient disponibles.

Dans le cadre d'une étude de prevIsion des crues, le modèle le plussatisfaisant pour l'hydrologue est le modèle de propagation des débits. 1'1aisle manque de fiabilité des courbes hauteurs-débits n 'a pas permis de recourirà une représentation de nature physique du processus de propagation, etc'est donc vers une modélisation de type statistique que s'est orienté cetravail à partir de quinze années d'observations concomitantes aux stationsde mesu re disponi bles.

Des équations de prévision de 10 à 60 jours ont été établies par uneméthode de régression ascendante pas à pas qui a permis, pour chaquedélai, de sélectionner, parmi un grand nombre de variables potentiellement

'explicatives de l'évolution à venir de la crue à Manaus, le sous-ensembleà la fois aussi réduit et aussi significatif que possible au regard de cette

102

prévision. Une variable désigne l'association d'une station et d'un décalagetemporel qui représente l'antériorité du jour d'observation de la donnée parrapport au jour d'émission de la prévision.

Parmi les quinze crues observées de 1978 à 1992, dix (soit 630 observations journalières au moins) ont été choisies pour constituer l'échantillon decalage, et cinq (340 observations journalières au moins) pour l'échantillonde validation. Ce choix a été effectué de telle sorte que ces deux échantillonssoient aussi représentatifs que possible de l'ensemble des crues observées.

La précision des prévisions, si elle décroît bien sûr avec le délai reste toutà fait acceptable j usq u'à 60 jou rs. L'écart q li ad ratiq ue moyen est in férieu rà 10 cm pour un délai de 10 jours, et est de l'ordre d'une quarantaine decentimètres pour le délai de GO jours.

A côté de ce modèle de prévision portant sur le déroulement des phasesde montée vers le maximum et d'amorce de la décrue, une prévision duseul débit maximum de la crue a pu être réalisée au cours de la montéeà partir de la simple connaissance de la hauteur observée à J\tlanaus etde la date à laquelle cette observation est effectuée. Etablir Ull modèle àpartir des seules données à IVIanalls présente le grand avantage de permettrel'exploitation de la très longue série observée à cette station, à savoir les 90années de 1903 à 1992. Deux modèles linéaires distincts ont été élaborés,de la forme:

Hmax = j[H(j), j]

al! If représente la hauteur observée à J\tlanaus , et j le jour julien de cetteobservation, pris dans la période 15 mars-30 mai.

Le premier modèle est constitué par une fonction J purement linéairedes deux variables j et H (j) :

Hmax = aIf(j) + bj + C

appliqué à l'ensemble de la période de déflllÏtion de j, c'est-à-dire du 15mars au 31 mai. Le deuxième modèle fait intervenir j non pas commevariable directe du modèle, mais comme variable de contrôle des valeurs desparamètres de la fonction J, celle-ci devenant donc une fonction linéaire deIf (j), à paramètres variables aj et Cj :

Le premier modèle est dit modèle global tandis que le deuxième est appelé"polylinéaire" puisque constitué d'une juxtaposition de petits sous-modèleslinéaires partiels, définis pour une date j donnée de l'année.

103

Les deux modèles sont établis par régression linéaire, le premier directement sur l'ensemble des données correspondant à l'intervalle de variationde j, de la mi-mars à la fin mai, le second séparément pour chaque valeurde j, donc pour chaque jour de la période considérée.

Un troisième modèle, noté N, véritablement non-linéaire a été réalisé.La fonction f est constituée dans ce cas par un réseau de neu rones de typepercept l'on multi-couche. On écrit alors:

Hmax = N[H(j),j]

Les résultats obtenus par cette approche neuronale sont de meilleure qualitéque ceux issus des modèles linéaires classiques.

Ces modèles ont été intégrés dans un logiciel opérationnel exploité parles prévisionnistes afin d'effectuer les prévisions en temps réel. Il auraitété préférable bien évidemment de procéder à une modélisation déterministe du phénomène de propagation des crues, car la limite majeure de lamodélisation statistique est de soumettre la validité du modèle aux seulsévénements dont les caractéristiques sont celles des observations constituantl'échantillon de calage. Toutefois la fraction du bassin Amazonien (72%) quicontribue au niveau de la crue à Manaus, produit toujours un limnigrammefortement lissé par rapport à ceux de chacun des formateurs, et commele soulignent Molinier et al. (1996), une des caractéristiques principalesdes régimes de l'Amazone et de ses affluents est leur remarquable stabilitéinterannuelle. Ces conditions offrent à la démarche adoptée une certainegarantie pour une utilisation en prévision.

Les modèles de nature statistique qui ont été établis permettent deréaliser une prévision satisfaisante des niveaux à Manaus, j usq u'à un délaide deux mois. La prévision du maximum de la crue peut également êtreréalisée avec une précision tout à fait acceptable en utilisant les seulesobservations à Manaus.

La variabilité spatiale et temporelle des précipitations (Lebelet Le Barbé, 1997, Amani et Lebel, 1997)

Un autre domaine de la statistique mis au service de l'hydrologie vamaintenant être évoqué, celui de la géostatistique.

Tous les modèles hydrologiques nécessitent une bonne connaissance deleur variable d'entrée, la pluie. Or l'estimation de la lame d'eau précipitée sur une surface est un problème difficile. La pluie n'est mesuréeque ponctuellement et les réseaux de mesure ne permettent pas toujoursd'estimer correctement la lame d'eau spatiale.

104

L'étude de la distibution spatiale et temporelle des précipitations auSahel a été abordée par l'expérience EPSAT-Niger (Estimation des précipitations par satellite au Niger), puis poursuivie dans le cadre du projetHAPEX-Sahel (Hydrological-Atmospheric Pilot Experiment-Sahel). Le programme HAPEX-Sahel avait pour finalité une meilleure compréhension desinteractions entre le climat et les conditions de surface à travers un suiviexpérimental intense de toutes les composantes régissant ces interactions.HAPEX-Sahel a montré en particulier la nécessité d'obtenir des estimations de pluie les plus précises possibles dans cette région, et notammentsur les divers sites spécialement instrumentés pour l'étude. A cet effet desalgorithmes statistiques permettant d'estimer la lame d'eau sur une zone,et de fournir un écart-type d'estimation ont été utilisés. Différentes échellesde temps ont été considérées: quelques minutes, l'événement, la décade, lemois et la saison des pluies.

Les techniques de géostatistique (krigeage) ont constitué l'outil d'analyse, particulièrement adapté ici à la représentation conceptuelle du mouvement des systèmes précipitants convectifs. Elles ont permis de quantifierl'organisation spatiale des champs de pluie pour chaque échelle de tempsau moyen d'une fonction de corrélation spatiale. Des analyses approfondiesont ensuite conduit à établir des liaisons théoriques entre ces différentsvariogrammes.

Le fait de disposer d'une modélisation de la distribution des pluies adaptée à la fois à l'échelle de l'événement et à l'échelle de plusieurs événements est aujourd'hui un apport considérable pour comprendre comment['humidité du sol et la végétation répondent à la distribution de ces pluiessur des échelles de temps allant de l'événement jusqu'à la saison des pluiestoute entière. Cette approche géostatistique a permis aussi au niveau del'événement et du cumul de plusieurs événements de quantifier les incertitudes d'estimation de la pluie en fonction de la hauteur d'eau précipitée etde la surface concernée, et d'en déd uire des critères concernant la structuredu réseau de mesures au sol. Il est à noter que ces incertitudes calculées demanière théorique, ont été validées expérimentalement (Lebel et Amani, àparaître).

Ces études ne font qu'accréditer les propos de Obled (1986) concernant la pluie en tant qu'entrée privilégiée du système hydrologique: "Cen'est pas par des considérations hydro- et thermodynamiques que nous appréhenderons sa distribution sur la superficie d'un bassin, pas plus que pardes expériences en laboratoire. Et les données recueillies au cours d'unépisode seront le seul point de départ objectif, même s'il apporte avec luiquelques sources d'erreur, pour appréhender l'entrée du système". Obled

105

préconisait alors l'utilisation de la géostatistique en ces termes, "Quant auxhydrologues, faute de reconnaître aisément dans la Géostatistique une continuité avec le savoir déjà acquis et les approches statistiques classiques,ils reculent devant un investissement intellectuel qui leur semble excessif,et se privent d'une approche qui, sans être révolutionnaire, est à coup sûrenrichissante". Les travaux récents qui viennent d'être menés au cours desexpériences EPSAT- Niger et HAPEX-Sahel ont relevé ce défi.

La caractérisation des variations des régimes de pluie (Khodjaet al. 1998)

Une place particu lière est accordée à ce dernier exem pIe don tune présentation complète fait l'objet d'un article accepté pour publication dans laRevue de Statistique Appliquée.

L'Afrique de l'ouest non sahélienne a connu autour des années 1970 unebaisse des précipitations qui coïncide avec une sécheresse marquée dans lesrégions sahéliennes. C'est ce constat qui est à l'origine du programmerCCARE (Identification et Conséquences d'une variabilité du Climat enAfRique de l'ouest et centrale non sahElienne) qui s'est fixé pour objectifd'identifier "la variabilité du climat" en Afrique de l'ouest et centrale (cf.figure 1) non sahélienne en vue d'analyser ses conséquences sur la gestiondes ressources en eau.

L'étude devait être conduite avec pour unique source d'information lesdonnées hydro-pluviométriques des réseaux de,mesure des pays concernés.Seule une analyse de ces données devait donc permettre de caractériserle phénomène ressenti autour des années 1970 et tout d'abord au niveaude la pluie. La diminution des précipitations témoigne d'une variabilitéqui peut concerner d'autres aspects du régime pluviométrique que les seulstotaux précipités: la fréquence des pluies, la sévérité des saisons sèches,et la durée des saisons des pluies. Le recours aux techniques statistiquespour détecter une "variabilité climatique" à partir de données hydrologiquesa été préconisé il y déjà plus de trente ans par l'Organisation Mondialede la Météorologie (WMO, 1966). Les techniques en question sont destests qui s'appliquent aux séries chronologiques des variables choisies pourcaractériser la variabilité recherchée.

106

,----- ~------ -- -----------------------1

figure 1

Présentation de la zone d'étude

Dans le cadre d'ICCARE l'hypothèse émise sur la nature de la variabilité climatique pressentie sur la zone d'étude est celle d'une rupture quise traduit par un saut brutal de la moyenne des séries. Des tests ou desprocédures statistiques dits "de rupture" ont donc été mis en ouvre. Il s'agitdu test de Pettitt (Pettitt, 1979), du test de Buishand (Buishand, 1982,1984), de la procédure bayésienne de Lee et Heghinian (Lee et Heghinian,1977), et de la procédure de segmentation des séries hydrométéorologiques

107

de Hubert et Carbonnel (Hubert et al., 1989). A l'exception du test deBuishand qui ne conclut que sur l'existence ou non d'une rupture, les autresprocédures proposent une estimation de la date de rupture.

Ces tests ont donc été appliqués sur chaque variable définie (pluie annuelle précipitée, nombre annuel de jours de pluie, hauteur des pluies ensaison sèche, durée de la saison des pluies) en chaque point de mesure de lazone d'étude qui couvre seize pays, du Sénégal à l'ouest à la République deCentrafrique à l'est. Ils donnent des résultats souvent concordants quant àl'existence de ruptures en moyennes dans les années 1960 et 1970, mais ilsrestent cependant difficiles à interpréter et à synthétiser dans leur ensemble.

Pour faciliter cette lecture globale, des analyses des correspondancesmultiples (ACM) ont été réalisées à partir d'une réponse du type "rupture"ou "non-rupture", ou encore "série homogène" ou "année de rupture 19..",donnée par une synthèse des résultats des différents tests appliqués site parsite et variable par variable. L'ensemble de ces réponses traité par des ACMa permis d'obtenir un résumé "objectif' d'information dont l'interprétationa débouché sur une organisation spatiale des réponses issues du traitementstatistique des séries chronologiques (C~autier et al, 1998).

Cette répartition a été confirmée par une analyse spatio-temporellegénéralisée au cas multivarié. Cette approche tridimensionnelle a permisd'une part de détecter des ruptures climatiques caractérisées par plusieursvariables pluviométriques, et d'autre part de répartir spatialement les stations ayant su bi des changemen ts sim ilai l'es su l' une période cam mune. Cetravail confié à des statisticiens a bénéficié d'un formalisme rigoureux quiest ici rapidement décrit.

Cette approche s'est déroulée en deux temps.

1 Analyse multidimensionnelle des données

Une analyse exploratoire multidimensionnelle a tout d'abord conduit àconstituer, sur la base de l'ensemble des données disponibles, des groupesde stations caractérisés par des comportements pluviométriques similairesvis à vis de l'ensemble des variables.

L'information brute a ainsi été résumée en utilisant la méthode STATIS(Structuration des Tableaux A Trois Indices de la Statistique) (Lavit, 1988).Il s'agit d'une analyse conjointe de K tableaux de données quantitatives(un tableau par station), relevées en différentes occasions, où p mêmesvariables (variables pluviométriques) ont été mesurées sur les mêmes Nindividus (années), et pour lesquels est recherchée entre autre, une structure

108

commune appelée interstructure.

Trois groupes géographiques à l'intérieur desquels les stations ont descomportements similaires ont ainsi été identifiés par STATIS. Globalement,et pour simplifier, ils s'organisent autour des noyaux suivants

groupe 1: Togo, Bénin et sud de la Côte d'Ivoire,

groupe II: Cameroun, Centrafrique et Burkina Faso, et

groupe III: Guinée Conakry, Guinée Bissau, .Mali et Sénégal.

- . ----;

o groupe Il

., groupe 1

c groupe III

--~,

1

1

/~'/("'"_/ l ' ,

-, _///"

"--,-1

1

1: Mali2: Burlo:.ina FasoJ: Niger4: Tchad5: Centrafriaue6: Cameroun7: Nigeria8: Bénin9: Togo10: Ghana11: C6te d·l ....oire12: Liberia1J: Sierra Leone1<:: Guinée Conakry1S: Guinée Bissau,6: Sénégal

figu re 2

Localisation des groupes homogènes

La distribution spatiale des stations fait apparaître assez nettementune répartition nord-sud d'une part et est-ouest d'autre part. Cependant,

109

1

Ile Ghana et le Nigeria dont les données n'ont pas été disponibles font véri-tablement défaut à l'étude.

La carte (figure 2) obtenue résume donc les comportements pluviométriques de l'ensemble des stations de la zone étudiée entre 19.50 et 1980, telsqu'ils ont été décrits par les quatre variables hyd rologiq ues reten ues.

IvIais cette organisation repose sur un faible pourcentage d'inertie expliquée par les deux premiers axes de l'ACP mise en œuvre dans STATIS.Aussi avant de poursuivre l'analyse, un test de permutation s'appuyant surl'analyse des corrélations canoniques a permis de vérifier que les groupesobtenus par STATIS étaient significativement différents vis à vis des quatrevariables étudiées. Le principe du test et son application aux données sontprésentés en détail par Khodja et al (1998), nous en retraçons ici les lignesessentielles.

Le test de permutation est ici utilisé pour étudier l'indépendance dedeux tableaux de données:

- y est le tableau croisant en lignes les stations classées par groupes eten colonnes les variables pluviométriques et dans lequel Yij est la moyenne,calculée sur ('ensemble des années, de la variable j pour la station i.

- X est le tableau croisant en lignes les stations classées par grou pes eten colonnes les indicatrices des groupes, (Xij = 1 si la station i appartient

au groupe j, Xij = °sinon)

Il s'agit donc de tester l'hypothèse nulle Ho : Les tableaux sont indépendants contre l'hypothèse alternative TL l ; Les tableaux sont liés.

Uhypothèse Ho se traduit encore en termes de permutabilité des lignesde l'un des deux tableaux.

En référence au principe de Nlardia (1971), le test de permutation estmis en œuvre en ne réalisant explicitement aucune permutation, mais enne faisant intervenir que le calcul des premiers moments de la statistiquechoisie (Mardia, 1971, Kazi-Aoual et al., 1994), en l'occurrence celle del'Analyse des Corrélations Canoniques adaptée à l'étude de l'indépendancede deux tableaux de données. Cette statistique semble en effet être la plusappropriée aux données car son approche symétrique permet l'étude desrelations linéaires entre les groupes de variables observés sur les mêmesindividus en accordant aux cieux tableaux des considérations égales.

L'hypothèse Ho a été rejetée confirmant l'existence cie différences significatives entre les trois groupes.

Il faut souligner que les groupes identifiés par l'analyse statistique sont

110

tout à fait cohérents avec la répartition sur cette région des régimes pluviométriques dont les caractéristiques premières sont le nombre de saisonsdes pluies (1 ou 2) et la quantité annuelle précipitée.

2 Test de rupture en moyenne et estimation du point de rupture

Le test de changement en moyenne et l'estimation du point de ruptures'effectuent sur les séries des moyennes intergroupes pour chaque variable.

Test de rupture en moyenne

Dans le cadre du modèle multilinéaire gaussien, on pose Xi = Ili + éi,

1 :S i :S N avec

avec éi l'V JVp(O, E) où N est le nombre d'observations, et ]J le nombre devariables.

On désire tester Ho : III = Il2 = ... = IlN contre Hl : III = Il2

... = Ilr i: Ilr+1 = Ilr+2 = ... = IlN dans le cas où r et E sont inconnus.

La statistique bayésienne suivante:

S - '1/-1 ' '- 1 ,\,N-1'(' --;-)- 1l 1l ou 1l - --1/-2 L...i=l Z :1:i+1 - x ,(a'a)

avec a' = 1/2(-(N -1), -(N -3), -(N -.5),"', (N -.5), (N -3), (N -1)),11 = L:::1 (Xi - X)(Xi - x)' et x étant la moyenne empirique de l'échantillontotal (Xl, X2 ... XN ), répond au problème posé (Srivastava, Carter, 1983) .

L'hypothèse Ho d'égalité des moyennes est ainsi rejetée au niveau 0' si :

S ~ Ca où Ca = 1- (1 + ]J(N -]J - 1)F:'N_P_1)

avec 0' = Pr(Fp,N-p-1 ~ F:'N-p-1), Fp,N-p-1 étant la distribution d'une loicie Fisher à]J et N - ]J - 1 degrés de liberté.

Estimation du point de rupture

Si l'hypothèse Ho est rejetée, la position de la rupture est recherchéeen se plaçant toujours dans le cadre du modèle multilinéaire gaussien. On

considère alors les échantillons (X1,X2,"',X r) et (X r+1,Xr+2,"',XN)' Lepoint de rupture est celui qui maximise les distances de Mahalanobis es-

111

timées entre ces échantillons et données par:

D 2 (- - )/~-l(- - )r = Xr - XN-r LJ Xr - XN-r

où Xn XN-r et t sont les estimateurs du maximum de vraisemblance, sous1'hypothèse Hl, de ILl, ftN et I; respectivement.

En notant: t = I:~=l(Xi-Xr)(Xi-Xr)/+I:::r+l(Xi-XN-r)(Xi-XN-")"

l'estimateur du point de rupture est alors celui qui maximise la statistique T; = N-lr(N - r)(xr - XN_r)'t-l(Xr - XN-r)'

Les résultats obtenus

Les techniques mises en œuvre ont permis de conclure à l'existence d'unerupture en moyenne sur les groupes 1, II et III respectivement en 1962,1969et 1967 et c'est le groupe III qui présente la rupture la plus significative.

Les résultats de cette approche viennent ainsi confirmer ceux des étudesunivariées, à savoir l'existence de ruptures en moyennes dans les années1960 et 1970 en Afrique de l'ouest. Les ruptures détectées en 1967 et 1969sur les groupes II et III confirmeraient le début d'une période déficitaire,tandis que celle du groupe 1 en 1962 (Togo, Bénin et quelques stations dusud de la Côte d'Ivoire) traduirait un déficit peu significatif.

Discussion

Les résultats des tests univariés ont été difficiles à interpréter cie parla multitude et la variété des réponses obtenues par variable et/ou parsite. Deux facteurs au moins viennent compliquer leur analyse, l'un relatifaux performances même de ces tests, l'autre lié à la nature des conditionsphysiques existant au niveau de chaque station. Une étude par simulation de la puissance et de la robustesse des tests de rupture (Lu bès-Nielet al, 1998) révèle en effet que ce n'est qu'à partir d'un taux de ruptureen moyenne supérieur à 15%, et dans les conditions d'application requisespar les tests (qui ne sont pas toujours respectées) que la puissance estiméedépasse 40%. Par ailleurs sans mettre en cause les tests eux-mêmes lesrésultats auxquels ils aboutissent peuvent être induits par des particularismes naturels locaux prévalant sur les effets à caractère régional. De faitune réalité de variation "climatique" peut être masquée par ces comportements individuels prédominants.

Face à ces réserves, l'approche multivariée directe qui a bien sûr ellemême ses propres limites - le test de détection de rupture en moyennen'échappe pas aux risques de première et de deuxième espèce comme tout

112

autre - présente tout de même l'avantage de faire ressortir des traits dominants, et de résumer toute l'information disponible sous la forme d'unesynthèse cartographique simple des variations pluviométriques à l'échellerégionale.

Conclusion

Le rôle des statistiques en hyd l'alogie vient d'être présenté à traversquelques applications réalisées au sein de l'ORSTOr..Œ.

Les outils de la statistique qui ont été évoqués, régression linéaire simpleou m ulti pIe, tests d 'hypothèse, analyse multid imension nelle, géostatistiq ue,ne représentent pas un inventaire exhaustif des techniques de cette discipline qui sont utilisées en hydrologie. Inversement la prévision des crues,la caractérisation des variabilités spatiales et/ou temporelles ne sont pasles seuls thèmes de l'hydrologie qui sollicitent la statistique. A ce proposil serait impardonnable d'oublier de citer les risques hydrologiques dontl'étude est spécialement de nature statistique: la démarche statistique"impliquée" passe par l'analyse d'observations passées pour inférer une loide probabilité théorique à partir de laquelle les probabilités d'un événementà risque (crue, sécheresse ... ) sont estimées (Lubès el al., 1994).

Les exemples qui ont été présentés montrent que pour l'hydrologie, lerecours à la statistique est le plus souvent incontournable. Dans le casde la prévision des crues de l'Amazone, le phénomène de propagation estrégi par des lois physiques et donc sa représentation par des équations derégression est due à l'absence des données nécessaires à une modélisationdéterministe. Dans le cas de l'étude des pluies sahéliennes, les données dontdispose l'hydrologue ne permettent pas une représentation physique de ladistribution spatiale des précipitations qui du reste ne peut être abordéeque par des physiciens de l'atmosphère. Il en est de même pour l'étude desvariations" climatiq ues" quand seules des données hyd ro-pl uviométriq uessont disponibles. L'utilisation de la régression linéaire s'est avérée bienadaptée, enfin, pour mesurer les effets du défrichement sur le comportementhydrologique des bassins versants.

Toutefois la statistique est affaire de statisticiens et l'hydrologie est affaire d'hydrologues. Aussi la culture statistique acquise par les hydrologuesdevrait être utilisée plus efficacement à travers un dialogue avec des statisticiens de façon à déboucher sllr tlne vraie recherche en matière de statistiqueappliquée à l'hydrologie (Masson, 1992).

113


Amani A., Lebel T., 1997. Lagrangian kriging for the estimation of Sahelianrainfall at small time steps. J. Hydra!. 192: 125-157.

Buishand T. A., 1982. Some m~thods for testing the homogeneity of rainfallrecords. J. Hydra!. 58 : 11-27.

Buishand T. A., 1984. Tests for detecting a shift in the mean of hydrological timeseries. J. Hydro!. 73: 51-69.

Cappelaere B., Lubès-Niel H., Berkhoff C., Thépaut H., Guyot J. L., MolinierM., De Oliveira E., Rodrigues l\L, 1996. Prévision des crues de j'Amazone.IAHS Publ. no. 238. 355-366.

Escoufier Y., 1992. Quels statisticiens pour l'ORSTOJ'v1 ? Séminfor 5, StatistiqueImpliquée, Cinquième Séminaire Informatique de l'ORSTOM, Montpellier2, 3 et 4 septembre 1991. 433-444.

Fritsch J. l'vI., 1990. Les effets du défrichement de la forêt amazonienne et de la miseen culture sur l'hydrologie de petits bassins versants. Opération ECEREXen Guyane Française. Thèse Université Montpellier II. 392 pages.

Gautier F., Lubès-Niel H., Sabatier R., Masson J. M., Paturel J. E., Servat E.,1998. Etude de la variabilité du régime pluviométrique de l'Afrique del'Ouest non sahélienne entre 1950 et 1989 par une analyse multivariée desrésultats de tests statistiquesd 'homogénéité de séries chronologiques. Aparaître, Hydrological Sciences Journal.

Hubert P., Carbonnel J. P., Chaouche A., 1989. Segmentation des senes hydrométéorologiques - Application à des séries de précipitations et de débitsde l'Afrique de l'Ouest. J. Hydro!. 110: 349-367.

Kazi-Aoual F., Hitier S., Sabatier R. et Lebreton J .D., 1994. Refined approximations to permutation tests for multivariate inference. Computationalstatistics and Data Analysis 20, 643-656.

I<hodja H., Lubès-Niel H., Sabatier R., Masson J. ]'vl., Servat E., Paturel J.E.,1998. Analyse spatio-temporelle de données pluviométriques en Afrique del'Ouest. Recherche d'une rupture en moyenne. Une alternati ve intéressante: Les tests de permutations. A paraître, Revue de Statistique Appliquée.

Laloë F; 1992. Séminfor 5, Statistique Impliquée, Cinquième Séminaire Informatique de l'ORST01\1, J'vlontpellier 2, 3 et 4 septembre 1991. 464 pages.

Lavit C., 1988. Analyse conjointe de tableaux quantitatifs. Editions Masson.

Lebel T., Le Barbé L., 1997. RainfalJ monitoring during HAPEX-Sahe!. 2. Pointand areal estimation at the event and seasonal scales. J. Hydro!. 188-189 :97-122.

114

Lebel T., Amani A. Rainfall estimation in the Sahel. What is the ground truth ?Submitted to Journal of Applied Meteorology.

Lee A. F. S., I-Ieghinian S. 1'v1., 1977. A shift of the mean level in a sequence of independent normal random variables: A Bayesian approach. Technometrics19(4) : 503-506.

Lubès H, Î\'Iasson J.M., Raous P., Tapiau M., 1994. SAFARHY, Logiciel de calculsstatistiques et d'analyse fréquentielle adapté à l'évaluation du risque enhydrologie. ORSTOl'vI, Université Montpellier II.

Lubès-Niel H., Masson J. M., Paturel J. E., Servat E., 1998. Variabilité climatiqueet statistiques. Etude par simulation cie la puissance et de la robustesse ciequelques tests utilisés pour vérifier l'homogénéité de chroniques. A paraître,Revue des Sciences cie l'Eau.

Mardia leV., 1971. The effect of non normality on some multivariate tests androbustness to nonnormality in the linear model. Biometrika, 58, ni, 105122.

Masson J. 1'v1., 1992. Hydrologie et Statistiques. Séminfor 5, Statistique Impliquée,Cinquième Séminaire Informatique cie l'ORSTOM, ivIontpellier 2, 3 et 4septembre 1991. 461-464.

Molinier M., Guyot J. 1., De Oliveira E., Guimaraes V., 1996. Les régimes hyclrologiques de l'Amazone et de ses amuents. IAHS Publ. no. 238. 209-222.

Obled C., 1986. Introd uction au krigeage à l'usage des hydrologues. DeuxièmesJournées Hydrologiques cie l'ORSTOM à Montpellier, 16-17 septembte 1986.174-220.

Pettitt A. N., 1979. A non-parametric approach to the change-point problem.Appl. Statist. 28(2) : 126-13.5.

Srivastava ?\'1.S., Carter M., 1983. An Introcluction to Applied Multivariate Statistics. Elsevier Science Pu blishing.

W. M. O. (World Meteorological Organization), 1966. Climatic change by a work

ing group of the commission for climatology. W. M. O. 195, TP 100, Tech.

note no. 79. WMO Geneva, Switzerland.

115

116

Dose Létale 50 Historique et perspectives

Frédéric ChiroleuG

Introduction

L'évaluation de la toxicité d'une matière active (traitement médicalou insecticide) est un important problème depuis le début du siècle. Denombreux chercheurs ont essayé de développer des outils afin de pouvoircomparer différents produits entre eux et établir une échelle de toxicité.L'approche la plus répandue consiste à estimer la dose (ou concentration)à partir de laquelle SO% de la population testée va réagir. La dose létale .50(DL.50) pour un insecticide est celle qui tue en moyenne SO% des individus.De manière générale, on peut parler de DL100]J, dose létale pour (100x]J)% de la population avec]J prenant des valeurs entre 0 et 1. Pour cela, onva réaliser une expéri mentation pou l' mesu rer l'effet cie différentes doses di,'i variant de 1 à k doses, sur plusieurs lots de sujets, ni insectes recevantla même dose di. A partir des taux de mortalité par lot, une courbe doseréponse est obtenue. Dans la partie 2, plusieurs approches qui permettentcl 'estimer la DLSO vont être présentées: non paramétrique et paramétrique(l\tIorgan 1992, I-Ioekstra 1991). Le fonctionnement des secondes sera plusdétaillé.

En agronomie, il peut être également nécessaire, clans le cadre cie la lutteintégrée (Vaissayre et al. 1995), d'étudier l'évolution de la sensibilité d'unesouche d'insectes par rapport à une même matière active. La partie 3 de cetarticle va ainsi consister en une étude cie la détection précoce d'apparition derésistance grâce à l'utilisation de l'algorithme ENI (Dempster et al. 1977)qui reprend en partie les méthodes décrites dans la partie 2. Cet outilnumérique se fonde sur l'introduction des données manquantes que sont lesappartenances à une population "sensible" ou "résistante".

Je présente le principe de cet algorithme et teste sa convergence et saprécision par simulation sur le logiciel Splus (Venables et Ripley, 1994) pour

GCentre de coopération internationale en recherche agronomique pour ledéveloppement (CIRAD-CA), l'vlABIS, avenue du Va] de Montferrand, BP 5035,34032 Montpellier cedex 1

117

le modèle probit.

Estimation de la DL5ü

N on paramétrique

Les premières méthodes mises au point sont non paramétriques. Bross(1950) et Finney (1971) présentent et comparent des méthodes simplestelles que la moyenne mobile ou l'estimateur de Spearmann-IGirber. Ellespeuvent être utilisées en présence de peu de points mais restent rustiques.Morgan (1992) propose un catalogue de nouveaux estimateurs de DL100p,avec les estimateurs à noyaux et les R-estimateurs. Ils prennent en compteune information souvent inutilisable par les modèles paramétriques décritsultérieurement. Par contre, elles demandent parfois une expérimentationplus lourde.

Paramétrique

Modèle simple

L'approche paramétrique, fondée sur un modèle explicite de la relationdose-réponse, est très ancienne (Finney 1971, Abbott 192,)) et en constanteévolution selon les difficultés rencontrées lors de chaque étude (Hasselbladet al. 1980, Stukel 1990, Atkinson et al. 199,)). Elle utilise l'existenced'une caractéristique physiologique des insectes: la dose seuil. Il s'agit dela dose à partir de laquelle l'insecte testé réagit, dans notre cas meurt. Cettedonnée n'est pas prise en compte par les approches non paramétriques.

Pour une population homogène, c'est-à-dire pour une population d'insectes présentant les mêmes caractéristiques de réponse face à la matièreactive appliquée, nous pouvons considérer le log de cette dose seuil commeune variable aléatoire S' qui suit une loi unimodale centrée en la DLSO(Figu re 1). Le choix de la loi est fonction du poids des queues que nousvoulons avoir pour tenir compte de la variabilité naturelle de la populationet de la présence d'individus hypo- ou hyper-résistants. Nous obtenonsainsi pour la dose di :

118

....1-------------------------,6 '

C')

6

--- -----,--~----~._------.,------'

10

611

aJ _~al

-20

Figure 1

Fonction de densité de la dose-seuil S.

avec F la fonction de répartition de la loi de la variable S' et 'Tli =F- 1 (Pi) la fonction de lien. De manière générale, une transformation parlogarithme décimal des doses est effectuée et nous écrivons l'équation du

modèle linéaire entre la fonction de lien et les log(di ), 'Tli = 0' + f3log (di),0' et f3 étant les paramètres du modèle. Il existe plusieurs fonctions delien (Morgan 1992) comme les fonctions log-log ('Tli = -log (-IOg(Pi))) etlog-log complémentaire (77; = log (-log(l - Pi))) mais les plus utilisées sont

les fonctions logit ('Tli = log C:ipJ), dont une écriture plus générale a été

réalisée par Stukel (1990), et probit (77i = <1)-1 (Pi) avec <1) fonction derépartition de la loi normale centrée réduite) développée par Finney (1971).

Pi est la probabilité que la dose di appliquée soit supérieure à la doseseuil de l'insecte testé, ce qui correspond à la probabilité pour un insectede mourir pour une dose di de matière active donnée. Pi équivaut donc àPr(Xij = 1) avec Xij la variable aléatoire binaire définissant la réponse àla dose di, de l'insecte j, j variant de 1 à ni, 0 pour la survie et 1 pour

119

la mort de l'individu considéré. Dans le cas d'une population homogène,nous étudions la variable aléatoire ~~'~l Xij , nombre d'insectes tués parl'application de la dose di,qui suit une loi binomiale de paramètres ni et Pi,et donc d 'hyper-paramètres Cl' et {3 qui seront à estimer.

Autres modèles

Mais nous pouvons généraliser le modèle: Abbott (192.5), Hasselblad(1980) et Hoekstra (1991) tiennent compte de la morta.lité naturelle. Atkin

son et al. (1995) utilisent des covariables comme le sexe des insectes.D'autres considèrent la loi de 5 asymétrique (Stukel 1990, 1tIorgan 1992).

L'approche bayésienne du problème est apparue après l'article de Racineet al. (1986). Le choix du plan d'expérience peut être optimisé pourl'estimation de chaque paramètre. Les connaissances obtenues au coursdes essais précédents ou grâce à l'avis d'un expert sont introd uits dans lavraisemblance du modèle en se servant d'une loi à priori. Cette a.pproche

prend en compte le caractère séquentiel de l'acquisition de l'information(Grieve 1988).

Estimation des paramètres

Une fois la fonction de lien choisie et ['écriture des Pi définie, plusieursméthodes existent pour déterminer les paramètres de ces modèles. La plusutilisée est l'estimation par le maximum de vraisemblance mais nous pouvons citer celle par le X2 minimum avec laquelle la première est comparéepar Berkson (19.5.5), Mantel (198.5) et Amemiya (1980). Il existe aussi laméthode par les moindres carrés (Green 1984) qui rejoint les précédentes.

Différents algorithmes numériques itératifs peuvent être mis en oeuvredans l'estimation des paramètres dans le cas du maximum de vraisemblance : méthode du simplexe, du gradient, du gradient projeté ou conjugué (Ciarlet 1990, Morgan 1992) et d'Iterated lleweighted Least Squares(Green 1984).

Dans les quatre derniers cas, il s'agit de créer une suite itérative de laforme

e(t+l) = e(t) + p x \ll(t)

avec e(t!, e(t+l) valeurs d'un paramètre à deux étapes consécutives, \ll(t)

gradient de la log-vraisemblance à l'étape t et p le pas de déplacement surl'axe des abscisses, par exemple l'inverse du hessien de l(t) dans le cas del'algorithme de Newton-Raphson (Green 1984).

La Figure 2 représente l'estimation d'une courbe dose-réponse à partird'une fonction de lien probit.

120

:jci

li)

t::oEtqQ)o"0li)Co:eOOQ"o..0 0

Q:

Nci

•

-1

• ~~~_J012

Doses en mgll (echelle logarithmique)

Figure 2

Courbe dose-réponse. A partir d'un échantillon (points) et d'llne fonction de lien

]Jrobit, la courbe dose-réponse (trait continu) est estimée.

Intervalles de confiance

Enfin, pour obtenir des intervalles de confiance pour les doses remarquables afin de les comparer entre elles, il est possible d'utiliser la Deltaméthode donnant des intervalles asymptotiques ou celle fondée sur le rapport de vraisemblance (Morgan 1992). Finney (1971), Cox (1990) et Sitteret Wu (1993) ont comparé les résultats de la première avec l'obtentiondes intervalles fiduciaires. Al ho et Valtonen (1995) utilisent la méthode durapport de vraisemblance associée à la méthode de Newton et la comparentavec celle fournissant les intervalles fiduciaires.

121

Détection de résistance

Apparition de résistance

Raymond et al. (1989) étudient l'apparition dans une population d'uncaractère de résistance au travers de chaque individu. A partir d'un modèlecompartimental, il essaie de comprendre l'évolution du gène de résistancepour chaque insecte.

Le travail présenté ici vise à détecter précocement l'apparition de résistances au sein d'une même population. Ceci se fait dans le cadre de lalutte intégrée (Vaissayre et al. 199.5). Cette dernière suppose des changements réguliers de produits insecticides pour éviter l'apparition de souchesrésistantes à une même matière active. La détection précoce de résistancespermettrait d'optimiser ces dates de changement de moyens de lutte auniveau de l'efficacité, du coût et de la protection de l'environnement.

Données observées

L'apparition de résistance peut débuter par une sélection d'une souspopulation résistante, ce qui se manifeste par une réponse hétérogène. Lacourbe dose-réponse reflète alors ce mélange de deux sous-populations, unesensible et une résistante. La variable aléatoire précédemment utilisée estle nombre d'insectes tués L;~l Xij par l'application de la dose di. Ici,cette variable suit toujours une loi binomiale de paramètre ni, le nombre d'insectes testés pour la dose di, et ]Ji la probabilité pour un insectede mourir sous J'application de la dose di. Mais Pi s'écrit comme la sommepondérée de deux fonctions de répartition à deux paramètres, si nous considérons que chaque sOlls-population homogène suit un modèle probit, c'està-dire

avec iii proportion d'insectes appartenant à la sous-population sensi ble etles 0' et (3 étan t les paramètres qui caractérisent chaque souspopulation.La proportion d'insectes appartenant à la souche résistante est li2 avec

li2=1-1l"1'

Algorithme EM

L'estimation de ces cinq paramètres peut s'effectuer à partir de l'algorithme EM (Dempster et al 1977, Everitt et Hand 1981, Titterington et al.1985, McLachlan et Krishnan 1997).

Cet algorithme se fonde sur l'étude de données dites complètes fij =(Xij , Zij). Xij représente toujours la réponse de l'insecte j à l'applicationde la dose di. Zij = (Zijl' Zij2) est le vecteur indicateur d'appartenance

122

de l'insecte j à l'une ou l'autre des sous-populations et prend les valeurs

(0,1) ou (1,0). Les Xij sont les données observées et les Zij sont les donnéesmanquantes.

Nous pouvons écrire que la probabilité Pl' (Xij = Xij, Zij = Zij) = Pijest égale à la probabilité pour l'i:~secte j de mourir ou non à la dose diappliquée et d'appartenir à l'une des deux sous-populations. ]Jij peut se

décomposer en Pl' (Zij = Zij) XPr (Xij = xi)IZi) = Zij) . En posant Fil (1) =

<I> (0'1 + (31 log (di)) et Fil (0) = 1 - <I> (O'k + (3k log (di)), ]Jij s'écrit

L'algorithme se décompose en deux étapes principales, Expectationet Maximisation. A chaque itération t, il s'agit de travailler sur la logvraisemblance des données complètes,

le (Zll, Xll, ... , Zknk' Xknk; 0)k ni 2

L L L Zijl X [log (KI) + log Pl' (Xij = XijlZijl = Zijl; 0'1, (3t}J .i=l j=l 1=1

Nous allons considérer () = (KI' 0'1' (31' 0'2, (32) comme paramètres dumodèle. A partir de valeurs initiales quelconques

0(0) = (KiO), O'lO), (3iO), O'~O), (3~0)) , l'étape Expectation correspond à j'é

criture de

E (le (Zll, X ll , ... , Zk1lk' X k1lk ;0) I..'Y = x; O(t)) connaissant les données

observées, avec X = {Xij};j' et les valeurs des paramètres à l'instant t.

Ceci permet de remplacer les Zij inconnus par E (ZijIXi) = Xi); O(t)) ={À;:) (Xi))} 1 de composante

(t) ( - )\1 (Xi)) = Pl' Zijl = 11Xij = Xij; ()(t). En utilisant la formule de

Bayes, nous obtenons

(t) P (v _ . IZ _ . (t) (3(t))(t) . _ KI X l' ..'"'ij - Xij ijl - 1,0'1 , 1

Àil (Xij) - ----=-2------'---------------:....-

L Kht) X Pl' (Xij = Xi)IZi)h = 1; O'~t), (3ht

))h=l

E (le (Zll, X ll , ... , Zk1lk' X k1lk ;0) I..'Y = x; O(t)) n'est plus fonction que

du vecteur de paramètres inconnus O.

123

( (- r - -) - - -(t))E le Zu,Xu, ... ,Zknk,Xknk;() IX=x;()

k n' 2. ( )L L L \: (Xij) log (7fI)i=l j=l /=1

k ni 2

+L L LÀ;:) (Xij) log Pl' (Xij = XijlZijl = 1; 0'" ,B,)i=l j=l 1=1

QI ( 7f1, X u , "', X knk ;è(t)) +Q2 ({O'I, ,B'}I' X U , ... , X knk ;è(t))

Dans cette étape, les paramètres sont fixés et on estime la probabilitémoyenne d'appartenir à l'une ou l'autre des populations en tenant comptedes données observées.

L'étape Maximisation est une étape classique de maximisation de logvraisemblance avec résolution du système

{JE (le (Zu, X u, ... ,Zknk' X knk ;è) /..Y= Xi è(t))Mm =0

avec m variant de 1 à 5. En fait, QI est fonction de "1 uniquement, etQ2 fonction des {O't}1 et {,Bt}1= 1,2' donc l'estimation de 7fi

t +1) va se faire à

partir de ~ = 0 et celle des quatre autres paramètres à partir de :~~ = 0,7n variant de 2 à 5.

Nous obtenons ainsi, après résolution:

k (t) ( ni ) k (t) [ ni ]2: Àil (1) 2: Xij + 2: Àil (0) 2: (1 - Xij)(t+1) .=1 J=l .=1 J=l

"1 = k

2: nii =1

"Connaissant" les À;:) (Xij), nous pouvons estimer pour chaque dose i

le nombre de morts dans les sous-populations par À;:) (1) C~l .'C ij ) et le

nombre de survivants par À;:) (0) [j~l (1 - Xi j )]. Nous séparons chaque

lot en sous-lots homogènes sur lesquels nous appliquons l'algorithme deNewton-Raphson présenté dans la partie 2.2 (procéd ure GLM de Splus,

Venables et Ripley 1994) afin d'estimer les {Œ;t+1)}1 et {,B;t+1)}/.

Nous obtenons alors 8(t+1) = (7fit + 1), 0'~t+1), ,Bit+1), 0'~t+1), ,B~t+l)) qui est

utilisé pour l'itération suivante jusqu'à atteindre des valeurs qui vérifient

124

un critère d'arrêt qui dépend de la précision souhaitée pour l'estimationdes paramètres.

4

/

o 2Doses en mg!1 (echelle logarithmique)

lX)

ci

01~

Nci

~.

/,/ /

./ :.'

./ ;'

/

/'-/.

:;L·_··_._.. ~ ~ ~ _-2

'"t:0<0E .oal'0

'"<:ot~000.oet

Figure 3

Echantillon de population hétérogène (points) et courbes dose-réponse estimées

pour les populations sensible(trai[ en morse), hétérogène (trait continu) et

résistante (pointillés).

La Figure 3 présente un échantillon de points et des estimations descourbes dose-réponse pour la population hétérogène et pour les sous-populations détectées.

La vitesse de convergence de cet algorithme est très lente mais McLachlan et Krishnan (1997) proposent des méthodes d'accélération. Le choix desvaleurs initiales des paramètres, bien que non primordiales pour le point deconvergence atteint sauf en cas cie maxima locaux de la log-vraisemblance,peut jouer un rôle dans le nombre d'itérations nécessaires pour arriver àce point. McLachlan et Krishnan (1997) donnent aussi l'écriture des intervalles de confiance asymptotiques à partir de la matrice d'informationde Fisher des données complètes, observées et manquantes qui restent àadapter à notre problématique.

12.5

Conclusion

L'algorithme EM est Ull puissant outil statistique et correspond à laproblématique rencontrée. Le choix du nombre de sous-populations présentes dans l'échantillon testé peut se faire en utilisant un rapport de vraisemblance et la méthode de Monte-Carlo avec comme hypothèse nulle l'homogénéité de la population (Courcoux et Semenou 1997).

îvIalheureusement, de gros problèmes subsistent. Le premier est lavaleur du point de convergence par rapport à la valeur attendue. En effet,le phénomène peut ne pas être bien rendu par la courbe dose-réponse enterme d'observation de mélange. Le signe pour reconnaitre un mélange important est l'existence d'un palier sur la courbe au niveau du pourcentaged'individus sensibles. Il peut, par exemple, ne pas y avoir assez de doses etla courbe sera "trop" lissée. La variabilité naturelle peut amener à laisserapparaître un palier là où il ne devrait pas y en avoir, ce qui provoque uneconvergence de l'algorithme EM vers ce point.

Il sera donc intéressant de rechercher à partir de quelles valeurs dunombre d'insectes et de doses, l'algorithme va pouvoir déceler le phénomèneattendu. Ainsi on espère que grâce à un algorithme performant, l'apparitionprécoce de résistance pourra être détectée. Tout ceci est nécessaire pourvalider la méthode dans le cas pratique où souvent, le nombre d'invidus etle nom bre de doses peu vent être lim ités (taux fai ble de reprod uction dessouches et dilution difficile des matières actives).


Abbott \V.S. (1925), A method of computing the effectiveness of an insecticide, 1.of Economie Enlomology, 18, 265-267.

Alho J.1\'1., Valtonen E. (1995), Interval estimation of inverse close-response, Biomel1oies, 51, 2, 491-501.

Amemiya T. (1980), The n 2-orcler mean squared errors of the maximum likelihoodand the minimumlogit chi-square estimator, The Arwals of Slalislies, 8, 3,488-505.

Atkinson A.C., Demetrio C.G.B., Zocchi S.S. (1995), Optimum dose level whenmales and females differ in response, Applied Slalislies, 44, 2, 213-226.

Berckson J. (1955), Maximumlikelihood and minimum X2 estimates of the logis ticfunction, JASA, 50, 130-162.

Bross 1. (1950), Estimates of the LD50 : a critique, Biomelries, 6, 4, 413-423.

126

Ciarlet P.G. (1990), Introduction à l'analyse numérique matricielle et à l'optimisation, 4ème tirage, Masson.

Cox C. (1990), Fieller's theorem, the likelihood and the delta method, Biometries,46, 3, 709-718.

Courcoux P., Semenou J'vI. (1997), Une méthode de segmentation pour l'analysede données issues de comparaisons par paires, Reu. Statistique Appliquée,45, 2, .59-69.

Dempster A.P., Laird N.M. and Rubin D.B. (19ïï), j'l'Iaximum likelihood [romincomplete data via the EM Algorithm, J.R.S.S. B, 39, 1-38.

Everitt B.S., Hand D.J. (1981), Finite mixttlre distributions, Chapman and Hall,London.

Finney D.J. (1971), Probit alwlysis, 3rd edition, Cambridge University Press.

Green P.J. (1984), Iteratively reweighted least squares for maximum likelihoodestimation, and some robust and resistant alternatives, + Discussion ofDr's Green paper, J.R.S.S. B, 46,2, 149-192.

Grieve A.P. (1988), A bayesian approach to the analysis of the LD.50 experiments,Bayesian statisties, 3, 617, 630 (Oxford university press).

Hasselblad V., Stead A.G., Creason J.P. (1980), l'vIultiple probit analysis with anonzero background, Biometries, 36, 4, 659-663.

Hewlett P.S., Plackett KL. (1979) 1 The interpretation of quantal responses inbiology, Edward Arnold, London.

Hoekstra .1 .A. (1991), Estimation of the LC50, a reVlew, Enuironmetrics, 2, 2,139-152.

ivIantel N. (198.5), Maximum likelihood vs. minimum chi-square, et réponse deSmith IeC., Robertson J.L., Savin N.E., Biometries, 41, 3, ïï7-783.

McLachlan G.J., Krishnan T. (1997), The EM algorithm and extensions, John\Viley & Sons, New-York.

l\'1organ B.J.T. (1992), Analysis of quantal response data, Chapman and Hall,London.

Nelder J.A., Mead R. (196.5), A simplex method for function minimization, Thecomputer journal, 7, 309-313.

Racine A., Grieve A.P., Fllihler H., Smith A.F.M. (1986), Bayesian methods inpractice : experiences in the pharmaceutical industry, + Discussion of thepaper by Ml'. Racine et al., Applied Statisties, 35, 2, 93-150.

Raymond i'v!., Heckel D. G., Scott J.G. (1989), Interactions between pesticidegenes : model and experiment, Genetics, 123, 543-551.

127

Sitter R.R., Wu C.F.J. (1993), On the accuracy of Fieller intervals for binaryresponse data, J.A.S.A.) 88,423, 1021-1025.

Stukel T.A. (1990), A general model for estimating ED 100p [or binary responsedose-response data, The American Statistician, 44, 1, 19-22.

Titterington D.lVI., Smith A.F.lVI., Makov U.E. (1985), Statistical analysis of finitemixture distributions, John Wiley & Sons, New-York.

Vaissayre M., Cauquil J., Silvie P. (1995), Protection clu cotonnier en Afriquetropicale-méthodes et moyens cie lutte intégrée contre les ravageurs, AgI'. etdév., 8,4-23.

Venables W.N., Ripley B.D. (1994), Modern applied statistics with S-plus, Springer

verlag (statistics and computing), New-York.

128

Influence de la jachère sur les peuplements denématodes phyto-parasites au Sénégal:

protocoles de collecte et d'analyse des donnéeset premiers résultats

Jean Thioulouse G,C

N'Deye N'Diaye b,c

Introduction

Emmanuelle PateG,cPatrice Cadet C

L'objectif de ce programme de recherche est l'étude des relations entre les nématodes phyto-parasites, le sol, et l'environnement végétal ensituation de jachère. Il a été entrepris récemment au Sénégal et il est intégré au programme de l'ORSTOM "Raccourcissement du temps de jachère,Biodiversité et Développement Durable en Afrique Centrale (Cameroun)et en Afrique de l'Ouest (Sénégal, Mali)" (contrat n° TS3-CT93-0220,DG12HSMU), dont la finalité est la restauration de la fertilité des solspar une jachère naturelle "améliorée". C'est un programme multidisciplinaire dans lequel les biologistes (dont les nématologistes), interviennentde manière coordonnée avec des agronomes, des pédologues, et des hydrologues.

- le premier objectif consiste à comprendre le fonctionnement du peuplement de nématodes en fonction de l'évolution de la flore (plantes hôtes)et des transformations des caractéristiques biologiques et physico-chimiquesdu sol ind uites par la jachère.

- le second objectif consistera à intégrer les informations obtenues par lesautres disciplines pour développer une technique de gestion et de régulationdes peuplements de nématodes phyto-parasites (pendant la jachère puispendant la culture) qui s'appuie sur une sélection, à partir de leur incidence

aUniversité Lyon 1, UMR CNRS 5558, 69622 Villeurbanne CedexbUniversité Cheikh Anta Diop, Dakar, SénégalcORSTOM, Laboratoire de Bio-Pédologie, BP 1386, Dakar, Sénégal

secondaire sur le peuplement de nématodes, des interventions destinées àaméliorer les différentes composantes biotiques et abiotiques de la fertilité.

Deux thèses sont en cours de rédaction sur ce thème: l'une porte surles relations plantes de jachère - peuplements de nématodes (EmmanuellePate, Université Lyon 1, UMR 5558), l'autre a pour thème les relationsentre les facteurs abiotiques telluriques et les peuplements de nématodes(N'Deye N'Diaye, Université de Dakar, Biologie Animale).

Matériel et Méthodes

Le protocole de récolte des données porte sur deux sites au Sénégal:Thyssé-Kaymor et Kolda, qui se différencien t au niveau de l'an th ropisation,du climat et de la végétation. Seul le site de Thyssé-Kaymor sera présentéici.

Plusieu rs échelles de struct uration spatio-tem poreIles son t prises encompte dans le protocole de récolte des données. Sur le plan temporel, le recueil des données s'est déroulé sur trois années: 1994,199.5 et 1996. Chaqueannée sauf en 1994, six missions d'échantillonnage ont eu lieu, en mars(saison sèche) , juin (début saison des pluies), juillet (saison des pluies),septembre (saison des pluies), octobre (fin de saison des pluies) et novembre (début de saison sèche). En 1994, seulement cinq missions ont eu lieu(juin à novem bre) et on dispose donc en tout de 17 dates d'échantillonnage.

Au plan spatial, 16 points de prélèvement sépa.rés de 1,50 m sont alignésle long de tra.nsects disposés dans des parcelles de jachères d'âges différents(1 an, 8 ans et 18 ans). Certaines jachères sont protégées de l'activité humaine (parcelles mises en défens) et certaines sont exploitées: cueillette,ramassage de bois, feu, pâture des troupeaux, etc .. Un transect supplémentaire est situé dans une zone n'ayant jamais été cultivée (forêt). Au total,les données relatives à 11 transects sont disponibles.

Les diverses espèces de nématodes appartenant aux différents groupestrophiques (ectoparasites, endoparasites, migrateurs et saprophages) sontdénombrées dans les échantillons collectés à chaque point de prélèvementle long des transects. Pour la présente étude, seules huit espèces phytoparasites majeures sont prises en compte, et les effectifs sont transformés en Log(x+1). Les espèces sélectionnées sont: Scuteilonema caveness'i(Scu), Helicotylenchus dihystem (Hel), Tylenchorhynchus gladiolatus (TgI),Tylenchorhynchus mashhood'i (Tma), Pmtylenchus pseudopmtens'is (Pra),Trichotylenchus falcifornl'is (Tri), Ditylenchus spp. (Dit), et Gmcilacusparvula (Gra). Les espèces végétales présentes, l'aspect de la végétation,

130

la hauteur moyenne, l'estimation de la biomasse aenenne et souterrainesont enregistrés. Des analyses pédologiques fournissent, pour chaque pointdes transects, les paramètres physico-chimiques du sol. Ces analyses pédologiques ne sont effectuées qu'une seule fois par an, en 1994, 1995 et1996. Les 15 variables mesurées sont: le pourcentage d'argile (Cla), limonfin (PSi), limon grossier (CSi), sable fin (FSa), et sable grossier (CSa),ainsi que les teneurs en carbone (C), azote (N), phospore (P), calcium(Ca), magnésium (Mg), sodium (Na), potassium (K), la capacité d'échangecationique (CEC), le taux de saturation (Sat), et le point de flétrissement(PF4).

Les méthodes d'analyse de données utilisées sont l'analyse triadiquepartielle (Thioulouse et Chessel 1987) pour analyser les séries de tableauxnématologiques et pédologiques; l'analyse de co-inertie (Chessel et Mercier,1993; Dolédec et Chessel 1994) pour étudier les relations nématodes-sol;et la méthode STATICO, qui est une analyse triadique partielle sur lestableaux croisés de coinertie à chaque date (Chessel al., 1996, Simier et al.,1996). Les calculs et les représentations graphiques sont réalisés à l'aide dulogiciel ADE-4 (Thioulouse et al., 1997), qui est disponible gratuitementsur le réseau Internet à l'adresse \iVeb suivante:http://pbil.univ-Iyon1.fr/ADE-4/ADE-4F.html.

Résultats

La figure 1 montre les résultats de l'analyse triadique partielle effectuéesur les données nématologiques, pour les 17 dates d'échantillonnage, leshuit espèces de nématodes et les 16 points de chacun des 11 transects, enconsidérant un tableau par date (dans chaque tableau les espèces sont encolonnes et les points des transects sont en lignes). La figure lA montre lepremier plan factoriel du compromis pour les espèces de nématodes, et lafigure lB le premier plan factoriel du compromis pour les points des transects. La figure 1C représente le premier plan factoriel de l'intrastructure.Les points correspondants aux transects et aux dates ont été représentésdans des graphiques séparés et seules les six premières dates sont figurées.Il existe une structure stable au cours des trois années d'étude, qui est bienexprimée par le compromis. L'examen des plans factoriels et le retour auxdonnées montre qu'il s'agit d'une modification du peuplement de nématodes au cours du vieillissement de la jachère (1 an, 8 ans, 18 ans), avecune diminution des effectifs de Scutellonema et une augmentation des effectifs d'Helicotylenchus, qui se traduisent par un déplacement des points destransects de la gauche vers la droite des plans factoriels. Dans la parcellede forêt, on note cependant la réapparition de Scutellonema. Parallèle-

131

ment à cette modification du peuplement, on observe une augmentation de

la variabilité intra-transects avec l'âge de la jachère.

A

.SaJ -----~--------]

1

1

'P 1

ra .1full

'Dit 'Tri 1

-------- ---------------~1

1hB 1

·Tgl

18a D, Forêt18a D

18a

.--- - _. - -- ._. - --_.- - ----- --- - -.--- ....... --- -. - - - - -. - ---- - ...-- - - .. - - -- --- - -- ---- -- - -- - ---- - ---- --- - - -- --, ,, ,

C 1a DaD 1a DrD: 8a :1a Da 1a DrD i 8a i 18a

juin 94 Ea6311 II~ I:t~~' Il-~' 1:[1 II-~ 1H~· II+iÙ1 1juil 94 B363H \\1 -I!I~'-: 1H~' nE I-~·· 1H~. \I-F, l:l-f 1

o:=J u=J lz=1cc=1'~~'r::I=Jr::::E=1~o;::=]'~sept 94 [l-J-i- LO L cU-h±~1 LL=ljLi=Jlb~IcL.ib

oct 94 H-Ira s=J E~-+tf 1H· lIE h~ '1 H'~ II-E' \\1 f -1nov 94 a=:J [;C] I.LJ w:::=1i~~:~~~Iq:;=J:~

LL.J~O-J~.lL.JLLJ·LL..J~I LI::...J~LLJ

mars 95 Er 1rr=J63Er lit<t ll'{~ lilJr' jH~··3 \+ 11-r.;jllf~1 1 \ 1

Figure 1: Résultats de l'analyse tl"iadique pm"tielle sur les données néma

tologiques, pour les 17 dates d'échantillonnage, les huit espèces de nématodes et

les 16 points de chacun des 11 transects, en considérant un tableau par date (dans

chaque tableau les espèces sont en colonnes, et les points des transects sont en

lignes). lA : premier plan factoriel du compromis pour les espèces de nématodes.

lB : premier plan factoriel du compromis pour les points des transects. 1C : pre

mier plan factoriel de l'intrastructure (les points correspondants aux transects et

aU:l: dates ont été représentés dans des graphiques séparés, et seules les six pre

mières dates sont figu1"ées). Da = Défriche ancienne, Dr =Défriche récente, D =

Défens.

132

La figure 2 montre les résultats obtenus sur les données pédologiques de1994, 199,5 et 1996. L'analyse triadique est effectuée sur les trois tableauxcomportant en colonnes les 1,5 variables pédologiques et en lignes les pointsdes 11 transects, Elle révèle ici aussi la forte influence de l'âge de la jachère,en particulier sur la granulométrie du sol des parcelles (gradient de granulométrie imputable à l'érosion du sol pendant la culture et au retourd'éléments fins pendant la période de jachère). Les parcelles en jachèredepuis seulement un an ont une granulométrie grossière et le taux d'argileaugmente pour les jachères de 8 ans et surtout de 18 ans. La parcelle situéeen forêt possède cependant un sol particulièrement sableux. On note aussil'existence d'une structure liée à la composition ionique (Mg, Ca, K, P)dans les parcelles de jachère anciennes,

A I------------------!-·~t - -- -- - ---ll '(S:j ~1 'FS3. K: 'p1 .

1

1 .______ I ~'!:~~a 1

l 'N:! C œ:::PF4

1'FSi

B

i

1

L._. . L. ~Çsi J

1994

1996

1a DaO 1a OrO 8a 18a 18a 01a Da 1a OrO 8a 18a 18a 0 Forêt

i -:- i-- --1- -- -- -- [I------l -[--.1 '! ' 1.', b'" l• 1 - "1 • ;. ! L • '1~

F+-----:H--:t[[~11E~=>J~ ~~ .~_.-IlFigtlre 2: Résultats de l'analyse triadique partielle sur les données pédologiques

de 1994, 1995 et 1996. L'analyse triadique est effectuée sur les trois tableaux

comportant en colonnes les 15 variables pédologiques et en lignes les points des Il

transects. 2.4 : premie7' plan factoriel du comp1'Omis. 2B : premier plan factoriel

de l'intrastructure.

133

Le couplage entre les données nématologiques et pédologiques est effectué grâce à la méthode STATICO, dont les résultats sont résumés dans lafigure 3.

.Hel

,-----l

lA p~all '

I

TIm

!

i Olti

Gra l. 'Tri 1

!------.----- - _.~! Tgl :11

!

c

--:- ---.--~~-8]'Csi 1

'C

_. __ ~Si 'K_. I_.._~__~PF~ .CU; . J,sat 1

'M:j N3 1

Clpca i !a· 1 1

l \1 1

1 1 'FSa :, .. . .. ..._i. ----l

D

Figm'e 3: Résultats de l'analyse de la relation nématode-sol par la méthode

STA TICQ. 3A : p7'emie7' plan factoriel du compromis pOUT les espèces, 3E : premie7'

plan factoriel du compromis pour les variables pédologiques. 3C: premier plan

factoriel de l'intmstructure pour les données nématologiques. 3D: premier plan

factoriel de l'intrastructure pour les données pédologiques.

134

Pour les données nématologiques, c'est la moyenne annuelle des effectifsde nématodes qui a été utilisée ici, de façon à disposer d'un seul tableau(transects x espèces) pour chaque année. Les données pédologiques sontcelles analysées par l'analyse triadique partielle dans le paragraphe précédent. Les figures 3A et 3B montrent le premier plan factoriel du compromispour les espèces de nématodes (3A) et pour les variables pédologiques (3B).Les figures 3C et 3D montrent le premier plan factoriel de l'intrastructurepour les données nématologiques (3C) et pédologiques (3D).

Le compromis exprime ici la partie stable de la co-structure pour lestrois années. Les tests de permutations des analyses de coinertie effectuéespour chaque année séparément montrent que cette co-structure est trèsforte. On voit sur la figure 3 qu'elle relie le gradient de granulométrie etla composition du peuplement de nématodes en Helicotylenchus et Scutellonema. Scutelfonema est plus abondant dans les sols à caractère sableux,et plus rare dans les sols à granulométrie fine, alors qu'Helicotylenchus estplus abondant dans les sols argileux et plus rare dans les sols à granulométrie grossière. Sur l'axe 2, on note que l'abondance de Pratylenchus etT. rnashhoodi peut être reliée négativement aux teneurs en ions Mg, P, Ca,et Na.

Discussion

L'analyse triadique des données nématologiques a été effectuée à partirde tableaux construits par date d'échantillonnage. Chaque tableau possèdealors en colonnes, les espèces de nématodes, et en lignes, les transects. Dansces conditions, l'analyse recherche une structure stable, commune aux différentes dates d'échantillonnage. Elle fait ressortir l'influence de l'âge de lajachère, c'est-à-dire les différences entre transects. Cela ne signifie pas qu'iln'existe pas de variations saisonnières (et des variations inter-annuelles).L'analyse triadique pratiquée en prenant un tableau par transect montre d'ailleurs que ces structures existent bien, et sont liées au cycle dedéveloppement des nématodes et à l'influence de l'alternance saison sèche saison humide. Le retour aux données montre cependant que, quantitativement, les différences entre transects sont bien plus fortes que les variationstemporelles au cours des trois années d'étude.

Plusieurs tendances sont mises en évidence par cette analyse:

i) La durée de la jachère a une influence déterminante sur la structuredu peuplement et, dans une certaine limite sur sa variabilité.

Il ressort que les deux espèces de nématodes qui sévissent dans les

135

champs cultivés: S. cavenessi et T. gladiolatus (Germani, Baujard et Luc,1985), sont surtout présentes dans les jachères jeunes et qu'elles ont tendance à disparaître lorsque la jachère vieillit, au profit d'un peuplementnettement plus diversifié dominé par H. dihystera et Gracilachus parvula (Cadet et Floret, 1995). Les caractéristiques nématologiques suivantescaractérisent les tranches d'âges croissantes de jachère:

- jachères jeunes (moins de 3 ans) : S. caveness et T. gladiolatus.

- jachères moyennes (environ 10 ans) : T. gladiolalus If. dihystera et P.pseudopratensis.

- jachères âgées (plus de 15 ans) : H. dihystera et Gracilacus sp.

Cependant, S. cavenessi réapparaît avec JI. dihystera et P. pseudopratensis dans la forêt qui, sans être exactement une jachère, est senséefigurer la situation extrême en terme de durée de jachère. Il est probablequ'une étude longitudinale permettrait de lever l'indétermination concernant la part de l'influence respective du vieillissement de la jachère et dela position des parcelles dans la toposéquence. Trois années d'étude sontmalheureusement insufisantes pour espérer lever cette indétermination ici.

ii) La protection des jachères pendant .5 ans, contre toute forme d'exploitation (Hommes, bétail, feu etc ... ), qui a une influence considérable surle développement de la végétation (Bodian, 1993), ne semble pas avoird'incidence majeure sur le peuplement de nématodes. Cependant, l'analysestatistique n'était pas ciblée sur l'étude des effets de la mise en défens.

iii) Il peut apparaître des variations que nous ne pouvons pas expliqueravec les seuls résultats nématologiques, comme par exemple, l'un des transects dans une parcelle cIe jachère de 18 ans, qui présente un profil spécifiqueproche de celui d 'u ne parcelle de 8 ans.

Ces résultats prouvent que la jachère est un moyen de lutte efficace contre les nématodes dans la zone soudano-sahélienne, même si son action surle peuplement global est plus qualitative que quantitative. La diminutiondes effectifs de certaines espèces sous l'effet du vieillissement de la jachèreest compensée par le développement d'autres espèces.

Partant du principe que le peuplement qui sévit sur les cultures estnécessairement le plus pathogène, il est évident que le bénéfice obtenu par lamise en culture après jachère résultera non seulement de l'amélioration despropriétés physico-chimiques du sol (infiltration, taux de matière organique... ), mais aussi de la diminution de la pression parasitaire due en partie àla disparition de certaines espèces de nématodes (Cadet et Floret, 1995).

Plus le temps de jachère augmente plus le peuplement se diversifie.

136

Ce résultat s'explique probablement par l'évolution de la végétation quitendrait à faire disparaître ou apparaître des plantes hôte de ces parasitesstricts. Au demeurant, comme tous les organismes vivants, ceux-ci sontégalement sensibles aux influences mésologiques et en particulier aux caractéristiques du sol, dont les variations latérales s'amplifient en fonctiondu temps de jachère à cause de l'hétérogénéité induite par l'évolution côteà côte des groupements végétaux (zones herbacées, à ligneux, zones nues... ) qui constituent la jachère (Donfack et al., 1995).

Sur la base des résultats nématologiques, dans la mesure où l'une des espèces majeures des champs cultivés, S. cavenessi, réapparaît dans la forêt, ilest possible de déterminer une durée optimum de la jachère, qui se situeraitautour de 15 ans. Mais cette conclusion est basée sur l'observation d'unseul transect en forêt.

Bien que toutes ces parcelles soient relativement proches les unes desautres, situées sur un même type de sol ferrugineux peu profond, l'étudede leurs caractéristiques physico-chimiques révèle l'existence de différencesprobablement issues de leur position sur la toposéquence. Plus les jachèressont anciennes et plus leurs sols sont argileux et hétérogènes, à l'exceptionde la forêt (au sonlmet de la toposéquence) où les sols sont aussi sableuxque ceux des parcelles récemment mise en jachère. On note également desdifférences entre les transects situés dans la parcelle de jachère de 18 anset entre parcelles de 18 ans anthropisées et en défens.

L'analyse simultanée des caractéristiques du sol et des peuplements denématodes apporte des informations extrêmement intéressantes, comme larelation entre S. cavenessi et les sols sableux, principalement représentéspar les jachères jeunes et la forêt. Ceci nous autorise à émettre l'hypothèseselon laquelle, ce serait peut-être le statut "argileux" des jachères anciennesqui expliquerait la disparition de cette espèce sur ces situations, plutôt quela raréfaction des plantes hôtes potentielles. Cependant, il n'y a pas plusde S. cavenessi sur l'un des sites de la jachère de 18 ans, dont la tendanceest très sableuse, que sur l'autre site qui l'est moins. Par ailleurs, tous leschamps de mil (plante hôte) de la zone sont infestés par S. cavenessi et T.gladiolat1ls, mêmes ceux qui sont situés à proximité des jachères ancienneset dont le taux d'argile du sol est aussi élevé. La texture du sol ne suffitdonc pas à expliquer la disparition de S. cavenessi.

Dans le contexte agronomique général qui sévit depuis quelques dizainesd'années, caractérisé par la diminution du temps de jachère, il est évidentque les champs continuellement cultivés sont sensibles à l'érosion qui contribue à éliminer les éléments fins du sol (argile) et par conséquent à faireaugmenter le taux de sable. Une situation qui pourrait donc être de plus en

137

plus favorable au développement de S. cavenessi. Comme il n'est pas possible de modifier cette tendance, c'est probablement en jouant sur d'autresfacteurs, comme par exemple le taux de matière organique, qu'il serait possible de contrebalancer ce phénomène. En revanche, en ce qui concerne T.gladiolatus, qui est moins sensible que S. cavenessi à l'environnement abiotique, ces résultats laissent penser qu'il existe peu de chance de le combattrede cette manière.

Cette analyse permet également de mettre en évidence une relation entre P. pseudopratensis et T. mashhoodi, et des teneurs en calcium, magnésium, phosphore ou sodium. Indépendamment des causes de cette relation,qu'il convient d'étudier, cela sous-entend qu'une variation de leur concentration dans le sol pourrait avoir une incidence sur les niveaux de populationdes deux espèces de nématodes et de ce fait interagir sur l'équilibre spécifique au sein du peuplement. En d'autres termes, ceci pourrait avoir deuxtypes de répercussions:

- D'une part influencer indirectement, par l'intermédiaire des relationsethologiques, la proportion d'une autre espèce du peuplement, comme parexem pIe T. gladiolatus.

- D'autre part, permettre le maintien de ces espèces dans les champsoù elles disparaissent bien que les cultures vivrières de cette zone, commele mil, soient des plantes hôtes de ces espèces. Avec pour conséquence, unaccroissement de la biodiversité qui, comme l'indique la bonne croissancedu mil après jachère malgré la présence d'un peuplement numériquementaussi important que dans les champs, semble associé à une diminution dela pathogénicité globale du peuplement (Cadet et Bois, 1997).


Bodian A. 1993. Influence de la mise en défens sur la végétation des jachèresanciennes et de savanes dans la région du Sine-Saloum. Mémoire, InstitutSénégalais de Recherches Agricoles, Dakar, Sénégal. 40 p.

Cadet P et Bois J. F. 1997. Pathogenic effect of two cOl11l11unities of plant parasiticnematodes on vegetative growth on millet in Senegal (Abstr.). African PlantProtection. (Sous presse)

Cadet P et Floret C. (1995). An initial study of fallow periods on the nematodecommunity in the soudanese - sahelian zone of Senega1. Acta éco!ogica, 16: 77-88.

Chessel D. et Mercier P. (1993) Couplage de triplets statistiques et liaison espèceenvironnement. Biométrie et Environnement (eds J.D. Lebreton et D. Asselain), pp. 15-44. Masson, Paris.

138

Chessel D., Simier NI. et Hanafi M. (1996). STATICO STATIS et Co-inertie.Documentation du logiciel ADE-4.http://pbil.univ-lyonl.fr/ ADE-4/volume5F.html,

ftp:j/pbil.univ.]yonl.fr/pub/mac/ ADE/ ADE-4/DocThemPDF/Thema58.pdf.

Dolédec S. et Chessel D. (1994) Co-inertia analysis : an alternative method forstudying species-environment relationships. Freshwater Biology, 31, 277294.

Donfack P., Floret C et Pontanier R. 1995. Secondary succession in abandonedfields of dry tropical northern Cameroun. Journal of Vegetation Science, 6: 499 - 508.

Germani G., Baujard P. et Luc M. (1985). La lutLe contre les nématodes dans lebassin arachidier sénégalais. Paris: ORSTONI. 26p.

Simier M., Hanafi j'vI. et Chessel D. (1996) Approche simultanée de K couplesde tableaux. Recueil des résumés des communications des XXVlIIèmesJournées de statistique, Université Laval, Québec, Canada, 27-30 rdai 1996.673-676.

Thioulouse J. et Chessel D. (1987). Les analyses multitableaux en écologie factorielle. I: De la typologie d'état à la typologie de fonctionnement par l'analysetriadique. Acta Oecologica, Oecologia Generalis, 8, 4, 463-480.

Thioulouse J., Chessel D., Dolédec S. et Olivier J.M. (1997). ADE-4: a multivari

ate analysis and graphical display software. Statistics and Computing, 7,

7·5-83.

139

De l'obse...vation à l'anal~se,

il'l'lplication de la biol'l'létt'ie

dans les pa~s en développel'l'lent

F. Laloë et X. Pe......ie... - !'Jo 15

alyse la bioM'lét~ie

Documents