-
1
Universit Pierre et Marie Curie, Universit Paris-Sud, Ecole des
Mines de Paris
& Ecole Nationale du Gnie Rural des Eaux et des Forts
DEA Hydrologie, Hydrogologie, Gostatistique et Gochimie Filire
Hydrologie et Hydrogologie Quantitatives
ETUDE DE LA DISTRIBUTION STATISTIQUE
DES PLUIES ANNUELLES
Auteur : Harouna KARAMBIRI Directeur de recherche : M. Pierre
HUBERT
Laboratoires d'accueil: CIG Ecole des Mines de Paris LGA UPMC
Paris 6
septembre 1999
-
2
Remerciements Je tiens tout particulirement remercier mon
encadreur, M. Pierre HUBERT, qui a bien voulu me proposer ce sujet
et me suivre tout au long de ce travail de mmoire. Je remercie
galement M. Hocine BENDJOUDI, pour sa grande disponibilit et ses
conseils. Je n'oublie pas Mlle Keltoum CHAOUCHE, pour sa
collaboration et son appui aux questions mathmatiques et
statistiques. Que tous ceux ou toutes celles, qui m'ont aid et
soutenu, d'une manire ou d'une autre, de loin ou de prs, trouvent
ici l'expression de ma profonde et sincre gratitude. Harouna
KARAMBIRI.
-
3
Page RESUME...
1
INTRODUCTION..
2
I- Prsentation des donnes...
3
I-1- Description de la base de donnes.. 3 I-2- Analyse l'chelle
globale.
4
II- Multifractalit et Hydrologie....
8
III- Distribution des sries annuelles. 11 III-1- Limites de la
loi normale..
11
III-2- Application des multifractals l'tude des sries annuelles.
12 III-3- Estimation de l'exposant de dcroissance algbrique qD ..
13 III-4- Essai de proposition d'une fonction densit de probabilit
15 III-4-1- Etude et trac de la fonction.
17
III-4-2- Paramtres statistiques. 20 a) Mode..
20
b) Mdiane. 21 c) Moments 22 III-4-3- Estimation des paramtres de
la loi thorique partir des donnes
23
IV- Essai d'une autre mthode d'estimation de l'exposant de
dcroissance algbrique qD ...
26
IV-1- Approche thorique.
26
IV-2- Application aux donnes.
30
CONCLUSION..
31
REFERENCES BIBLIOGRAPHIQUES. 32 ANNEXES..
34
SOMMAIRE
-
4
Rsum
Ltude statistique des sries pluviomtriques revt une importance
capitale en hydrologie, surtout en ce qui concerne le
dimensionnement des ouvrages hydrauliques et ltude des amnagements
hydro-agricoles. Cest ainsi que lon retrouve dans la littrature
toute une plthore douvrages sur le sujet. Si depuis des dcennies,
les lois statistiques classiques ont fait le bonheur des
hydrologues statisticiens, amnageurs, concepteurs et autres,
aujourdhui, un constat amer se pose : Toutes ces lois classiques,
souvent utilises abusivement, trouvent des limites dans l'tude des
vnements doccurrence rare. Des tudes rcentes (Hubert et Bendjoudi,
1996) ont montr que la loi de Laplace-Gauss (loi normale) qui est
la plus utilise pour la modlisation statistique des pluies
annuelles, mais aussi toutes les autres lois dcroissance
exponentielle, ne permettent pas d'ajuster d'une faon satisfaisante
les queues de distribution des sries longues. Faut-il donc en finir
avec la normalit ? De nouveaux outils bass sur les dmarches
fractales et multifractales ont t introduits et ont permis de
montrer que les sries pluviomtriques suivent plutt une loi
dcroissance algbrique moins rapide qu'une dcroissance
exponentielle, et que l'exposant qD pourrait tre invariant d'chelle
et universel. Dans ce rapport, nous avons appliqu cette approche
233 sries pluviomtriques annuelles de dure suprieure ou gale 100
ans. Le paramtre qD a t estim 4,51. Nous proposons galement une
nouvelle loi algbrique de distribution des probabilits ainsi qu'une
autre mthode d'estimation de qD.
-
5
Introduction
Les prcipitations constituent les principales entres des systmes
hydrologiques tels que les bassins versants. Elles sont vitales
pour les tres humains dans la mesure o elles assurent la recharge
des ressources en eau et favorisent le dveloppement des activits
humaines (agriculture, pche, production d'nergie,). Mais, elles
peuvent devenir aussi dangereuses, voire mortelles, en causant des
inondations. Voil plusieurs sicles que l'homme a commenc
s'intresser ces phnomnes naturels en essayant de les mesurer, de
les analyser, de comprendre leur origine et les processus selon
lesquels ils se manifestent. Mais hlas, il a t trs souvent limit
par les instruments de mesure et les outils d'approche. Les seules
mesures fiables disponibles aujourd'hui datent seulement des sicles
derniers (18me sicle). L'avnement des nouvelles technologies telle
que l'informatique, a permis une avance considrable en hydrologie
en ce qui concerne l'acquisition, le stockage et le traitement des
donnes pluviomtriques. C'est ainsi que l'on a vu natre toute une
pliade de modles mathmatiques et statistiques. Pendant longtemps,
les hydrologues se sont contents de dvelopper des modles ad hoc,
spcifiques une certaine chelle de temps, pour proposer des
solutions aux problmes pratiques urgents, avec pour seul souci la
qualit de l'ajustement aux donnes empiriques (Hubert et Bendjoudi,
1997). Aujourd'hui, la pratique montre que ces modles ne suffisent
plus expliquer la distribution des vnements d'occurrence rare. Les
approches fractales puis multifractales, empruntes l'tude de la
turbulence hydrodynamique, ont donn une nouvelle dimension
l'analyse et l'interprtation des champs de pluies. Dans ce mmoire,
nous nous proposons d'tudier la distribution des sries
pluviomtriques partir de ces formalismes fractals et multifractals,
afin de dterminer les paramtres des lois qui les rgissent et de
proposer de nouveaux modles statistiques de probabilit. Nous
commencerons par une tude globale des donnes qui permettra d'avoir
une vision spatiale de la rpartition des pluies. Nous aborderons
ensuite la notion de multifractalit, son introduction en hydrologie
et son application sur les donnes. Pour finir, nous proposerons une
nouvelle fonction densit de probabilit et une autre mthode
d'estimation du paramtre de dcroissance algbrique des queues de
distributions.
-
6
I- Prsentation des donnes
I1- Description de la base de donnes
La base de donnes initiale comprend 368 sries pluviomtriques
annuelles. Les dures dobservation minimale et maximale sont
respectivement de 39 et 299 ans, avec une moyenne de 106 ans.
Les donnes proviennent du monde entier. Elles ont t rassembles
par
l'intermdiaire de plusieurs organismes. Les donnes des pays de
la Mditerrane proviennent de la base AMHY du projet FRIEND-AMHY du
Programme Hydrologique International de l'UNESCO (Bendjoudi et
Hubert, 1997). Celles de l'Afrique de l'Ouest et du centre ont t
recueillies auprs de l'IRD (ex. ORSTOM) et du CIEH. Quelques donnes
franaises proviennent de Mto-France. Le reste des donnes a t
collect un peu par-ci par-l, notamment grce la base de donnes GHCN
Version 2 Precipitation Beta Release du site Internet
www.ncdc.noaa.gov de la NOAA et de l'dition 1994 du logiciel WORLD
WEATHERDISC.
Pour ce travail, nous nous limitons aux sries dune dure de 100
ans au
moins, qui sont au nombre de 233. Pour ces sries, les dates de
dbut de mesure se situent entre 1697 et 1895 et les dates de fin de
chronique, entre 1893 et 1996. La dure moyenne dobservation est de
126 ans.
Pour faciliter la lecture et le traitement de la base, les sries
ont t classes par ordre dcroissant de nombre dannes
dobservation.
Les entres de cette base sont (tableau 1) : - le numro de la
station - le nom de la station - le code ISO du pays (AFNOR, 1994)
- anne de dbut de la srie - anne de fin de la srie - dure de la
srie (annes) - nature de la grandeur mesure (P=pluie) - pas de
temps de disponibilit des sries (A=annuel) - latitude de la station
(degr, minute) - longitude de la station (degr, minute)
A chaque station, correspond un fichier dextension ".dat" dont
la racine est le nom de la station (huit premiers caractres au
maximum en partant de la gauche). Ces fichiers contiennent le nom
de la station suivi du nom du pays, la date de dbut suivie du
nombre d'annes dobservation et la chronique de mesures.
Les traitements ont t effectus laide de programmes en fortran
77, avec souvent des sorties sous Microsoft Excel pour le trac des
graphiques.
-
7
I2- Analyse l'chelle globale
Il s'agit dans cette partie de chercher savoir s'il existe une
interaction des
phnomnes se produisant aux diffrentes stations. Soient deux
pluviomtres spars par une distance d; Marsan et al (1996), selon
leur modle, dfinissent la liaison entre les signaux 1(t) et 2(t)
observs en ces deux points par l'expression:
),2(21 ,)()(
qKqq tdttt + (1) o q est l'ordre des moments et K(2,q) la
fonction d'chelle des moments ou fonction de structure (voir
chapitre 2). On peut gnraliser cette relation pour un rseau de
pluviomtres en dfinissant la fonction de corrlation gnralise :
( ) ),(),(, 2121 ),( ttxxtxtxI qnqnqqn ++= (2) avec q1,q2 :
ordres des moments En considrant les moments d'ordre 1 (q1 = q2 =
1), on montre (Marsan et al, 1996) que pour deux domaines purement
spatial et temporel pris sparment, la fonction de corrlation se met
sous la forme:
( ) )2(11
)1,1(:),0(K
Hn ttIttemporelDomaine
(3)
( ) )2()1,1(:)0,( Kn xxIxspatialDomaine (4) o H est un
coefficient d'anisotropie espace-temps.
A l'chelle annuelle, les sries pluviomtriques peuvent tre
considres comme tant indpendantes les unes par rapport aux autres.
L'application de la relation (3) qui vise caractriser et quantifier
la corrlation cette chelle ne revt donc pas une grande importante.
Elle serait plus significative plus petite chelle (minute,
heure).
Intressons-nous plutt la relation (4) qui ne dpend pas de
l'chelle (temporelle) et qui semble trs enrichissante. On considre
les pluviomtres (stations) deux deux spars par une distance x. On
dtermine pour chaque couple, le domaine de dfinition qui n'est rien
d'autre que l'intersection des annes d'observation de chacune des
stations du couple. Prenons un exemple: Si on prend deux stations,
l'une tant observe de 1980 1990 et l'autre de 1985 1995, on
travaillera, pour ce couple, sur l'intervalle allant de 1985
1990.
Sur ce domaine de dfinition, on applique la relation (2) avec
t=0, q1=q2=1; Ce qui revient faire la moyenne des produits des deux
sries pralablement normalises,
-
8
au mme pas de temps et sur leur domaine commun. La distance x
sparant deux stations est calcule partir des coordonnes
gographiques des deux stations (latitude, longitude) l'aide de la
trigonomtrie sphrique. On procde ainsi pour tout le rseau et on
reporte sur un graphique (graphique 1) les valeurs de la fonction
de corrlation en fonction des distances considres. Il faut signaler
que nous avons retenu seulement les couples dont le domaine de
dfinition tait au moins gal 10 ans. Avant d'interprter ce
graphique, il serait judicieux d'analyser d'abord pour les mmes
couples de stations, le coefficient de corrlation classique entre
les sries des deux stations sur le domaine de recouvrement. Le
graphique 2 montre la variation de ce coefficient en fonction de la
distance. Pour des distances faibles, le coefficient de corrlation
est lev (autour de 0,8); il diminue avec l'augmentation de la
distance. Au-del d'une certaine distance (environ 4000 km) le nuage
de points reste centr sur l'axe y=0. Compte tenu de l'opacit du
nuage due au nombre important de points (26 982), nous avons cherch
affiner sa lisibilit en faisant des moyennes par intervalle de
distance de 500 km (graphique 3). Sur ce graphique, on peut
souligner une dcroissance de la corrlation bien marque pour des
distances allant de 0 environ 4000 km. Aprs cette distance, le
coefficient oscille autour de 0 avec une moyenne pratiquement
nulle. Cela nous permet de dfinir, pour une station donne, un
cercle de corrlation centr sur cette station, de rayon 4000 km,
l'intrieur duquel toute autre station sera corrle avec la
premire.
Revenant au graphique 1, on retrouve cette porte de 4000 km o le
nuage de points semble plus pais et plus compact; il s'effile et
s'effrite au-del de cette distance. On s'intressera plus
particulirement cette premire partie de la fonction de corrlation
afin de quantifier la relation (4). Pour cela, nous avons fait la
moyenne comme prcdemment, des valeurs de la fonction au pas de
distance de 500 km (graphique 4). Un ajustement des points a t fait
et on trouve: ( ) 0091,0)2(0091,0)1,1( = KxxIn Cette valeur est
comparer celle de 0,22 0,06 trouve par Marsan (1998) pour des
spectres d'nergie de donnes de rflectivit radar sur une priode de
2,5 jours et un domaine carr de 500 km environ, avec une rsolution
de 2 km x 2 km toutes les 15 minutes. Il faut noter que plus K(2)
est lev, plus la fonction de corrlation dcrot rapidement et moins
la distance de corrlation est grande. La valeur que nous avons
trouve se justifie donc par la grande chelle d'tude considre
(plusieurs milliers de km). Nous avons repris la mme tude, mais
cette fois-ci, en distinguant les couples de stations ayant une
orientation Est-Ouest (E-W) ou Ouest-Est (W-E) et ceux ayant une
orientation Sud-Nord (S-N) ou Nord-Sud (N-S). On admettra qu'un
couple a une orientation Est-Ouest, si l'angle entre la droite
(plutt l'arc) reliant les deux stations et l'Equateur gographique
est infrieur 45. Il aura une orientation Sud-Nord dans le cas
contraire. Les graphiques 5, 6, 7, 8 montrent respectivement, en
fonction de la distance, les variations des coefficients de
corrlation E-W, S-N et des fonctions de corrlation E-W et S-N. Pour
apprcier les diffrences, examinons plutt les graphiques 9 et
10.
-
9
Sur le graphique 9, on retrouve toujours une premire phase,
pendant laquelle, les coefficients de corrlation restent levs et
dcroissent rapidement avec la distance. Cette dcroissance est plus
forte dans la direction S-N que dans la direction E-W. On pourrait
dfinir des portes de 2000 km pour la direction S-N et 3000 km pour
la direction E-W. Au-del de ces distances, les valeurs des
coefficients de corrlation suivant les deux directions se
rejoignent et vacillent autour de 0. Ces mmes portes se retrouvent
sur le graphique 10, en ce qui concerne les fonctions de
corrlation. Des rgressions sur les premiers points, selon chaque
direction, donnent les rsultats suivants:
( ) 0076,0)2(: 0076,0)1,1( = KxxIWEdirection n
( ) 0087,0)2(: 0087,0)1,1( = KxxINSdirection n La valeur de K(2)
dans la direction S-N est plus leve que celle dans la direction
E-W; ce qui se traduit par: pour une mme distance, la corrlation
est plus forte dans la direction E-W que S-N. La dcroissance rapide
de la fonction de corrlation dans cette dernire direction justifie
sa faible porte.
Des explications plus physiques peuvent venir tayer ces analyses
thoriques: Loin de vouloir aborder ici, en dtails, les phnomnes
complexes de la circulation atmosphrique et de la gnration de
pluie, nous tenons rappeler simplement que la circulation dans
l'atmosphre se fait diffremment selon deux zones: - La zone
intertropicale qui s'tend entre les latitudes 30 S et 30 N, est
marque
par l'existence de vastes cellules convectives (cellules de
HADLEY) o l'air chaud s'lve prs de l'Equateur et redescend des
latitudes plus leves. Il existe galement des courants de retour
dans les basses couches de l'atmosphre vers l'Equateur. On appelle
Zone de Convergence Intertropicale, la rgion o convergent ces
courants venant de l'Hmisphre Nord et de l'Hmisphre Sud; laquelle
zone varie en fonction des saisons. Les cellules ne montent pas
toutes uniformment le long de l'Equateur, celles qui se dplacent
longitudinalement sont appeles cellules de WALKER.
- La zone extratropicale s'tend au-del des latitudes 30 N ou 30
S en direction
des ples. Cette zone est marque par un climat beaucoup plus
variable. La vitesse du vent peut tre dfinie en termes de systme
local de coordonnes cartsiennes inscrit sur la terre. A chaque
latitude et longitude sur la terre (sphre) de rayon R, le vent
admet deux composantes:
NSouSNdirectiondtdRv
EWouWEdirectiondtdRu
=
=
cos
-
10
D'une manire gnrale, les principaux rgimes de vent la surface de
la terre s'tablissent suivant une direction d'Est en Ouest aux
basses latitudes et d'Ouest en Est aux plus hautes latitudes. Ces
vents, appels vents zonaux, peuvent atteindre jusqu' plus de 30
m.s-1 dans les jets puissants subtropicaux centrs sur des latitudes
d'environ 30 (Hartmann, 1994). La composante mridionale du vent est
beaucoup moins leve et correspond la convergence des alizs vers
l'Equateur. Elle peut atteindre une vitesse maximale de 1 m.s-1
(Hartmann, 1994). Cette circulation gnrale peut tre perturbe par la
naissance de phnomnes plus complexes telles que les moussons
indiennes et africaines au mois de juillet qui ont des directions
variables (Chapel et al, 1996). On comprend donc mieux la forte
corrlation des stations pluviomtriques dans la direction E-W (ou
W-E) cause de la circulation gnrale des phnomnes atmosphriques dans
cette direction, notamment les nuages qui sont l'origine des
pluies. Parlant de nuages, il faut rappeler qu'on en distingue
principalement trois types selon l'altitude: les cirrus (nuages
hauts), les cumulus (nuages moyens) et les stratus (nuages bas).
Ils sont constitus de fines gouttelettes d'eau ou de particules de
glace en suspension dans l'atmosphre. Les prcipitations se
produisent quand les blocs de nuages deviennent sursaturs en vapeur
d'eau, provoquant ainsi condensation et chute de gouttes. Cette
sursaturation est normalement cause par un refroidissement des
nuages durant leur ascension qui peut tre force par les mouvements
atmosphriques. On estime environ 3 jours le temps de sjour rel des
molcules d'eau dans l'atmosphre (Hartmann, 1994). On peut donc,
sans trop se tromper, tenir le raisonnement suivant: un paquet de
nuages sursaturs, qui commence prcipiter et qui se dplace la
vitesse moyenne du vent de 15 m.s-1 soit 54 km/h, aura parcouru
pendant 3 jours, une distance d'environ 4000 km avant de s'vanouir
compltement. Cela pourrait expliquer la porte de corrlation des
stations (4000 km) observe sur le graphique 2, en supposant que les
signaux enregistrs chaque couple de stations rsultent de la
ralisation d'un mme vnement pluvieux. Ce premier traitement qui
constitue une vision globale, permet de toucher du doigt toute la
difficult que reprsente l'tude des phnomnes atmosphriques tels que
les champs de pluies. Il est bien entendu qu'une telle approche
simpliste fait abstraction de beaucoup de facteurs influenant les
prcipitations, notamment l'orographie et l'anthropisation. Dans la
suite, nous nous intresserons plus particulirement la distribution
temporelle des pluies qui ncessite de nouvelles dmarches plus
robustes fondes sur des concepts physiques (naturels), mme de
traduire fidlement le comportement des perturbations
atmosphriques.
-
11
II- Multifractalit et Hydrologie
Le terme fractal qui vient du mot latin fractus dsignant un
objet de forme irrgulire et discontinue, a t utilis pour la premire
fois par Mandelbrot pour dcrire le chaos qui rgne dans les phnomnes
naturels (Mandelbrot, 1974). Cette notion qui tait purement
gomtrique au dpart (Mandelbrot, 1982), a permis de renouveler les
approches de nombreux domaines de sciences de la nature en y
introduisant explicitement la notion d'chelle. Lextrme variabilit
des champs gophysiques, qui rsulte dinteractions fortement non
linaires entre diffrentes chelles et/ou champs, nest pas bien
traduite par les approches traditionnelles. Cette variabilit
intervient sur de trs grandes gammes dchelles allant des chelles
dites de dissipation (infrieures ou gales au millimtre) aux chelles
plantaires (plusieurs milliers de kilomtres) en espace et de la
milliseconde aux chelles gologiques en temps (Schertzer et Lovejoy,
1985b), (Schertzer et Lovejoy, 1994). Pour aborder ces
caractristiques fondamentales, de nouveaux outils bass sur des
dmarches fractales ont t dvelopps. La manire la plus simple
daborder le problme (variabilit non linaire) est de supposer quun
processus lmentaire permet que cette variabilit se reproduise
d'chelle en chelle ; do les termes de cascade multiplicative et
d'invariance d'chelle. Les champs gophysiques, compte tenu de leur
complexit, ne peuvent se rduire un simple cadre gomtrique "blanc ou
noir" ; cest dire loccurrence ou la non-occurrence dun phnomne
caractris par sa seule dimension fractale D mesurant son degr
dirrgularit. Cela conduirait ngliger la distribution dans lespace
et/ou dans le temps de lintensit des phnomnes tudis. Lapproche
multifractale vise donc une prise en compte simultane des chelles
et des intensits (Schertzer et Lovejoy, 1987a). Les turbulences
atmosphriques sont rgies par les quations de Navier et Stokes et
les modles multifractals ont dabord t conus pour reproduire les
proprits de ces quations (Schertzer et Lovejoy, 1987b, 1991).
Lapparition des fractals puis des multifractals en hydrologie a
surtout t motive par le caractre intermittent tant dans lespace que
dans le temps des phnomnes pluvieux. Ils ont fortement contribu
lapprhension et la comprhension des processus complexes de
gnrations pluviomtorologiques. Les caractristiques fractales ou
multifractales des champs de pluie ont t observes et analyses dans
l'espace (Lovejoy, 1981 ; Schertzer et Lovejoy, 1987a;), dans le
temps (Hubert et Carbonnel, 1989; Hubert et al, 1993 ; Lima et
Grasman, 1999;) et la fois dans les deux directions (Marsan et al,
1996 ; Marsan, 1998). Il a t montr (Kolmogorov, 1962 ; Mandelbrot,
1974) que les transferts dnergie de gros tourbillons vers les
petits seffectuent lors de cascades dune manire multiplicative et
la fraction de flux transmise est dtermine par un facteur
alatoire.
-
12
Le cas le plus simple de telles cascades est la gnration de
cascades discrtes multiplicatives autosimilaires. Il faut entendre
par autosimilaire, le fait qu' chaque tape de la cascade, chaque
tourbillon gnr ressemble au gros tourbillon une homothtie prs. Si
nous considrons par exemple un domaine purement spatial
bidimensionnel de taille L x L, correspondant la structure la plus
grande d'intensit ou densit du flux d'nergie 0, on peut dvelopper
une cascade discrte multiplicative autosimilaire par itration d'un
gnrateur invariant d'chelle jusqu' une chelle de rsolution fine
l=L/, o est le rapport d'chelle maximum. Quand +, on observe
l'apparition de singularits, extrmes en certains points et faibles
en d'autres, correspondant une concentration de l'activit du champ
sur une portion de plus en plus faible de l'espace (Schertzer et
Lovejoy, 1994). A l'chelle l1= L/1, on divise le domaine en 1x1
structures (1 entier) et on attribue chaque structure ainsi cre une
intensit 1,i=0*1,i (ime structure du 1er pas de cascade), o 1,i
sont les ralisations indpendantes les unes des autres d'une
variable alatoire positive , comme nous l'avons dit plus haut. est
caractris par une fonction K(q) telle que :
)(1
qKq = (5) avec la condition 1= K(1)=0 qui rsulte de la
conservation en moyenne d'ensemble de l'nergie totale chaque pas de
cascade. K(q) est appele fonction de structure ou de "scaling" des
moments. Si n est le champ obtenu aprs n itrations, on a :
)()(1
qKqnKnqqn === (6)
En considrant n = on arrive une quation fondamentale des
multifractals:
)(qKq (7) D'une faon quivalente, en termes de probabilit, cette
quation peut se rcrire (Schertzer et Lovejoy, 1991) : [ ] )(Pr Cob
f (8) o C() est une fonction de codimension qui caractrise la
probabilit d'occurrence des singularits d'ordre suprieur . Les
auteurs font remarquer que le signe signifie galit en englobant les
facteurs constants multiplicatifs et les variations lentes en
chelle (ex. logarithme).
Les deux fonctions K(q) et C() se dduisent l'une de l'autre par
une transformation de Legendre (Parisi et Frisch, 1985):
( ))(max)(
CqqK = ( ))(max)( KqCq
= (9)
-
13
Ce qui permet d'tablir des relations univoques entre ordres des
moments et des singularits:
ddCq )(=
dqqdK )(
= (10)
En gophysique, notamment en hydrologie, les mesures faites sont
des
quantits habilles, puisqu'elles sont l'intgration l'chelle
d'observation de processus qui se sont poursuivis jusqu' des
chelles infiniment plus petites.(c'est l'exemple de pluies
horaires, mensuelles ou encore annuelles, qui sont l'intgration
temporelle de processus se dveloppant des chelles beaucoup plus
fines). Ces proprits habilles sont distinguer des proprits nues qui
correspondent des processus arrts l'chelle d'observation. Les
proprits habilles qui cachent les variabilits plus petites chelles
que l'chelle d'observation, peuvent conduire des divergences de
moments d'ordre suffisamment grand (Mandelbrot, 1974; Schertzer et
Lovejoy, 1987b). q quand pour q suffisamment grand Ce qui
correspond une transition de phase multifractale, analogue une
transition de phase thermodynamique. Cette divergence des moments
est quivalente une chute algbrique lente de la distribution des
intensits au-del d'un certain seuil. On montre (Schertzer et
Lovejoy, 1992) qu'il existe un ordre de moment critique qD, dfini
par K(qD)=D(qD 1), qD>1, D: dimension de l'espace support,
au-del duquel, il y a divergence. A qD , correspond un ordre de
singularit critique D, au-del duquel, la fonction de codimension
C() devient linaire:
( ) )()( DDD CqC += si D f (11) Pour suffisamment grand, on peut
donc rcrire la distribution de la probabilit au dpassement du flux
d'nergie : [ ] DqCob )(Pr f (12) Si on dfinit un seuil = , on a
:
[ ] Dqob fPr (13) Cette quation, trs rvlatrice, montre que
quelle que soit l'chelle considre, la probabilit au dpassement d'un
seuil suffisamment grand, est une fonction algbrique dcroisante de
ce seuil et que l'exposant qD est indpendant de l'chelle considre.
C'est ce rsultat que nous utiliserons par la suite pour caractriser
les queues de distributions des sries pluviomtriques annuelles de
la base de donnes.
Cette transition de phase qualifie de transition de phase
multifractale du premier ordre survient suite des discontinuits
dans les premires drives des fonctions K(q) et C(); A cause du
nombre fini de donnes de mesures (problmes d'chantillonnage), il
apparat une autre transition de phase multifractale du second ordre
due aux discontinuits dans les drives secondes de K(q) et C().
L'ordre des moments critique correspondant est qS (Lima et Grasman,
1999; ..).
-
14
III- Distribution des sries annuelles
III1- Limites de la loi normale
Nous n'avons nullement l'intention dans cette partie de nous
taler sur les modles statistiques employs en hydrologie. L'accent
sera surtout mis sur un modle qui a pratiquement valeur de dogme
(Hubert et Bendjoudi, 1996), savoir la loi de Laplace-Gauss (loi
normale) qui est largement utilise pour l'ajustement des sries
pluviomtriques annuelles. Cette loi se dfinit comme suit : Si X est
une variable alatoire qui suit une loi normale, sa fonction densit
de probabilit est :
=2
2 )(21exp
21)(
xxf ,- < x < + , avec : moyenne de la srie, :
cart-type de la srie. L'utilisation rpandue de cette loi pour
l'tude et l'analyse des cumuls pluviomtriques annuels est en fait
base sur le thorme central limite qui stipule que : la somme de n
variables alatoires, indpendantes, de variance finie et
identiquement distribues, est asymptotiquement normale (Kottegoda,
1980). Lequel thorme peut se gnraliser toute somme de n variables
alatoires condition qu'aucune variable ou groupe de variables
n'occupe dans la somme une place prpondrante par rapport aux autres
ou encore que toutes les variables initiales soient du mme ordre de
grandeur (Dagnelie, 1970). Il se dgage deux problmatiques de ce
thorme savoir les notions d'indpendance et de distribution
identique. Si, des chelles de temps assez grandes (annes), l'on
peut considrer les vnements pluvieux comme tant relativement
indpendants, est-il raisonnable d'admettre cette hypothse petites
chelles ? La pluie qui tombe un instant t donn, ne dpend-t-elle pas
de l'activit pluvio-orageuse prcdente ? Il faudrait peut-tre
rappeler qu'en ralit, dans la nature, la pluie n'a pas d'chelle.
Elle n'est ni horaire, ni journalire, ni annuelle (Hubert et
Bendjoudi, 1996). C'est un phnomne qui se droule au cours du temps
selon ses propres lois. Les chelles actuelles ne traduisent en fait
que notre incapacit cerner et retrouver les paramtres invariants
d'chelle qui rgissent ces lois.
Si l'on peut difficilement admettre cette hypothse
d'indpendance, il est par contre inadmissible que les pisodes
pluvieux soient identiquement distribus, quand on sait qu'ils
varient dans un rapport de 1 1000 (Bendjoudi et Hubert, 1998). Les
priodes pluvieuses, quelle que soit la rgion, ne durent que
quelques heures par an. En France, cette dure varie entre 400 et
1400 heures par an, soit environ 10% du temps (Rmniras et Hubert,
1990). Il faut noter que cette estimation de la dure des
prcipitations en un lieu, trs lie l'chelle d'observation partir de
laquelle elle est calcule, est bien mal dfinie et finalement trs
critiquable. Comme nous l'avons vu dans le chapitre prcdent, les
instruments de mesure (pluviomtres, pluviographes, etc) habillent
les proprits de la pluie et masquent ainsi les htrognits et
irrgularits qui peuvent survenir plus petites chelles que l'chelle
d'observation et entraner des consquences dramatiques (Schertzer et
Lovejoy, 1994). C'est le cas d'une simple averse qui peut
bouleverser tout un bilan
-
15
hydrologique annuel. Considrer les pisodes pluvieux du mme ordre
de grandeur, reviendrait donc ignorer la nature mme du phnomne
pluviogne, c'est dire l'intermittence et la variabilit
spatio-temporelle. Utilise souvent tort, la pratique montre que la
loi normale s'carte des valeurs de mesures en ce qui concerne les
vnements extrmes. Dans la plupart des cas, ces valeurs sont tout
simplement cartes sous prtexte qu'elles relvent d'erreurs de mesure
ou d'une autre logique. Faut-il continuer dvelopper ou raccommoder
des modles statistiques douteux, desquels les vnements les plus
riches en information sont exclus, et bass sur des hypothses
elles-mmes douteuses ? Ou alors, faut-il rechercher des outils plus
performants, rationnels et physiques, traduisant la nature
intrinsque des observations faites ? C'est l que l'approche
multifractale trouve toute sa place et toute sa justification en ce
sens qu'elle permet de rendre compte en une thorie unifie des lois
d'chelles et de l'intermittence associe des champs de pluie.
III2- Application des multifractals l'tude des sries
annuelles
Nous reprenons ici un des rsultats les plus fondamentaux des
multifractals savoir que la probabilit de dpassement, quelle que
soit l'chelle considre, d'un seuil suffisamment grand, est une
fonction algbrique dcroissante de ce seuil, traduit par l'quation
(13) :
[ ] qDob fPr Pour un seuil assez grand h d'une prcipitation H,
on aura:
[ ] qDhhHob fPr (14) Cette approche a dj t applique une banque
de donnes pluviomtriques annuelles comprenant 71 sries d'une dure
suprieure ou gale 90 ans (Bendjoudi et Hubert, 1998). Nous
l'tendons ici notre base de donnes de 233 sries de dure
d'observation au moins gale 100 ans. Afin de respecter la
contrainte de conservation d'ensemble de la "masse" totale, et de
pouvoir comparer les sries les unes par rapport aux autres,
celles-ci ont t normalises (moyenne=1) et standardises
(cart-type=1). Si ( ) niiY ,1= est une srie d'observations de
moyenne m et d'cart-type , la srie normalise et standardise
( ) niiX ,1= est telle que: mYX ii
+= 1 , i=1,n.
Les sries ont t ranges par ordre croissant et pour chaque valeur
Xi, nous avons calcul la probabilit empirique au dpassement
correspondante par la formule de
WEIBULL: 1
1)(Pr+
+=
ninXXob if , i tant le rang et n le nombre dobservations.
Les points reprsentatifs de ces probabilits empiriques au
dpassement ont t reports sur un graphique log-log. A ces points,
nous avons superpos la courbe correspondant la probabilit au
dpassement issue de lajustement des donnes une loi normale
(graphique 11).
-
16
Pour toutes les sries, l'ajustement des donnes empiriques la loi
normale
est satisfaisant sauf pour les valeurs extrmes. On note en effet
pour toutes les sries et cela d'une manire systmatique, que la loi
normale dcroche pour des seuils grands, donc des probabilits au
dpassement faibles. Cette cassure se produit dans l'ensemble pour
des probabilits au dpassement infrieures ou gale 0,05 (priode de
retour 20 ans). Au-del de cette probabilit, la loi normale n'est
plus valable puisque la loi des grands nombres ne s'applique plus,
d'o perte d'ergodicit, divergence des estimateurs statistiques
usuels et dpendance des estimations de la taille de l'chantillon
(Bendjoudi et Hubert, 1998): C'est la transition de phase
multifractale du premier ordre. Elle correspond une chute algbrique
de la distribution des intensits, infiniment moins rapide qu'une
dcroissance exponentielle. Ce qui n'tait qu'une conjecture
thorique, se voit bien vrifi par les donnes empiriques. En effet,
au-del de la cassure, les points empiriques s'organisent autour
d'une droite. C'est en fait la traduction de l'quation (14) en
logarithme:
[ ]( ) )(Pr hLogqhHobLog Df -qD tant la pente de la droite.
Des tudes prcdentes (Hubert et Bendjoudi, 1996) effectues sur la
srie de Ddougou (Burkina Faso), aux chelles de temps annuelle,
mensuelle et journalire, montrent une dcroissance algbrique de
pentes similaires des queues de distribution pour ces trois
chelles. Ce qui milite en faveur d'une invariance d'chelle du
paramtre qD (graphique 12).
III-3- Estimation de l'exposant de dcroissance algbrique qD
Partant donc de ce constat, nous avons ajust une droite, pour
toutes les sries, sur les points dont la probabilit empirique au
dpassement est infrieure 5%, afin d'estimer qD. Le tableau 2
regroupe les rsultats; il comprend la liste des stations, le code
du pays, la dure de la srie, la valeur de qD, le coefficient de
corrlation de l'ajustement et le nombre de points utiliss. Les
coefficients de corrlation sont satisfaisants (moyenne = 0,96). Le
nombre de points utiliss varient de 15 pour les plus longues sries
5 pour les plus courtes avec une moyenne de 6 points. En fait ces
points reprsentent 5% du nombre total d'observation; puisque:
11)(Pr+
+=
ninXXob if par la formule de WEIBULL
)1(95,005,01
105,0)(Pr ++
+ ni
ninXXob if (les sries tant classes par
ordre croissant).
Les valeurs de qD s'chelonnent de 2 26. La moyenne sur toutes
les sries est de 5,9; la dispersion autour de cette valeur centrale
est 3,7. Il est intressant de voir comment voluent les diffrentes
valeurs de qD d'une station une autre. Le graphique 13 montre cette
volution en fonction du nombre d'annes d'observation des sries. Les
points ne sont pas rpartis au hasard. On peut en effet remarquer
une espce de noyau dlimit par les intervalles [100;140] pour les
dures et [2;7]
-
17
pour les valeurs de qD, o la densit des points est plus leve.
Au-del, les points sont pars. La dgradation horizontale de ce noyau
peut s'expliquer par le nombre de moins en moins lev de sries de
plus de 150 ans. Mais la faible densit de points au-dessus du noyau
(verticalement) pourrait traduire l'existence d'une valeur de
convergence de qD au sein du noyau. Une petite statistique sur ce
noyau donne une valeur moyenne de qD de 4,4 et un cart-type de
1,3.
Entre 100 et 140 ans, on note une forte variation verticale des
valeurs de qD (2 26). Trs rapidement, cette variation s'attnue
lorsque la dure des sries augmente. Les points semblent encadrs par
deux courbes enveloppes virtuelles minorante et majorante qui
convergent vers une mme limite lorsque le nombre d'annes
d'observation devient grand. Pour essayer d'approcher cette valeur
"idale" de qD qui serait la limite d'une srie infinie, nous avons
utilis les 6 plus longues sries (de plus de 200 ans). En nous
fondant sur la moyenne et l'cart-type de ces sries, nous pouvons
estimer la valeur limite de qD 4,5 1. Cette valeur est proche de
celle trouve pour le noyau d'attraction. Il y a lieu de relever que
cette estimation de l'exposant de dcroissance qD est lgrement
suprieure celle faite dans les travaux prcdents (Bendjoudi et
Hubert, 1998) qui est de 3,8 0,5. La recherche dans la littrature
de nouvelles sries de plus en plus longues, s'avre indispensable
pour affiner davantage la dtermination de ce paramtre.
Nous avons appliqu d'autres formules empiriques de calcul de la
probabilit au dpassement savoir:
Cunnane: 2.0
6.0)(Pr+
+=
ninXXob if
Hazen: n
inXXob i+
=
5.0)(Pr f
o i est le rang du seuil et n le nombre dobservations. Toutes
ces formules posent le mme constat que celle de Weibull: le
dcrochage de la loi normale des donnes empiriques pour des
probabilits infrieures ou gales 0,05 et la chute algbrique des
queues de distribution. Elles donnent cependant des estimations un
peu plus leves du paramtre qD (5,2 1,2 pour Cunnane et 5,5 1,2 pour
Hazen).
Pour mettre en vidence la divergence des moments statistiques du
fait de la transition de phase multifractale, nous avons calcul les
moments d'ordre 1 6. Le graphique 14 montre la variation de ces
moments pour la station de Gibraltar (Espagne) en fonction du
nombre d'annes utilis N, allant de 1 la dure de la srie (202 ans).
On distingue essentiellement deux parties: Une premire partie entre
1 et 70 ans, o les moments fluctuent beaucoup en raison de la
taille assez faible des chantillons. Les amplitudes de ces
fluctuations sont moindres pour les moments d'ordre 1 3
comparativement aux moments d'ordre 4 6.
Intressons-nous la deuxime partie se situant au-del de 70 ans.
Dans cette partie, les trois premiers moments se stabilisent
rapidement et deviennent
-
18
constants. Alors que les moments d'ordre 4, 5 et 6 ont du mal se
stabiliser et ont tendance diminuer quand N augmente. Cette
instabilit des moments d'ordre suprieur ou gal 4 traduit bien le
fait qu'un phnomne s'est produit: c'est la transition de phase
multifractale. L'ordre critique des moments se situe donc autour de
4, ce qui consolide l'estimation faite plus haut. Le moment d'ordre
4 n'existant pas, des paramtres statistiques tel que le coefficient
d'aplatissement n'ont aucune signification. Les consquences
pratiques d'une dcroissance algbrique des queues de distribution
des sries sont assez lourdes, surtout en ce qui concerne les
risques hydrologiques et les cots des ouvrages de gnie civil. Quand
on multiplie un seuil d'intensit par 10, on divise sa probabilit au
dpassement par 10qD, on multiplie donc sa priode retour par 10qD.
En adoptant la valeur de qD de 4,5 , on est trs loin des rsultats
donns par une distribution normale qui divise par 10 la probabilit
au dpassement d'un seuil 10 fois plus grand. En outre, un vnement
qualifi de millennal par une loi normale, ne serait en fait que
centennal dans le cas de notre modle.
Le graphique 15 permet de mieux visualiser ces diffrences. Nous
y avons reprsent la priode de retour T de l'intensit maximale de
chaque srie, calcule par la loi normale, en fonction de la dure n
de la srie qui correspond la priode de retour empirique de la plus
grande intensit. Pour des raisons de commodit, l'axe des ordonnes
est en chelle logarithmique.
Hormis quelques rares points, la quasi-totalit des points (plus
de 90%) se situe au-dessus de la premire bissectrice. Le nuage de
points n'est aucunement allong le long de cette droite; il est
plutt orient verticalement. Alors que la priode retour empirique
varie entre 100 et 299 ans, avec une moyenne de 126 ans, celle
thorique varie de 38 ans 4,3 millions d'annes avec une moyenne de
57 000 ans. Pour des vnements qui sont dans l'ensemble centennaux,
40% sont estims plus que millennaux par la loi gaussienne.
Comme nous pouvons donc le constater, la loi normale fait une
forte
surestimation des priodes de retour des vnements extrmes. Ce qui
a une incidence sur les cots des ouvrages hydrauliques.
III-4- Essai de proposition d'une fonction densit de
probabilit
L'introduction des approches multifractales dans l'tude de la
distribution des pluies annuelles ouvre de nouvelles perspectives
la modlisation spatio-temporelle des champs de prcipitations. Au
lieu de peaufiner des modles statistiques bass sur des lois
dcroissance exponentielle trop rapide, il est peut-tre grand temps
que les mathmaticiens statisticiens uvrent la recherche de
nouvelles lois prsentant un comportement "fat tail" ou "heavy tail"
(dcroissance lente); c'est dire des lois de probabilit dcroissance
algbrique. Nous citons pour revue:
-
19
- La loi de Pareto gnralise (Van Montfort et Witter, 1986):
=
=0,0)exp(10,/100,0)1(1
)(
/1
pp
fpp
ppp
ZZZZZ
xXP (15)
o
=
xZ
avec : paramtre de position ( x > ) : paramtre d'chelle (
> 0 ) : paramtre de forme. - La loi de Halphen B-1 (Morlat,
1956):
Fonction densit de probabilit:
0exp)(
2)(2
1221 fxpourx
mxmx
efmxfB
+
=
(16)
> 0 et sont des paramtres de forme m > 0 est un paramtre
d'chelle ef est la fonction factorielle exponentielle dfinie comme
suit:
( )dxexef xx +
=2
0
12)( Dans cette mme foule, nous essayons ici de proposer une
fonction densit de probabilit qui prsente un comportement
algbrique.
Soit la fonction: ( )cba
xmxxh+
=)( x 0, avec a>-1 ; b>0 ; m>0 ; c>(a+1)/b
L'intgrale de cette fonction vaut:
( ) )(11
)(1
00 cbb
acb
a
mdxxm
xdxxh bbca
cb
a
+
+
=
+=
+++
(Lide D.R., 1992)
Dfinissons une fonction telle que: 0)(
)()(0
=
+x
dxxh
xhxf
-
20
On aura:
( ) 0*11)()( 1
+
+
+
=
+x
xmx
bac
bam
cbxf cba
bbca (17)
Avec a>-1 ; b>0 ; m>0 ; c>(a+1)/b est bien une
fonction densit de probabilit puisqu'elle est continue, positive et
drivable sur ]0;+[ et
+=
01)( dxxf .
Elle prsente un comportement algbrique puisque, quand bcaxxfx +
)(, (a-bc1). Dans ce cas, la probabilit au dpassement vaut:
[ ] )1()(Pr + + = abcx x bca xdxxdxxfxXob f L'exposant de
dcroissance algbrique est qD=bc-a-1. Dans le cadre de ce travail,
pour simplifier ltude de la fonction, nous adopterons b=1. On a
donc:
En mettant m en facteur, on obtient :
( ) ( ) c
a
mx
mx
acamcxf
+
+
=
1*
11)()( (18)
m reprsente le paramtre dchelle, a et c les paramtres de
forme.
III-4-1- Etude et trac de la fonction Dsignons par X, la
variable alatoire dont la fonction densit de probabilit (fdp) est .
Soit g la fdp d'une variable alatoire U tel que: U=X/m La
probabilit lmentaire se dfinit comme suit: Prob(x
-
21
( ) ( ) ( )ca
uu
acacug
++
=
1*
11)()( (19)
La courbe (Cg) de la fonction est semblable celle de (C) un
facteur d'chelle prs. La fonction g(u) peut se mettre sous la
forme:
( ) ( )ca
uu
acaBug
++=
1*
1,11)(
o B est la fonction bta dfinie par: )()()(),(
vuvuvuB
+
=
g est drivable sur ]0 ;+[ et sa drive vaut :
( ) [ ]ucaauu
acaBug c
a
)(*1
*)1,1(
1)( 11
+++
=+
On distingue plusieurs cas suivant les valeurs de a: -1
-
22
)1()0( ccg = et )1()0( = cg Tableau de variation:
a>0 Le signe de g(u) dpend du signe de a+(a-c)u.
0)( =
= ugac
au : la courbe de g admet une tangente horizontale en
acag
acaM ,
0)( fugac
au
< : g est strictement croissante.
0)( pugac
au
> : g est strictement dcroissante.
( ) ( )ac
c
a
acca
acaBacag
+=
*1,1
1 et g(0)=0
Tableau de variation:
ac
a
acag
0 0
+ 0u
g
g
- + 0
0
+
c-1
0u
g
g
- c(1-c)
-
23
Il faudra remarquer que dans l'intervalle ]0;1], g'(u)+ quand
u0, la courbe de g (Cg) admet donc une tangente verticale
l'origine. Alors que dans l'intervalle ]1; +[, g'(0)=0: (Cg) admet
une tangente horizontale l'origine. Quelle que soit la valeur du
paramtre a, 0)(lim =
+ug
u: (Cg) admet l'axe des
abscisses comme asymptote l'infini. Choix des paramtres a et c
a>-1 et c>a+1 Si nous reprsentons sur un graphe ces deux
conditions (ingalits), nous obtenons un domaine D de combinaisons
acceptables des paramtres a et c. Le graphique 16 montre les
allures de la fonction g pour quelques valeurs de a et c.
III-4-2- Paramtres statistiques
a) Mode Le mode est la valeur de la variable pour laquelle la
fonction densit de probabilit atteint son maximum. Il sobtient en
faisant g(u) = 0. Pour 1
-
24
Pour a>0:
acamx
mxu
acauug
=
=
== 0)(
le mode vaut : ac
ame
=mod (20)
b) Mdiane Elle est dfinie comme tant la valeur de la variable de
part et d'autre de laquelle, on retrouve 50% de la distribution. Si
on note xmd la mdiane, on doit avoir :
+==
md
md
x
xdxxfdxxf
05,0)()( (21)
Cette quation tant difficile, voire impossible rsoudre
littralement compte
tenu de lintgrale de la fonction f qui est trs complexe, nous
proposons une rsolution numrique base sur une discrtisation
trapzodale de l'intgrale dont lalgorithme est le suivant :
( ) ( ) c
a
mx
mx
acamcxf
+
+
=
1*
11)()(
oui
non
Dbut
Entrer m,a,c, pas
S=0 x1=0
x2=x1+pas
S=S+[f(x1)+f(x2)]*pas/2
S
-
25
c) Moments
Le moment dordre p se met sous la forme :
[ ])1()1(
)1()1()(0
+++
== +
acapacpamdxxfxXE ppp (22)
On vrifie bien que, pour p=0 , [ ] + == 00 1)( dxxfXE Les
conditions d'existence de ces moments sont: a+p>-1, c>a+p+1,
et m>0. Ce qui donne pour l'ordre des moments: -(a+1)
-
26
III-4-3- Estimation des paramtres de la loi thorique partir
des
donnes
Cette estimation s'est faite l'aide des mthodes
traditionnelles:
- Mthode du maximum de vraisemblance: C'est une mthode optimale,
tout au moins asymptotique, car elle prend en
compte tous les lments de l'chantillon individuellement. En
considrant la fonction f(x,a,c,m) et la srie d'observations
indpendantes (Xi)i=1,n, on dfinit la vraisemblance par:
L=f(x1,a,c,m)*f(x2,a,c,m)*..* f(xi,a,c,m)*.f(xn,a,c,m) Ou
encore:
[ ]=
=
n
ii mcaxfLogLLog
1),,,()(
La mthode consiste maximiser la fonction L ou Log(L) par rapport
aux paramtres a,c,m, en annulant les drives partielles:
000 =
=
=
mL
cL
aL
On obtient ainsi autant d'quations que de paramtres qui
permettent d'estimer ces derniers. - Mthode du maximum
d'entropie:
On dfinit la fonction entropie relative un systme
X[(xi,pi)]i=1,n par:
)()(1
i
n
ii pLogpXH
=
= o pi tant la probabilit associe xi.
Pour un systme continu de fonction densit de probabilit dfinie
sur un domaine D, l'entropie vaut:
[ ]dxxfLogxfXHD= )()()(
Il s'agit l galement de maximiser la fonction H sous certaines
contraintes (exemple: relations tablissant la moyenne ou
l'cart-type de la srie). - Mthode des moments:
Elle consiste remplacer dans les relations entre moments
thoriques et paramtres, les moments thoriques par les moments
empiriques calculs partir de l'chantillon. On utilise autant de
moments qu'il y a de paramtres et on obtient ainsi une estimation
de ces derniers.
L'application des deux premires mthodes n'est pas aise compte
tenu des complexits mathmatiques engendres par les drives
partielles qui ne permettent pas d'expliciter les paramtres. Quant
la mthode des moments, elle s'applique facilement, mais les
rsultats ne sont pas satisfaisants (c
-
27
Ne disposant pas de ressources informatiques sophistiques, nous
avons d,
pour une premire approche, simplifier davantage la fdp en
adoptant m=1. Dans ce cas, nous avons pu estimer les paramtres a et
c partir des moments d'ordre 1 (moyenne) et d'ordre 2 centr
(variance). Si on appelle e1 et e2 respectivement la moyenne et la
variance dtermines partir de l'chantillon, on a les relations
suivantes:
[ ]
=
+=
=
+=
22
1
)3()2()1)(1()(
2)1(
eacac
caXVar
eac
aXE
Aprs rsolution, on trouve :
( )
1
2
212
1
1
111
eeee
a+
+
+
= (26)
( ) 21 1212
1 +++= eeeec (27)
Ces paramtres ont t estims pour chaque srie. Afin de valider
l'estimation, nous avons calcul pour toutes les sries, le mode et
la mdiane thoriques partir de la loi . Les graphiques 17 et 18
montrent les rsultats des comparaisons avec le mode et la mdiane
empiriques des sries. Comme nous pouvons le constater, les nuages
de points s'allongent trs bien le long de la premire bissectrice.
Le coefficient de corrlation entre mode estim et mode empirique est
de 0,983; celui entre mdianes estime et empirique est 0,999. Ce qui
tmoigne de l'excellence des estimations.
Revenons maintenant l'estimation d'exposant de dcroissance
algbrique qD. Pour une srie normalise et standardise, les quations
(26) et (27) deviennent: a=2 et c=7. On calcule qD=c-a-1 qD = 4.
Cette valeur qualifie de thorique est proche de celle estime
empiriquement qui est de 4,51. La probabilit au dpassement thorique
d'un seuil x d'une variable alatoire X se calcule par:
[ ] + == xx
dxxfdxxfxXob0
)(1)(Pr f . Nous avons repris le graphique 11 en y ajoutant
cette probabilit thorique (voir graphique 19). Si nous nous
intressons aux vnements extrmes qui sont les plus importants,
contrairement la loi normale, la loi dcrot lentement et colle
assez
-
28
bien avec les donnes empiriques. Dans cette partie, l'ajustement
est satisfaisant. Par contre, pour des probabilits au dpassement
suprieures 0,05 , la loi semble dcrocher un peu des donnes
empiriques par rapport la loi normale. On distingue essentiellement
pour cette partie, deux zones. L'une comprise entre les probabilits
0,05 et 0,6 , o la loi se trouve en dessous des valeurs empiriques.
L'autre allant des probabilits 0,6 1, o la loi se situe au-dessus
des donnes empiriques. Toutefois, on peut remarquer que les carts
entre la loi thorique et la loi empirique (Weibull) ne sont pas
assez grands. Notons galement que les valeurs de probabilit de 1,
donnes par pour des faibles valeurs de x, sont dues, comme nous
l'avons vu plus haut, la forme de dmarrage de la courbe de qui
admet une tangente horizontale l'origine pour a>1. S'il y a
aujourd'hui un fait qu'on ne peut plus nier, c'est la distribution
de probabilit des intensits pour des seuils levs, suivant une loi
dcroissance algbrique caractrise par un exposant qD qui serait
invariant d'chelle et universel. Cela ne doit pas cependant nous
faire oublier toute la complexit que reprsentent les phnomnes
naturels telle que la pluie. La mise au point de modles base
physique, reproduisant fidlement le comportement de tels phnomnes
n'est certainement pas chose facile. Cette fonction , qui n'est qu'
sa premire tude, montre toute la puissance que reprsentent de
telles lois par rapport aux lois classiques dcroissance
exponentielle beaucoup plus rapide. Il y a donc lieu d'affiner
l'tude en explorant d'autres horizons (b1,m1 par exemple).
-
29
IV- Essai d'une autre mthode d'estimation de l'exposant de
dcroissance algbrique qD
Les mthodes empiriques (Weibull, Cunnane, Hazen) permettent
toutes de poser les mmes constats, savoir une dcroissance algbrique
des queues de distribution et l'existence d'un exposant qD qui,
selon toute vraisemblance, serait invariant d'chelle et universel.
Mais les estimations de qD par ces diffrentes mthodes restent assez
disparates. En outre, ces mthodes empiriques sont limites car, si
elles calculent les probabilits au dpassement pour deux seuils s1
et s2 conscutifs, on n'a aucune information par contre sur ce qui
se passe entre s1 et s2 ( ]s1;s2[ ). C'est donc pour combler ces
lacunes, que nous nous proposons de tester une nouvelle approche
d'estimation de qD, base sur le comportement algbrique et
l'irrgularit des sries pluviomtriques. Cette approche fait
actuellement l'objet d'un travail intensif de recherche dans le
cadre de la Thse de Keltoum CHAOUCHE (Laboratoire GRESE,
ENGREF).
IV-1- Approche thorique (Keltoum CHAOUCHE, paratre)
Considrons une variable alatoire X avec les ralisations
(Xi)i=1,n pas de temps qui correspondent une suite d'intensits.
Soit un seuil s variant de 0 ( )ini X,1max= . Soit une variable
alatoire de ralisations i (i=1,n) telles que:
==
sXsisXsi
ii
ii
01
f (i=1n)
On dfinit par:
=
=n
iisd
1)( : la dure de dpassement du seuil s
=
=n
iiiXsp
1)( : le cumul des intensits dpassant le seuil s
= nD : la dure totale des observations
=
=n
iiXP
1
: le cumul total des intensits
Sur le graphe ci-dessous, d(s) et p(s) correspondent
respectivement aux sommes des largeurs et des aires des rectangles
hachurs.
-
30
dfinition de d(s) et p(s)
0
1
2
3
4
5
6
7
8
9
1 2 3 4 5 6 7 8 9 10
pas de temps
inte
nsit
Xi
seuil s
On reporte sur un graphique, pour tout seuil s, les points
d'abscisse x(s) et d'ordonne y(s) dfinies par:
=
=
= ==
n
ii
n
ii nnD
sdsx11
1loglog)(log)( (28)
=
= ==
n
ii
n
iii Xn
XnP
spsy11
1log1log)(log)( (29)
soient (Ui)i=1,n et (Vi)i=1,n deux suites de variables alatoires
telles que:
iii
ii
XVU
=
=
i=1,,n
On peut admettre (loi des grands nombres) que =
n
iiXn 1
1 , =
n
iiUn 1
1 , =
n
iiVn 1
1 convergent
respectivement vers E[X], E[U] et E[V]. On a donc:
[ ][ ] [ ] )31(loglog)(
)30(log)(XEVEsy
UEsx=
=
On dfinit pour une variable alatoire X de densit de probabilit
f, la probabilit au dpassement G par:
+
==
xdttfxXPxG
RRG
)()()(
:
f
-
31
En se plaant dans le cas d'une dcroissance algbrique des queues
de distribution, la fonction G se met sous la forme gnrale (Keltoum
CHAOUCHE, paratre):
qxxrxGx = ).()(1 avec q>1 (31) r vrifie:
Kxrx
=+
)(lim et r est croissante sur [1,+[ (33)
00).(1 1 ff etAavecAxxxrx (34) On appelle fonction de vitesse de
dpassement de G (Keltoum CHAOUCHE, paratre), la fonction h dfinie
par:
+
=
s
G
ssGshs )()(1 (35)
On montre (Keltoum CHAOUCHE, paratre) que pour un seuil s
positif: [ ][ ] )37()(
)36()(
+
+=
=
s
GssGVE
sGUE
On calcule la pente a(s) en tout point (x(s),y(s)):
ssxssy
sa
= )(
)(
)(
ssGsG
GssG
Gss
sGssGsa
s
s
+
+
+
=
+
+
)()(*
)(
)()()(
Cette pente s'exprime en fonction de la vitesse de dpassement
h:
)(11
1)(
sh
sa+
= (38)
Aprs une intgration par partie, on a:
dtttrqq
xxrGx
q
x
q
+
+
+
=1
1
)(1
11
)(
[ ])(11
1)()(
1 xqxxG
G
xhx +
==
+
avec dtttrxr
xxx
qq
+
=1
1
)()(
)(
-
32
la relation (34) permet d'crire:
)()()(
)12(
xrqAxx
q
+
++
Cherchons la limite de la pente a(s) lorsque le seuil s tend
vers l'infini:
)(1lim1
1)(lim
sh
sa
s
s
+
++
=
[ ] 0)(lim1
1)(lim11
1)(
1lim =
=+
=+++
scarq
sqsh sss
On a donc:
qqsa
s
1)(lim =+
(39)
Pour un seuil assez grand, la pente devrait donc tendre vers
q
q 1
Cette pente, dans le cas d'une loi algbrique est bien diffrente
de 1; alors qu'on montre (Keltoum CHAOUCHE, paratre) que pour une
loi normale ou exponentielle elle vaut 1. Pour plus de dtails sur
les dmonstrations, se rfrer : Keltoum CHAOUCHE, 1999, paratre.
Estimation graphique du paramtre de dcroissance algbrique.
Laboratoire GRESE, ENGREF, Paris, France.
-
33
IV-2- Application aux donnes
Nous avons appliqu l'approche thorique notre banque de donnes de
233
sries pluviomtriques annuelles. Pour chacune d'entre elle, nous
avons report sur un graphique en chelle log-log, pour un seuil
variant de 0 l'intensit maximale, le cumul des intensits dpassant
ce seuil normalis l'intensit totale, en fonction de la dure de
dpassement de ce seuil normalise par la dure totale.
Sur le graphique 20, on remarque que les points sont quasiment
tous aligns. En nous intressant aux vnements extrmes, nous avons
fait un ajustement linaire sur les trois derniers points pour
toutes les sries. Les coefficients de dtermination sont tous gaux
1. Les valeurs des pentes des droites de rgression sont consignes
dans le tableau 3. On note que les pentes sont toutes diffrentes de
1, ce qui tmoigne d'un comportement algbrique des sries. Nous avons
cherch savoir s'il existe une relation entre ces pentes et la dure
des sries. Le graphique 21 montre cette relation. La rpartition des
points est comparable celle trouve sur le graphique 13 pour les
valeurs de qD. Dans l'intervalle de temps [100,150], les points
sont assez disperss verticalement. Plus la dure de la srie
augmente, moins ces dispersions sont importantes. Les points
semblent envelopps dans deux courbes infrieure et suprieure qui
convergeraient vers une mme limite quand la dure d'observation tend
vers l'infini. Pour approcher cette limite, nous avons considr la
moyenne et l'cart-type des six plus longues sries (de plus de 200
ans). Nous l'estimons 0,928 0,025. A partir de la relation (39), on
peut dterminer la valeur de l'exposant de dcroissance algbrique qD.
En prenant la valeur moyenne de 0,928 pour la pente, on trouve
qD=13,89. Il est bien entendu que cette valeur de qD reste leve par
rapport celles trouves prcdemment au chapitre 3. On peut expliquer
cet cart, d'une part, par l'application de la loi des grands
nombres et le passage au logarithme qui introduisent un biais non
ngligeable. Il faudrait d'autre part, se pencher sur l'influence
que pourrait avoir la dimension D de l'occurrence des pluies et les
biais qu'elle peut introduire dans nos estimations (nous avons
admis ici que la pluie se dveloppait sur l'ensemble de la dimension
temporelle, c'est dire un ensemble de dimension D=1). Il y a donc
lieu de chercher quantifier tous ces biais afin d'apporter une
correction la valeur de qD trouve.
-
34
Conclusion
Les phnomnes naturels telles que les prcipitations, n'ont pas
fini de nous enseigner, cause de leur complexit due leur extrme
variabilit. Il reste certainement encore beaucoup dire et faire sur
l'tude de la distribution des pluies annuelles. Dans ce rapport,
nous n'avons peut-tre analys qu'une petite partie de ce qui
pourrait tre demain tout un "iceberg" risquant de bouleverser les
connaissances hydrologiques actuelles. Durant ce travail, nous nous
sommes rendus compte de toute la difficult qu'il y a modliser les
queues de distribution. Cette tude devrait donc tre poursuivie sur
des sries de plus en plus longues qui sont celles qui permettent de
mieux mettre l'preuve les modles statistiques, car on y retrouve en
principe davantage d'vnements rares dont la probabilit d'apparition
est faible (Hubert et Bendjoudi, 1996). Les consquences attaches
ces vnements rares sont trs lourdes (crues, inondations,
dimensionnement et cots des ouvrages) d'o tout l'intrt les matriser
afin de mieux les estimer. Les approches fractales et
multifractales ouvrent une nouvelle re la modlisation espace-temps
des champs de pluies. Elles permettent de mieux rendre compte de la
nature intermittente spatio-temporelle des prcipitations.
Contrairement aux lois classiques dcroissance exponentielle
beaucoup trop rapide, les dmarches multifractales mettent en
vidence une dcroissance algbrique des queues de distribution avec
un exposant qD qui serait invariant d'chelle et universel. Les
implications d'un tel rsultat sont nombreuses et considrables tant
sur le plan scientifique, conomique que social. Pour terminer, nous
osons esprer que ces nouveaux outils (fractals et multifractals)
ont de beaux jours devant eux et que les chercheurs s'investiront
de plus en plus dans cette voie en vue d'une meilleure connaissance
et comprhension des phnomnes naturels.
-
35
Rfrences bibliographiques ABRAMOWITZ M., STEGUN A. Irne, 1970.
Handbook of mathematical functions,
with formulas, graphs and mathematical tables, Dover
Publications, Inc., New York, 1045 p.
AFNOR, 1994. Codes pour la reprsentation des noms de pays; norme
NF EN 23166, ISO 3166.
BENDJOUDI H., 1983. Application du concept d'entropie dans les
sciences de l'eau, Thse de Doctorat, ENSMP, UPMC Paris 6, 175 p. +
annexes.
BENDJOUDI H. et HUBERT P., 1997. Longues sries disponibles dans
la base AMHY-FRIEND Flow Regime from International Experimental and
Network Data, Projets H-5-5 (IHP IV) and 1.1 (IHP V) Third report:
1994-1997, CEMAGREF ditions, pp. 362-366.
BENDJOUDI H., HUBERT P., SCHERTZER D., LOVEJOY S., 1997.
Interprtation multifractale des courbes intensit-dure-frquence des
prcipitations, CR Acad. Sci. Paris, Science de la vie, 1997, 325,
pp.323-326.
BENDJOUDI H., HUBERT P., 1998. A propos de la distribution
statistique des cumuls pluviomtriques annuels: Faut-il en finir
avec la normalit? Revue des sciences de l'eau, 4, pp. 627-640.
BERNHEIM M., 1991. FORTRAN: Mode d'emploi, InterEditions, Paris,
220 p. BOBEE B., 1996. Elments de Statistiques, Polycopi de cours
DEA HHGG, ENSMP,
UPMC Paris VI, 56 p. CHAPEL A., FIEUX M., JACQUES G., JACQUES
J.-M., LAVAL K., LEGRAND M., LE
TREUT H., 1996. Ocans et Atmosphre - Science de l'Univers,
collection Synapses, Hachette Education, Paris, 160 p.
DANIEL-JEAN D., 1984. Le Langage FORTRAN, Editests-Paris
(France), 141 p. DENIS-PAPIN M., 1959. Mathmatiques gnrales, Tome
I, Dunod, Paris, 213 p.+annexes. DE LIMA M. I. P., GRASMAN J.,
1999. Multifractal analysis of 15-min and daily rainfall from
a semi-arid region in Portugal, Journal of Hydrology, 220,
pp.1-11. FOUERE Pascale, 1990. Essais d'estimation et de
caractrisation fractale des prcipitations
sahliennes, Mmoire DEA national d'Hydrologie, ENSMP, UPMC Paris
VI, 36 p. HAAN C. T., 1977. Statistical methods in hydrology, The
lowa State University Press, Ames, 378 p. HARTMANN L. D., 1994.
Global Physical Climatology, Academic Press, New York, 409 p.
HUBERT P. et CARBONNEL J. P., 1988. Caractrisation fractale de la
variabilit et de
l'anisotropie des prcipitations tropicales. CR Acad. Sci. Paris,
vol. 2, 307, pp. 909-914.
HUBERT P. et CARBONNEL J. P., 1989. Dimension fractale de
l'occurrence de pluie en climat Soudano-Sahlien. Hydro.
Continentale, 4, pp. 3-10.
HUBERT P., TESSIER Y., LOVEJOY S., SCHERTZER D., SCHMITT F.,
LADOY P., CARBONNEL J. P., VIOLETTE S., 1993. Multifractals and
extreme rainfall events, Geophysical Research Letters, Vol. 20, n
10, pp. 931-934.
HUBERT P., TOMA C. A., SCHERTZER D., LOVEJOY S., SCHMITT F.,
LADOY P., 1994. Introduction aux Fractals et Multifractals, Cahier
GANG-France publi par URA-CNRS 1367, 59 p.
HUBERT P., FRIGGIT F., CARBONNEL J. P., 1995. Multifractal
structure of Rainfall Occurrence in West Africa, Z.W. Kundzewicz
[Ed.], New Uncertainty Concepts in Hydrology and Water Ressources,
Cambridge University Press, pp.109-113.
HUBERT P. et BENDJOUDI H., 1996. Introduction l'tude des longues
sries pluviomtriques, XIIme journes hydrologiques de l'ORSTOM,
Montpellier.
HUBERT P. et BENDJOUDI H., 1997. Caractristiques fractales des
sries pluviomtriques, FRIEND Flow Regime from International
Experimental and Network Data, Projets H-5-5 (IHP IV) and 1.1 (IHP
V) Third report: 1994-1997, CEMAGREF ditions, pp. 352-356.
-
36
HUBERT P., BENDJOUDI H., SCHERTZER D., 1998. Indpendance
d'chelle de la distribution statistique des prcipitations extrmes,
International Hydrological Program (IHP-V), Technical Document in
Hydrology, n 20, Unesco, Paris.
KOTTEGODA N. T., 1980. Stochastic Water Ressources Technology,
The MacMillan Press Ltd, 384 p.
LECOINTE P. et TRIEU L., 1987. Le formulaire: Thormes-Thories et
Formules, Ed. Pierre Bordas et Fils, Paris, 370 p.
LIDE D. R., 1992. Handbook of Chemistry and Physics, 73 rd
edition, CRC Press, pp. A58-A60.
MAIDMENT D. R., 1992. Handbook of Hydrology, McGRAW-HILL, Inc,
USA, pp.18.1-18.66. MANDELBROT B.B., 1974. Intermittent turbulence
in self-similar cascades: divergence of
high moments and dimension of the carrier, J.Fluid Mech., 62,
pp. 331-350. MANDELBROT B.B., 1975. Les objets fractals, forme,
hasard et dimension, Paris, 192 p. MANDELBROT B.B., 1982. The
fractal geometry of nature, freeman, San Francisco, 460 p. MARSAN
D., SCHERTZER D., LOVEJOY S., 1996. Causal Space-Time
Multifractal
Processes: Predictability and forecasting of rain fields,
Journal of Geophys. Research, 101, D21, pp. 26,333-26,346.
MARSAN D.,1998. Multifractals espace-temps, dynamique et
prdicibilit; Application aux prcipitations. Thse de Doctorat
Physique Thorique, UPMC Paris VI, 181 p.
METCALF M. et REID J., 1993. FORTRAN 90: Les concepts
fondamentaux, AFNOR Paris (France), 376 p.
MORLAT G., 1956. Les lois de probabilit de Halphen, Revue de
statistique applique, 4, pp. 21-43.
NDAM NGOUPAYOU J. R., 1989. Distribution des pluies sur dix
postes pluviomtriques d'Afrique de l'Ouest (Burkina Faso), Mmoire
DEA National d'Hydrologie, UPMC Paris VI, 113 p.
PRESS W. H., FLANNERY B. P., TENKOSLSKY S. A., VETTERLING W. T.,
1990. Numerical Recipes, the art of scientific computing (FORTRAN
Version), Cambridge University Press, 874 p.
REMENIERAS G. et HUBERT P., 1990. Article Hydrologique de
l'Encyclopdia Universalis, Paris, volume XI de l'dition 1990, pp.
796-806.
SCHERTZER D. et LOVEJOY S., 1985. Generalized scale invariance
in turbulent phenomena, Phs. Chem. Hydrodyn. J., 6, pp.
623-635.
SCHERTZER D. et LOVEJOY S., 1987a. Physically based rain and
cloud modeling by anisotropic scaling of multiplicative processes,
Journal of Geophysical Research D, 92, pp. 9693-9714.
SCHERTZER D. et LOVEJOY S., 1987b. Singularits anisotropes et
divergences des moments en turbulence, Ann. Sc. Math. du Qubec, 11,
pp. 139-181.
SCHERTZER D. et LOVEJOY S., 1991. Scaling nonlinear variability
in geodynamics: Multiple singularities, observables, universality
classes; Non-linear variability in Geophysics, Scaling and
fractals, D. Schertzer and S. Lovejoy eds, Kluwer,pp. 41-82.
SCHERTZER D. et LOVEJOY S., 1992. Hard and soft multifractal
processes, Physical Ann., 195, pp. 187-194.
SCHERTZER D. et LOVEJOY S., 1993. Nonlinear Variability in
Geophysics: Scaling and Multifractal Processes, Lecture Notes.
Institut d'tudes scientifiques de Cargse.
SIDNEY I. RESNICK, 1997. Heavy tail modeling and teletraffic
data, The Annals of Statistics, vol. 25, n5, pp. 1805-1869.
STROHMEIER A., 1982. FORTRAN 77: Approche systmatique illustre
d'exemples, Edition Eyrolles, Paris, 140 p.
VAN MONFORT M. A. J. et WITTER J. V., 1986. The Generalized
Pareto distribution applied to rainfall depths, Hydrological
Journal, Journal des Sciences Hydrologiques, 31, pp. 151-162.
-
37
Annexes Tableau 1: Prsentation de la base de donnes Tableau 2:
liste des stations avec les valeurs de qD, le coefficient de
corrlation et le nombre de points utiliss Tableau 3: Liste des
stations avec les valeurs des pentes Graphique 1: Variation de la
fonction de corrlation Graphique 2: Variation du coefficient de
corrlation Graphique 3: Variation du coefficient de corrlation
moyen Graphique 4: Variation de la fonction de corrlation moyenne
Graphique 5: Variation du coefficient de corrlation E-W Graphique
6: Variation du coefficient de corrlation N-S Graphique 7:
Variation de la fonction de corrlation E-W Graphique 8: Variation
de la fonction de corrlation N-S Graphique 9: Comparaison des
coefficients de corrlation Graphique 10: Comparaison des fonctions
de corrlation Graphique 11: Probabilit empirique et ajustement une
loi normale Graphique 12: Srie pluviomtrique de Ddougou: Invariance
d'chelle Graphique 13: Variation de qD en fonction de la dure des
sries Graphique 14: Evolution des moments d'ordre 1 6 en fonction
du nombre N
d'annes utilis ( Gibraltar ) Graphique 15: Comparaison des
priodes de retour empirique n et thorique T (loi normale) Graphique
16: Trac de la fonction densit de probabilit g Graphique 17:
Comparaison des modes empirique et estim Graphique 18: Comparaison
des mdianes empirique et estime Graphique 19: Probabilit empirique
et ajustements loi normale et loi f propose Graphique 20: Autre
mthode d'estimation de qD: Ajustement sur les 3 derniers points
Graphique 21: Variation de la pente en fonction de la dure des
sries.
RemerciementsPageI1- Description de la base de donnesI2- Analyse
l'chelle globale
Il faudra remarquer que dans l'intervalle ]0;1], g'(u)(+( quand
u(0, la courbe de g (Cg) admet donc une tangente verticale
l'origine. Alors que dans l'intervalle ]1; +([, g'(0)=0: (Cg) admet
une tangente horizontale l'origine.
Choix des paramtres a et cIII-4-2- Paramtres statistiquesModeb)
Mdianec) MomentsLe moment dordre p se met sous la forme:
IV-1- Approche thorique (Keltoum CHAOUCHE, paratre)IV-2-
Application aux donnes
Conclusion