Risque de Gap: Outils d'Analyse
14 juin 2007
Remerciements
Je tiens à remercier tout d'abord mes maîtres de stage Brunel Vivien et TamineJulien qui ont bien voulu m'accueillir au sein de l'équipe de structuration créditde SGAM\AI\SAM pour mon stage. Je tiens aussi à les remercier pour l'en-cadrement qu'ils m'ont fourni et l'apprentissage dont j'ai pu bénécier à leurscôtés.
Je tiens également à remercier toute l'équipe de structuration pour sa disponi-bilité et sa bonne humeur. Un clin d'oeil tout particulier aux juniors des équipesde gestion des structurés.
1
Abstract
L'objectif de cette note est de proposer des outils d'analyse du risque de gap em-pruntés à la théorie des valeurs extrêmes. Ces résultats théoriques sont présen-tés dans les premières sections, leur démonstration lorsqu'elle reste d'un niveauabordable est donnée en Annexe. Ils sont ensuite utilisés pour étudier les car-actéristiques des principales classes d'actif sur lesquelles nous pourrions êtreamenés à acheter ou à vendre de la protection. Bien que certains des résul-tats décrits soient valables sous des hypothèses de mélangeance des données, onse place dans un cadre statistique d'observations iid qui est pertinent pour lesclasses d'actifs traditionnelles mais sans doute moins justié pour les actifsplus illiquides tels que les hedge funds. Nous serons alors amenés à introduirel'indice extrêmal an de pallier à ce problème. Les résultats qui nous intéressentconcernent en général des variations fortement négatives du sous jacent cepen-dant la relation
min (X1, ..., Xn) = max (−X1, ...,−Xn)
nous permet de nous limiter à l'analyse de fortes variations positives.
Table des matières
1 L'ENVIRONNEMENT DU STAGE 3
1.1 Présentation du groupe SG Asset Management . . . . . . . . . . 3
1.2 Les diérents styles de gestion . . . . . . . . . . . . . . . . . . . . 4
1.2.1 Le concept de base : la gestion active . . . . . . . . . . . . 4
1.2.2 La gestion alternative . . . . . . . . . . . . . . . . . . . . 4
1.2.3 La gestion sur mesure . . . . . . . . . . . . . . . . . . . . 4
1.2.4 Une gestion dont la qualité est certiée . . . . . . . . . . 4
1.3 L'organisation de la gestion alternative au sein de la SG AM . . 5
1.3.1 SGAM Alternative Investments : une liale de SG AM . . 5
1.3.2 SG AM Structured Asset Management . . . . . . . . . . . 5
2 Gap Risk 8
2.1 Dénition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2 Couverture . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2.1 Stability Note . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2.2 Basket Gap Note . . . . . . . . . . . . . . . . . . . . . . . 10
3 Théorie des valeurs extrêmes 12
3.1 La théorie des records . . . . . . . . . . . . . . . . . . . . . . . . 12
3.1.1 Méthode des excès de Gumbel . . . . . . . . . . . . . . . 12
3.1.2 Etude des records . . . . . . . . . . . . . . . . . . . . . . 14
3.1.3 Quelques remarques sur les notions : niveau et temps deretour . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.2 La méthode des peak over threshold . . . . . . . . . . . . . . . . 22
1
3.2.1 Lois des valeurs extrêmes . . . . . . . . . . . . . . . . . . 23
3.2.2 Mean Excess Value et Generalized Distribution of Pareto(GDP) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.2.3 Méthode d'estimation . . . . . . . . . . . . . . . . . . . . 30
3.3 Quelques résultats sur la distribution de Pareto généralisée (GDP) 32
3.3.1 Analyse de la densité . . . . . . . . . . . . . . . . . . . . . 32
3.3.2 Moments de la GDP . . . . . . . . . . . . . . . . . . . . . 33
3.4 Application . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.4.1 Données Empiriques . . . . . . . . . . . . . . . . . . . . . 35
3.4.2 Résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
4 Indice des Extrêmes 70
4.1 Préliminaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
4.2 Indice des extrêmes . . . . . . . . . . . . . . . . . . . . . . . . . . 73
4.2.1 Dénition . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
4.2.2 Interprétation et estimation de l'indice des extrêmes . . . 74
4.3 Mise en application . . . . . . . . . . . . . . . . . . . . . . . . . . 78
5 ANNEXE 81
5.0.1 Gestion CPPI . . . . . . . . . . . . . . . . . . . . . . . . . 81
5.0.2 Méthode des excès de Gumbel (3.1) . . . . . . . . . . . . 83
5.0.3 Etude du nombre de records (3.2) . . . . . . . . . . . . . 85
5.0.4 Temps et niveau de retour (3.5) . . . . . . . . . . . . . . . 86
5.0.5 Sensibilité des moments de la distribution de Pareto Général-isée au paramètre d'échelle . . . . . . . . . . . . . . . . . 88
5.0.6 Simulation d'une GDP . . . . . . . . . . . . . . . . . . . 89
5.0.7 Mean Excess function pour X/X > u (3.7) . . . . . . . . 90
5.0.8 Revue de la méthode d'optmisation du Gradient Conjugué 90
5.0.9 Détermination des éléments de la matrice de Fisher (3.10) 91
5.0.10 Quantiles (3.9, 3.9) . . . . . . . . . . . . . . . . . . . . . . 91
5.0.11 Indice des extrêmes . . . . . . . . . . . . . . . . . . . . . 93
2
Chapitre 1
L'ENVIRONNEMENT DU
STAGE
Mon stage s'est déroulé dans l'équipe de structuration crédit du service SGAM/AI/SAM,ce qui signie Société Générale Asset Management/ Alternative Investements/Structured Asset Management. Chaque échelon de cette dénomination est ex-plicité dans les paragraphes qui suivent.
1.1 Présentation du groupe SG Asset Manage-ment
Filiale de la Société Générale, SG Asset Management bénécie de l'expertised'un groupe qui a créé la première SICAV française en 1964. Filialisée en janvier1997 pour prendre en charge les activités de gestion d'actifs dans le cadre d'uneentité juridique indépendante, elle propose aux particuliers, aux entreprises etaux investisseurs institutionnels français et internationaux une très large gammede produits et de services de placement adaptés à leurs besoins.
Avec 237 milliards d'euros d'actifs gérés à n septembre 2003 par ses quatre pôlesd'expertise aux Etats-Unis (71 milliards d'euros), au Royaume-Uni (9 milliardsd'euros), en Europe continentale (145 milliards d'euros) et en Asie (12 milliardsd'euros), la SG AM s'impose en tant que 3ème gestionnaire pour compte de tiersde la zone Euro et s'inscrit parmi les 20 premiers acteurs du marché mondial.
3
1.2 Les diérents styles de gestion
1.2.1 Le concept de base : la gestion active
La gestion active repose sur un processus d'investissement bottom up quidonne la priorité à la sélection des valeurs. Cette sélection repose sur une re-cherche économique fondamentale qui analyse les évolutions des grandes écono-mies mondiales ainsi que celles des marchés taux et actions. La sélection desvaleurs est validée par un contrôle des risques géographique et sectoriel.
1.2.2 La gestion alternative
Ce département a été créé en 1999. Il constitue pour SG Asset Management undes axes prioritaires de son développement. Assurée par des équipes spécialiséesdiérentes, la gestion alternative propose des solutions complémentaires : gestionsous contrainte (capital garanti, rendement,. . . ), hedge funds mono ou multi-stratégies, fonds de futures, private equity (capital risque pour le compte detiers).
1.2.3 La gestion sur mesure
Pour ses clients institutionnels, SG Asset Management propose une ore discré-tionnaire sous mandat, avec toute une gamme de produits sur mesure : produitsactions, taux ou diversiés, produits de trésorerie avec ou sans garantie de capi-tal. La cellule de reporting assure pour ces clients un suivi des performances etleur fournit diérents éléments d'analyse, notamment les calculs d'attributionde performance.
1.2.4 Une gestion dont la qualité est certiée
La certication AIMR (Association for Investment Management & Research)de SG Asset Management signie qu'en terme de mesure de performances, uneinformation complète, claire et représentative des résultats de gestion.
L'agence de rating Fitch-AMR lui a attribué la note aa+ pour l'ensemble deson dispositif international.
4
1.3 L'organisation de la gestion alternative ausein de la SG AM
1.3.1 SGAM Alternative Investments : une liale de SGAM
Avec SG AM AI, SG AM accélère son développement dans la gestion alternative.
SG AM AI couvre trois activités principales :
Private Equity : investissement en actions non cotées en capital risque, encapital développement et LBO ;
Hedge Funds, activité dans laquelle a été développée une ore complète defonds total return : single strategies, fonds de hedge funds, overlay ;
Gestion structurée dans le domaine des fonds garantis, de la gestion monétairealternative et de la gestion indicielle.
Real Estate, activité toute récente comprenant quatre personnes.
L'approche de SG AM AI est essentiellement quantitative, développée par uneimportante équipe de recherche dédiée à cette activité et encadrée par un fortcontrôle des risques. Ses priorités sont la recherche d'une performance absolueet l'innovation produit.
1.3.2 SG AM Structured Asset Management
SG AM Structured Management se compose de neuf équipes.
L'équipe de gestion active : gestion corrélée et décorrélée :
L'équipe de gestion corrélée est chargée des produits CPPI et des options surfonds. Le produit CPPI est un produit garanti : l'investissseur se voit proposerdiérents types de garanties : garantie d'un pourcentage de capital, de rende-ment, à maturité ou instantanée, quelque soit l'évolution des marchés. A cettegarantie peut s'ajouter un revenu lié à la performance d'un indice ou d'un panierd'indices donné.
L'équipe de gestion décorrélée se charge quant à elle des produits monétairesqui sont une catégorie particulière de SICAV dites de court terme ou encorede trésorerie . Il s'agit d'un placement liquide à court terme et présentantune grande stabilité et régularité.
Cette équipe se compose de douze gérants et assistants.
5
L'équipe de gestion structurée :
Cette équipe s'occupe des :
- Produits éligibles au PEA (Plan d'Epargne en actions).
- Produits de gestion passive : stratégie OBPI
- ETF(Exchange Traded Fund) : ce sont des fonds indiciels cotés.
Elle se constitue de trois gestionnaires.
L'équipe d'ingénierie nancière :
Cette équipe a pour principales fonctions de répondre aux propositions com-merciales. Elle doit :
- Proposer des structures de produits adaptés aux besoins et aux prols desdiérents clients ;
- Etudier les risques liés à ces types de structures tant sur le plan nancierque sur le plan juridique ;
- Etudier les diérentes possibilités d'optimiser le couple rentabilité-risque ;
- Elaborer de nouveaux produits dans le but de maintenir le leadership dela SG AM sur les produits garantis et d'élargir la gamme de produits proposés.
Cette équipe comprend douze personnes.
L'équipe de la Recherche :
Cette équipe travaille sur les aspects théoriques de la nance : elle tente dedévelopper en interne des modèles quantitatifs de nance et de proposer desaméliorations en ce qui concerne les techniques de gestion de fonds, ainsi qued'assister les diérentes équipes de SAM dans la création et la gestion de nou-veaux produits.
Cette équipe se compose de cinq chercheurs.
L'équipe commerciale :
6
Cette équipe, constituées de six personnes, est chargée de la vente des produitsSAM. Elle tente d'élaborer, en partenariat avec l'ingénierie nancière, de nou-velles structures de produits plus adaptées aux besoins des diérents clients.
L'équipe commerciale internationale (International Coverage) :
Cette équipe se compose de cinq responsables de zone (Espagne, Etats-Unis,Asie, Japon, Moyen-Orient). Elle a pour objectif d'assurer la promotion desproduits SAM à l'international.
L'équipe du Middle Oce :
Six personnes sont chargées de passer et de contrôler les ordres passés par leFront Oce (les gestionnaires) et d'élaborer des bases de données sur les dié-rents produits proposés par SAM (frais de gestion, minimum de souscription,performance des fonds).
L'équipe informatique :
Cette équipe de vingt-trois personnes assure la mise en place et l'entretien dusupport informatique pour l'ensemble des équipes.
7
Chapitre 2
Gap Risk
Cette partie tente d'apporter quelques éléments d'analyse de la notion du risquede Gap mais avant d'aborder l'étude théorique, nous apportons quelques élé-ments de réponse aux questions pouvant se poser :
Qu'est-ce que le risque de Gap ? Comment peut-on se couvrir contre ce type de risque ?
2.1 Dénition
Le risque de Gap est le risque que le prix d'un actif uctue de façon considérableentre deux dates données sans mouvement de traite ou de négociation entre cesdeux instants. Ces mouvements surviennent lorsque des rumeurs adverses ontlieu. Suppososns la cas d'une action X émise par une entreprise ou une institutionY. A la clôture du marché, le prix de l'action est à 50$ néanmoins le soir, unerumeur de démission du PDG (par exemple) circule et à l'ouverture des marchés,le prix de l'action est à 40$ : cette uctuation qualie le Risque de Gap.
Le risque de Gap est donc lié à la notion de pire variation observée sur unedurée donnée. Ce risque est important et peut inuer le rendement de plusieursproduits notamment les produits de gestion sur fonds type CPPI. En eet, unCPPI (Constant Portfolio Proportion Insurance) est un type de gestion d'actifsà capital garanti. Le schéma d'investissement est détaillé dans ce qui suit :
8
Fig. 2.1 Gestion CPPI
Un investisseur investit un montant V0 dans un panier d'actifs :
ZC0 et le zéro-coupon associé à V0
C0 = V0 − ZC0
L'allocation des investissements s'eectue de la manière suivante :
mC0 est investi dans des actifs risqués ou m est le levier ou multiplicateur dela gestion CPPI
V0 −mC0 est investi dans des actifs non risqués
A un instant t donné, le panier d'actifs vaut Vt et la répartition des investisse-ments s'eectue comme suit :
ZCt le zéro-coupon associé à V0
Ct = Vt − ZCt mCt investi dans des actifs risqués Vt −mCt investi dans des actifs sans risque
L'intérêt d'une gestion CPPI est qu'elle garantit le capital initial de l'investisseurtout en assurant une certaine performance indexée sur le rendement des actifsrisqués. An de garantir le capital investi à échéance, le coussin doit resterpositif et donc le levier m doit vérier m < 1
d ou d est le gap risk ou scénario destress observé sur une période donnée.(voir démo en annexe) d'où l'importancede l'inuence du Gap Risk.
9
2.2 Couverture
An de se couvrir contre le risque de Gap, plusieurs produits sont proposés.Nous allons exposer alors certains de ces produits et la protection qu'ils peuventapporter contre le risque de Gap.
2.2.1 Stability Note
La stability Note est un put spread sur un horizon de liquidité avec des strikestrès en dehors de la monnaie (2/3 du stress scenario et stress). Le sous-jacentétant un fonds unique ou bien un panier de fonds.
Fig. 2.2 Schéma d'un Put Spread
Prenons un fonds dont le stress est évalué à 15%(cad le maximum drawdownobservable sur le fonds) et une stability note de strikes respectifs 10% et 15% :l'économie en stress s'élève donc à 1/3 du stress total. La mise en place de cettenote sur un panier de fonds s'eectue comme suit :
Nominal du swap : 1/3 de la consommation en stress (ex : on considère unfonds de valeur 100 MEuro, sa consommation en stress est de 15%×100 = 15d'où le nominal du swap est de 5
Spread payé au vendeur : x bp sur le nominal du swap Economie en risque de stress : 1/3 de la consommation initiale.
2.2.2 Basket Gap Note
Le Basket Gap Note consiste en l'achat de protection senior (la contrepartie oula partie vendeuse de protection est assez sûre) sur un pool de stability notes
10
digitales. Il s'agit d'un swap de défaut déclenché par la réalisation d'un stressau niveau du sous-jacent.
Fig. 2.3 Swap de défaut
Considérons un panier de fonds, chaque fonds ayant une consommation en limitede stress donnée. On considère un swap de défaut pour chaque fonds qui estdéclenché lorsqu'un choc sur un fonds dépasse un strike (ex : 2/3 du stress). Lenominal de ce swap est égal au stress et le seuil de déclenchement est égal au 2/3du stress. Pour chaque fonds, un achat de proctection via ce swap permettraitdonc de ressortir l'intégralité du risque de stress : le coût en revanche serait trèsélevé.
Conclusion : A travers ces deux exemples de produits disponibles, la quanti-cation du Gap Risk paraît importante an d'assurer une couverture et un coûtadéquats aux chocs pouvant survenir au niveau d'un fonds ou d'un sous-jacentdonné. Dans ce qui suit, nous expososns alors quelques outils d'analyse du GapRisk empruntés à la théorie des valeurs extrêmes que nous appliquons ensuite àl'étude de certains sous-jacents.
11
Chapitre 3
Théorie des valeurs extrêmes
3.1 La théorie des records
Un contrat de risque de gap est souvent lié à la notion de pire variation observéesur une période donnée. Ainsi, si ce risque de gap apparaît sous la forme d'un puten dehors de la monnaie, le strike de ce put est parfois déni comme un multiplede la variation maximum que l'on a pu observer. La première interrogation quel'on peut avoir concerne la pertinence statistique de ce maximum des variationssur un historique :
1. Quelle est la probabilité qu'une observation future excède le maximumdrawdown observé sur un historique de données ?
2. Quelle est la distribution du temps entre deux dates de réalisation de maxdrawdown ?
Une réponse à ces questions est fournie par la théorie statistique des recordsdont quelques résultats sont présentés ci-après.
3.1.1 Méthode des excès de Gumbel
On note (Xk,n)k=1...nla statistique d'ordre k de l'échantillon [X1, ...., Xn] , avecX1,n = max [X1, ...., Xn] etXn,n = min [X1, ...., Xn]. On considère alors l'échantillonde données de taille r [Xn+1, ...., Xn+r] et on note Snr (k) =
∑ri=1 I[Xn+i>Xk,n] le
nombre d'observations de l'échantillon [Xn+1, ...., Xn+r] qui excèdent la statis-tique d'ordre Xk,n. La méthode des excès de Gumbel dit que Snr suit une loihypergéométrique :
P (Snr (k) = j) =Cr+n−k−jn−k Cj+k−1
k−1
Cr+nn. (3.1)
12
Illustration numérique : Ces résultats sont illustrés dans le cas k = 1 (ie dansle cas du maximum) et on suppose que l'on dispose d'un historique de donnéesquotidiennes, une année étant constituée de 250 jours boursiers. Le tableauci-dessous donne la probabilité que le maximum observé sur la période passéene soit pas dépassé pendant la période future en fonction de la longueur del'historique d'observation et de la période d'observation future :
Passe / futur 0.25 0.5 0.75 1 1.25 1.5 1.75 2 2.25 2.5 2.75 3 3.25 3.5 3.75 4 4.25 4.5 4.75 51 80% 67% 57% 50% 44% 40% 36% 33% 31% 29% 27% 25% 24% 22% 21% 20% 19% 18% 17% 17%2 89% 80% 73% 67% 62% 57% 53% 50% 47% 44% 42% 40% 38% 36% 35% 33% 32% 31% 30% 29%3 92% 86% 80% 75% 71% 67% 63% 60% 57% 55% 52% 50% 48% 46% 44% 43% 41% 40% 39% 38%4 94% 89% 84% 80% 76% 73% 70% 67% 64% 62% 59% 57% 55% 53% 52% 50% 48% 47% 46% 44%5 95% 91% 87% 83% 80% 77% 74% 71% 69% 67% 64% 63% 61% 59% 57% 56% 54% 53% 51% 50%6 96% 92% 89% 86% 83% 80% 77% 75% 73% 71% 69% 67% 65% 63% 62% 60% 59% 57% 56% 55%7 97% 93% 90% 88% 85% 82% 80% 78% 76% 74% 72% 70% 68% 67% 65% 64% 62% 61% 60% 58%8 97% 94% 91% 89% 86% 84% 82% 80% 78% 76% 74% 73% 71% 70% 68% 67% 65% 64% 63% 62%9 97% 95% 92% 90% 88% 86% 84% 82% 80% 78% 77% 75% 73% 72% 71% 69% 68% 67% 65% 64%
10 98% 95% 93% 91% 89% 87% 85% 83% 82% 80% 78% 77% 75% 74% 73% 71% 70% 69% 68% 67%
Ces niveaux sont représentés graphiquement ci-dessous :
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
0 2 4 6 8 10 12
longueur de l'historique (en années)
prob
abili
té d
e dé
pass
emen
t du
draw
dow
n
futur0.25
futur0.5
futur0.75
futur1
futur1.25
futur1.5
futur1.75
futur2
futur2.25
futur2.5
futur2.75
futur3
futur3.25
futur3.5
futur3.75
futur4
futur4.25
futur4.5
futur4.75
futur5
Remarque : le nombre moyen de dépassements de la statistique d'ordre Xk,n
dans l'échantillon [Xn+1, ...., Xn+r] est égal à rkn+1 .
13
3.1.2 Etude des records
Durant les crises nancières, on entend toujours parler de records atteints à labaisse. Ces records apparaîssent comme des maximas temporaires. En eet, sion considère une série d'observations (X1, X2, ......., Xn), un record Xn survientlorsque Xn > Mn−1 où Mn−1 = max(X1, X2, ....., Xn−1). Ainsi, le nouveaurecord Xn correspond à Mn soit ces records correspondent aux sauts du proces-sus (Mn). Les temps (L1, L2, ....., Ln) durant lesquels les sauts surviennent sontaléatoires et sont notés, dans ce qui suit, les temps de record. Dans le contexted'une crise nancière, la théorie des records revêt une grande importance carelle permet de prédire le nombre de records observés sur un intervalle de tempsdonné.
Nous allons donc exposer quelques résultas généraux sur la théorie des recordspour enn l'appliquer à la détermination de la loi du nombre de records.
Résultats généraux sur la théorie des Point Process
La modélisation probabiliste d'un système chaotique (cas des marchés nancierslors des crises nancières) passe par la représentation des événements futursincertains : le concept central est donc : (Li) le processus de temps d'occurencedes événements extrêmes ou des records.
Soit (Ft)t≥0 la ltration naturelle associée à ce processus et Nt le processus decomptage dont la valeur Nt(w) compte le nombre d'événements étant survenusjusqu'au temps t, w étant l'état de l'univers. On a alors: (Li) et (Nt)t≥0
contiennent exactement les mêmes informations. Cette classe de processus estappelée point process ou processus ponctuels. La question qui se pose est donc: pourquoi passe-t-on par la modélisation des point processes et non par leprocessus des temps aléatoires pour la prédiction des événements extrêmes? Laraison fondamentale est que les événements sont des événements surprises, ilssont totalement inaccessibles en se basant sur la ltration Ft.
Ainsi, la théorie des point process apparaît comme un outil indispensable à lamodélisation et la prédiction des records. Dans ce qui suit, nous exposons lesdiverses propriétés de ces processus et les résultats de leurs applications à lathéorie des records.
Dénition On considère une suite (Xn) de variables aléatoires dénies sur unespace d'états E et soit A ⊂ E. On note
N(A) = cardi/Xi ∈ A
N(A) compte le nombre des Xi se trouvant dans l'ensemble A . N(A) estaléatoire (est fonction des variables aléatoires Xi) et si on considère A = Xn,
14
on a N(A) = 1. Les Xi sont alors des atomes de N d'où le nom de point processou processus ponctuel.
Si on dénit la mesure de Dirac en un point x quelconque par :
δx(A) = 1 si x ∈ Aδx = 0 sinon
on a alors une autre écriture du point process :
N(A) =+∞∑i=1
δXi(A)
Un point process peut donc être vu comme une mesure aléatoire puisque pourchaque tirage de variables aléatoires, on obtient une mesure.
Exemple
Renewal Counting Process Soit (Di) une suite de variables aléatoires pos-
itives iid, Tn =n∑i=1
Di et T0 = 0. Les Di s'interprètent comme des durées entre
les dates Ti. On dénit le processus de comptage Nt par :
Nt = max[n/Tn < t]
Ce processus permet de compter les événements qui surviennent jusqu'à la datet. Comme les Di sont indépendants, on parle de processus de renouvellement.
A ce processus, on peut associer le point process suivant :
N(A) =+∞∑i=1
δTi(A)
avec comme espace d'états E = [0,+∞]. Pour A = [0, t], on obtient N(A) = Nt.
Ainsi, ce processus permet de dénir la loi du nombre de crises entre les instants0 et t puisque :
P (Tn ≤ t) = P (n crises avant t)
soitP (Tn ≤ t) = P (max[i/Ti < t] = n)
doncP (Tn ≤ t) = P (N([0, t]) = n)
L'apport intéressant de cette loi est aussi qu'elle permet de dénir la loi de ladurée de retour entre deux crises sucessives. En eet, en posant
15
• (Tn)n≥0 une suite de va iid telle que Tn corresponde au temps d'occurencede la nme crise.
• (Dn)n≥0 une suite de va positives iid telle que Dn = Tn − Tn−1 soit Dn
est la durée entre deux crises sucessives.
On a :
P (Dn ≤ t) =∫ u
−∞φ(z) dz
où
φ(z) =∫ +∞
1
ϕ1(x) ϕ2(x− z) dx
avec ϕ1, ϕ2 les densités respectives de Tn et Tn−1.
Convergence faible des point processes La convergence faible des pointprocesses est un outil essentiel, comme on le verra après, à l'étude des loisasymptotiques (ex : loi asymptotique du nombre de records sur un intervalle detemps donné).
Kallenberg a déni la convergence faible d'un point process sur un intervallepar:
Soit (Nn) et N deux point processes sur l'espace d'états E = (a, b] ⊂ IR tel queN un processus de Poisson simple de mesure moyenne µ- noté PRM(µ) dansce qui suit- déni par :
∀A ∈ ε, où ε est l'espace des états,
• P (N(A) = k) = e−µ(A) µ(A)k
k! si µ(A) <∞
• P (N(A) = k) = 0 si µ(A) =∞
• ∀m ≥ 1, si A1, A2, ........Am sont disjoints alors N(A1), N(A2), .........N(Am) sont independants
alors, étant données les deux conditions suivantes :
condition 1
E(Nn(A))→ E(N(A)) pour tout A = (c, d] avec a < c < d ≤ b
condition 2
P (Nn(B) = 0)→ P (N(B) = 0) pour tout B =k⋃i=1
(ci, di] tel que a < c1 < d1 < ....ck < dk ≤ b
on a Nn d−→N .
16
Résultas généraux sur la théorie des records
• Nombre moyen de records
On note Mn = max [X1, ...., Xn] .
Sous l'hypothèse iid, le nombre moyen de records dans un échantillon de taillen, ainsi que sa variance peuvent aisément se calculer, on trouve :
E (Rn) =n∑k=1
1k→ ln (n) + γ (3.2)
et
V ar (Rn) =n∑k=1
1k− 1k2
avec γ = 0.5772...la constante d'Euler. La croissance du nombre de records estdonc très lente pour des données iid. On comprend aisément que l'hypothèseiid est fondamentale pour la validité de ces résultats : pour un phénomène deréaction en chaîne, le nombre de records pourrait en eet être important surune période courte.
• Loi asymptotique du nombre de records
Soit (X1, X2, .....Xn) une série de va iid de distribution commune F . On a alors∀a, b :
N(a, b] =∞∑i=1
δXLi (a, b]
le point process associé aux temps des records est un processus de PoissonPRM(µ) où µ est donné par µ(a, b] = R(b)−R(a) avec R(x) = − ln(F (x)).
Exemple Considérons le cas où les (Xi) suivent une loi exponentielle. On aalors :
F (x) = P (X ≤ x) = 1− e−λx
donc R(x) = λx soit ∀a, b,
P (N(a, b] = k) = eλ(a−b) (λ(b− a))k
k!
La loi du nombre de records d'un échantillon donné est donc donnée par unprocessus de Poisson. Néanmoins, cette loi nécessite la connaissance de la dis-tribution de la fonction de répartition des (Xi) ce qui n'est pas toujours le cas.
17
Les résultas suivants permettent de contourner cette problématique et de dénirautrement la loi du nombre de records.
Soit (Mn)n≥1 le processus des maximas de la série (X1, X2, ....., Xn) . (Mn)n≥1
dénit un processus stochastique discret et sa distribution jointe en dimensionnie est donnée par :
P (Mn1 ≤ x1,Mn2 ≤ x2, ...,Mnm ≤ xm) = Fn1( inf1≤i≤m
xi)Fn2−n1( inf2≤i≤m
xi)...Fnm−nm−1(xm)
(3.3)
Si on considère le processus continu Y = Y (t) muni de la même distribu-tion jointe que la précedente alors Y est le prolongement continu du processus(Mn)n≥1 et on a :
(Mn)n≥1 =d (Y (n))n≥1
Ce processus hérite alors les propriétés de distribution de la suite des maximas.
L'idée intuitive derrière ce prolongement est de pouvoir établir le lien entre lestemps de records du processus Y et les temps de records du processus (Mn)n≥1.La dernière égalité donne en eet que les sauts de (Mn) sont aussi des sauts deY , l'inverse étant faux puisqu'on peut avoir des sauts de Y sur [Ln−1, Ln], Yétant un processus continu.
Si F est continue (ce qui est le cas pour l'étude des séries nancières), alors lestemps de records de Y sont donnés par le point process suivant :
N∞ =∞∑n=1
δτn
Ce processus est un processus de Poisson PRM(µ) d'intensité f(t) = 1t soit :
∀a < b, µ(a, b] =∫ b
a
f(t)dt = ln(b
a)
La problématique qui reste à résoudre est donc d'établir le lien entre les tempsde record du processus (Mn)n≥1 et ceux du processus Y .
En eet, si on note N =∞∑i=1
δLi le point process associé au nombre de records
du processus (Mn)n≥1, on a alors par l'argument de couplage de ces deux pointprocess : il ∃ N0 une variable aléatoire tel que :
∀w ∈ Ω, N((n, n+ 1], w) = N∞((n, n+ 1], w), n ≥ N0(w)
cad les deux processus sont égaux à partir d'un certain seuil aléatoire assezgrand.
18
Ainsi, la réponse à la question : combien de records observe-t-on sur une périodede temps est donnée par la combinaison de l'argument de couplage et l'argumentque N∞((a, b]) est un processus de Poisson PRM(µ) :
Nn(a, b] = N(n.(a, b]) =∞∑i=1
δLin
(a, b] d−→N∞((a, b]) =∞∑i=1
δτi
Soit, la loi asymptotique du nombre de records sur un intervalle de temps :
P (N∞(1, t] = k) =1t
(ln(t))k
k!(3.4)
et pour t→∞, on a :
1. limt→∞ (ln t)−1N∞ = 1 presque sûrement
2. (ln t)−1/2 (N∞ − ln t)→d Φ avec Φ distribution Gaussienne
et en appliquant le même argument de couplage, on obtient les relations suiv-antes :
1. limn→∞ (lnn)−1N = 1 presque sûrement
2. (lnn)−1/2 (N − ln t)→d Φ avec Φ distribution Gaussienne
Ce nombre de records est tracé en fonction du nombre de données sur le graphiqueci-desssous avec les intervalles de conance à 95% :
0
2
4
6
8
10
12
14
16
0 10000 20000 30000 40000 50000 60
Figure 3.1: Nombre de records en fonction du nombre de données
19
Compte tenu du comportement asymptotique du logarithme, l'occurence derecords devient de plus en plus invraisemblable pour un nombre important dedonnées. Il est cependant à noter que pour un nombre de données inférieurs à1000 - 1500 (qui correspond à moins de 5 ans de données quotidiennes), la dérivéedu logarithme (1/x)est de l'ordre de 10−3et le comportement asymptotique dulogarithme n'a pas encore été atteint. Le nombre de maxima croît de façon nonnégligeable.
La distribution asymptotique des dates de record est quand à elle caractériséepar les résultats suivants :
1. limn→∞ n−1 ln (Ln) = 1 presque sûrement.
2. n−1/2 (ln (Ln)− n)→ Φ avec Φ distribution Gaussienne.
Les dates de record croîssent de façon exponentielle et sont donc de plus en plusrares lorsque la taille de l'échantillon augmente. Compte tenu de la varianceimportante des dates de record, la distribution asymptotique de ces dates a peude portée pratique.
• Loi de la durée entre deux crises données
Soit (Tn)n≥0 une suite de va iid telle que Tn corresponde au temps d'occurencede la nme crise.
Soit (Dn)n≥0une suite de va positives iid telle que Dn = Tn − Tn−1 , Dn corre-spond à la durée entre deux crises sucessives.
On suppose que T1 ≥ 1 (la première crise survient au bout d'un jour)
Nous avons alors dans ce cas P (Tn ≤ t) = P (N([1, t]) = n) = 1t
ln(t)n
n! . Ainsi, lafonction de densité de Tn est donnée par :
ϕ1(t) =ln(t)(n−1)
n!t2(n− ln(t))
et celle de Tn−1 est :
ϕ2(t) =ln(t)(n−2)
(n− 1)!t2(n− 1− ln(t))
on a alors la densité de Dn est :
φ(z) =∫ +∞
1
ϕ1(x) ϕ2(x− z) dx
d'où
φ(z) =∫ +∞
1
1n!(n− 1)!
ln(x)n−1 ln(x− z)n−2
x2(x− z)2(n− ln(x))(n− 1− ln(x− z)) dx
20
donc :
P (Dn ≤ u) =∫ u
−∞φ(z) dz
soit :
P (Dn ≤ u) =∫ u
−∞
∫ +∞
1
1n!(n− 1)!
ln(x)n−1 ln(x− z)n−2
x2(x− z)2(n−ln(x))(n−1−ln(x−z))dxdz
et comme les (Dn)n≥1 sont iid, la dsitribution de la durée de temps entre deuxcrises successives est donnée par :
P (D2 ≤ u) =∫ u
−∞
∫ +∞
1
12
ln(x)x2(x− z)2
(2− ln(x))(1− ln(x− z)) dx dz
3.1.3 Quelques remarques sur les notions : niveau et tempsde retour
Niveau de retour
Le premier objectif, lorsque l'on étudie une série de maximas est de déterminerla loi et d'en estimer les paramètres. On se pose alors la question suivante : quelniveau revient tous les dix (décenale), vingt (vicenale),cent ans (centenale) ......?ou bien ayant observé un certain niveau, on aimerait savoir ce niveau revienttous les ...?
Le niveau de retour xpd'un phénomène extrême est déni comme le quantile dela distribution :
P (X ≤ xp) = 1− p
Cette valeur est donc dépassée lors d'une année quelconque avec une petiteprobabilité p.
Temps de retour
Il est intéressant d'introduire la notion de temps de retour (ou temps d'atteinte)pour caractériser la fréquence d'occurence d'un événement. pour un seuil udonné, ce temps de retour est déni mathématiquement par l'espérance du pre-mier temps τu de dépassement du seuil u :
τu = min(i/Xi > u)
Sous l'hypothèse iid, on peut obtenir explicitement la loi du temps τu. En eet,on a:
21
P (τu = k) = F k−1X (u)(1− FX(u))
et le temps de retour du seuil u est donc donné par:
E(τu) =1
1− FX(u)(3.5)
Pour des valeurs élevées de u, on montre:
limu−>∞
P (τu < E(τu)) = 1− e−1 ' 0.62
Le temps de retour (ie l'espérance de τu) est donc plus grande que la médianede τu.
Conclusion Ainsi le niveau de retour s'interprète comme la valeur d'unevariable qui revient en moyenne tous les x = 1
p années, par exemple on peutestimer le niveau de retour à 100 ans .....
Il est à noter que les résultats de cette section ne donnent aucune information surla taille des événements extrêmes futurs mais uniquement sur la probabilité quede tels événements se produisent sur une période donnée. Plusieurs méthodesqui permettent de caractériser le comportemnt des queues de distribution d'unevariable aléatoire sont utlisables. La plus célèbre est sans doute celle de Hill quiprésente l'avantage d'être systématique mais ne laisse pas une grande latituded'interprétation. Nous lui préférons la méthode des peak over threshold qui esten grande partie basée sur une inspection graphique des données et permet dedétecter plus facilement une erreur de spécication.
3.2 La méthode des peak over threshold
L'objectif de cette section est de décrire une méthode qui permette d'estimer lafonction F (x) pour de grandes valeurs de x. La première approche qui vient àl'esprit pour estimer une fonction de répartition est la fonction de répartitionempirique qui présente l'avantage de ne pas avoir à faire l'hypothèse de spé-cication de la loi (méthode non paramétrique qui laisse parler les données).Cette approche n'est pas utilisable dans les queues de distribution du fait dumanque de données. La deuxième approche qui vient à l'esprit est une méth-ode paramétrique dans laquelle on spécie la loi F et on estime ses paramètrespar maximum de vraisemblance. Cette approche est sujette à un risque im-portant de spécication et en général il est dicile de trouver une fonction quisoit compatible à la fois avec le corps et la queue de disribution. La méthodeprésentée ci-dessous se situe à mi-chemin entre ces deux approches : on cherche
22
d'abord une forme paramétrique qui soit appropriée pour la modélisation de laqueue de distribution, cette forme étant justiée par des arguments de conver-gence asymptotique, la fonction de répartition dans le corps de la distributionest ensuite estimée par la fonction de répartition empirique (estimation per-tinente puisqu'on dispose de susamment d'observations dans le corps de ladistribution).
Avant d'exposer les résultats sous-jacents à la théorie des peak over threshold,nous exposons certains résultats sur la convergence asymptotique de la loi dumaximum d'un échantillon de variables aléatoires iid.
3.2.1 Lois des valeurs extrêmes
Théorème fondamental
Le résultat classique du théorème de la limite Centrale est souvent résumécomme suit: lorsque la taille de l'échantillon est susamment grande, la loide l'estimateur de la moyenne (moyenne arithmétique sur l'échantillon) peutêtre approchée par une loi normale ou une loi α < 2 indépendamment de la loiF des variables aléatoires considérées.
Le résultat classique est le suivant : si (X1, X2, ...., Xn) désigne un échantillonde variables aléatoires iid vériant µ = E(X1) <∞ et σ2 = V ar(X1) <∞ alors:
√nX − µσ
→ N(0, 1)
On peut résumer ce résultat sous la forme
X − anbn
→ N(0, 1)
où an, bnsont des suites normalisantes, permettant d'assurer que la loi limiteobtenue n'est pas dégénérée (non concentrée en un point).
Il est alors naturel de s'interroger sur la possibilité d'un résultat similaire pourle maximum d'un échantillon de variables alétaoires iid de loi commune F soiten d'autres termes : si Mn = max(X1, X2, ....Xn), peut on trouver des suitesnormalisantes (an)n≥1 et (bn)n≥1 telles que la loi de (Mn−an
bn) converge vers
une distribution non dégénérée particulière de H? On peut noter que les suitesnormalisantes ne peuvent être ignorées puisque :
P (Zn ≤ x) = Fn(x)
tend vers 0 ou 1 selon que x est tel que F (x) = 0 ou F (x) = 1. Ainsi, lesquestions que nous pouvons nous poser sont : comme pour le Théorème Centrale
23
Limite : a-t-on une loi limite unique? Dans le cas contraire, peut-on caractériserune famille paramétrique nie de lois limites?.....
La théorie des valeurs extrêmes permet de donner une réponse à ces questions.Les premiers résultats sur la carctérisation du comportement asymptotique dela loi du maximum normalisé ont été obtenus par Fisher et Tipett en 1928. Cethéorème explicite les résultats suiavnts:
Soit (X1, X2, ......Xn) une suite de variables aléatoires iid etMn = max(X1, X2, ....Xn).S'il existe des suites normalisantes réelles (an)n≥1 et (bn)n≥1> 0 et une suitenon dégénérée H telle que:
P (Mn − an
bn≤ x)→ H(x)
alors H est nécessairement de l'un des trois types suivants :
1. Fréchet : Φα (x) =0 si x ≤ 0
exp(− 1xα
)si x > 0 avec α > 0. Asymptotiquement,
on a 1−Φα (x) = 1− exp(− 1xα
)∼ x−α pour x→∞. Les queues d'une
loi de Fréchet décroient donc en loi puissance.
2. Weibull :Ψα (x) =exp (− (−x)α) si x ≤ 0
1 si x > 0 avec α > 0.
3. Gumbel : Λ (x) = exp (−e−x) pour tout x. Asymptotiquemet, on a 1 −Λ (x) = exp (−e−x) ∼ e−x pour x→∞.La loi de Gumbel a donc unedécroissance asymptotique exponentielle de ses queues de distribution.
De la même façon que le théorème de la limite centrale caractérise les variablesaléatoires dont la loi de la somme converge vers une loi Gaussienne et cellesdont la loi converge vers une loi α < 2 stable, on dispose de théorèmes quicaractérisent les variables aléatoires dont la loi du maximum converge vers uneloi de Fréchet, de Weibull ou de Gumbel (on parlera de lois dans le domained'attraction de Fréchet, de Weibull ou de Gumbel). De façon assez imprécise(mais susamment pour nos objectifs) :
1. Les variables aléatoires qui sont dans le domaine d'attraction de la loi deFréchet 1 − F (x) = x−αL (x) avec L une fonction slowly varying. Desexemples de telles lois sont les lois de Pareto, les lois α < 2 stables (quiincluent entre autres la loi de Cauchy), les lois de Burr. Ce domained'attraction contient donc en particulier les lois à queues épaisses.
2. Les variables aléatoires qui sont dans le domaine d'attraction de la loi deWeibull vérient sup (x/F (x) < 1) < ∞ et 1 − F
(xF − 1
x
)= x−αL (x)
pour une fonction slowly varying L. Ces lois ayant un support borné, ellesrencontrent peu d'applications nancières. Des exemples de telles lois sontla loi uniforme, les lois puissances à support ni, la loi Beta.
24
3. Le domaine d'attraction de la loi de Gumbel est plus dicilement car-actérisable que celui de la loi de Fréchet et de la loi de Weibull. Onretiendra qu'il contient des lois à queues très light (par exemple les loisà décroissance asymptotique exponentielle) mais aussi des lois à queuesmodérément épaisses comme la loi lognormale, la loi exponentielle, la loinormale.....
Loi des extrêmes généralisée
Les lois de Fréchet, de Weibull et de Gumbel peuvent être regroupées sousune paramétrisation unique communément appelée GEV (generalized extremevalue) et défnie par :
H (x;µ, β, ξ) = exp
(−(
1 + ξx− µβ
)−1/ξ)
Cette fonction est dénie pour 1+ξ x−µΨ > 0 et vaut 0 ou 1ailleurs. Le paramètreµ est un paramètre de localisation, le paramètre β est un paramètre d'échelleet le paramètre ξ est un paramètre qui détermine la nature de la queue dedistribution. Si on normalise par µ = 0, et β = 1, alors :
Pour ξ > 0, on obtient la distribution de Fréchet de paramètre α = 1/ξ.
Pour ξ < 0, on obtient la distribution de Weibull de paramètre α = −1/ξ.
Pour ξ = 0, on obtient par passage à la limite la distribution de Gumbel.
Il est à noter que l'espérance existe si ξ < 1 et la variance si ξ < 1/2. Plusgénéralement, le moment d'ordre k existe si ξ < 1/k.
Ces résultat peuvent être utilisés directement soit en un historique de maximasur une période donnée soit en utilisant des estimateurs de type Hill ou Picklandmais ils ne renseignent en rien sur la probabilité d'occurence d'une variationsupérieure à un seuil. Pour obtenir de l'information sur cette probabilité, laméthode des peak over threshold (qui est intimement liée aux résultats ci-dessus)est préférable. Cette méthode est décrite dans la section ci-dessous :
25
Distribution de la GEV-epsilon=-0.3
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
-4 -3 -2 -1 0 1 2 3 4
Dis
trib
uti
on
gev(0.5)
Figure 3.2: La GEV pour epsilon=-0.3
Distribution de la GEV-epsilon=0.5
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
-20 0 20 40 60 80
dis
trib
uti
on
gev(0.5)
Figure 3.3: La GEV pour epsilon=0.5
26
Distribution de la GEV-epsilon=0
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
-20 0 20 40 60 80
dis
trib
uti
on
gev(0)
Figure 3.4: La GEV pour epsilon = 0
3.2.2 Mean Excess Value et Generalized Distribution ofPareto (GDP)
Le premier résultat intéressant concerne la probabilité d'occurence de l'évènementX > u pour u susamment grand. Le résultat est basé sur la convergence d'uneloi Binomiale vers un processus de Poisson :
Si on note Bn =∑ni=1 I[Xi∈An] le nombre de réalisations de la variable X qui
se trouvent dans l'ensemble An pour un échantillon de données [X1, ..., Xn]et si on note pn = p (X ∈ An) la probabilité d'appartenance de la variableX à l'ensemble An alors, le théorème de Poisson dit que si pn ∼ λ/n alorsBn → Poisson (λ). En prenant l'ensemble An de la forme ]un;+∞[ , ce théorèmemontre que si la suite un croît de telle façon que P (X > un) décroisse en λ/nalors le nombre de réalisations de l'échantillon [X1, ..., Xn] qui sont supérieuresau seuil u, avec u susamment grand suit un processus de Poisson d'intensitéλ.
Lien entre distribution asymptotique du max et répartition condi-tionnelle au delà d'un seuil
Le deuxième résultat intéressant concerne la loi de la variable aléatoire
Y u = X − u/X > u
qui mesure l'excès de la loi X au delà du seuil u. La fonction de répartition decette variable aléatoire est donnée par :
Fu (y) = P (Y u < y) = P (X − u < y/X > u) .
27
On peut montrer que la distribution F de la variable aléatoire X appartient audomaine d'attraction de la GEV Hξsisi
limxxF Sup0<x<xF−u∣∣Fu (x)−Gξ,β(u) (x)
∣∣ = 0· (3.6)
où Gξ,β désigne la distribution de Pareto généralisée (GDP) :
Gξ,β (y) = 1−(
1 + ξ yβ
)−1/ξ
si ξ 6= 0
1− e−yβ si ξ = 0
avec y ≥ 0 si ξ ≥ 0 et 0 ≤ y ≤ −β/ξ si ξ < 0. Il est à noter que seul le paramètreβ présente une dépendance en u, le paramètre de queue ξ étant indépendant duseuil u considéré. Ce paramètre β est un paramètre d'échelle:
Pour des seuils u susamment grands, on peut donc approximer la fonction derépartition des excès Y u au delà du seuil u par une GDP. Le paramètre β estun paramètre d'échelle et le paramètre ξ est un paramètre de forme des queuesde distribution :
Si ξ > 0 alors, le support de la distribution est [0;∞] et la queue de distributionvérie asymptotiquement 1−Gξ,β (y) ∼ cy−1/ξ (queues de Pareto)
Si ξ = 0, le support de la distribution est aussi [0;∞]mais cette fois, la queuede distribution est exponentielle (et tous les moments existent)
Si ξ < 0, le support de la distribution est [0;−β/ξ].
Remarque : Les paramètres ξ et β correspondent à ceux de la GEV.
Mise en pratique des résultats
La propriété
limxxF Sup0<x<xF−u∣∣Fu (x)−Gξ,β(u) (x)
∣∣ = 0.
suggère que la GDP est une approximation appropriée pour la distribution desexcès Yu au-dessus d'un seuil u.
La distribution de la variable aléatoire X/X > u est donnée par:
P (X > x/X > u) = P (X − u > x− u/X > u)
donc
P (X > x/X > u) = P (Y > x− u/X > u)
28
soit
P (X > x/X > u) = (1 +ξ
β(x− u))−
1ξ
alors la variable aléatoire X/X > u suit une GDPξ,u,βde paramètres ξ, u, β.
Dans ce qui suit, on calcule la Mean Excess function au dessus d'un seuil u1telque u1 > u pour cette variable aléatoire :
e(u1) = E(X − u1/X > u1)
soit
e(u1) =β − ξu1− ξ
+ξ
1− ξu1 (3.7)
La combinaison des résultats précédents suggère l'approche pratique suivantepour l'estimation des quantiles de la distribution de X :
1. supposer que l'équation 3.6 est valable
2. choisir u1 susamment grand tel que e(u1) soit linéaire à partir du seuilu1
3. choisir u < u1 susamment grand pour que l'approximation de Fupar uneGDP soit justiée.
4. estimer les paramètres de la Gξ,β en utilisant l'espérance d'une variablealéatoire suivant une GDP et la Méthode du Maximum de Vraisemblance(voir résultats ci-après)
5. estimer F (u) (par exemple par la fonction de répartition empirique)
6. une estimation des quantiles de F peut alors être obtenue en utilisant larelation
1− F (u+ y) = (1− F (u)) (1− Fu (y))
où x = u+ y et donc pour ξ > 0
1− F (u+ y) = (1− F (u))(
1 + ξy
β
)−1/ξ
soit le quantile d'ordre p associé à la variable aléatoire X est :
xp = u+β
ε((n
Nu(1− p)−ε − 1) (3.8)
29
et dans le cas où ξ = 0, on a
1− F (u+ y) = (1− F (u)× exp(− yβ
)soit le quantile d'ordre p associé à la variable X est :
xp = u− βln(n
Nu(1− p)) (3.9)
3.2.3 Méthode d'estimation
Estimation de la mean excess function
La mean excess function peut être estimée par son équivalent empirique :
en(u1) =1Nu
∑(Xi − u1), u1 > 0
où
Nu = cardi/Xi > u1
Estimation par régression
Détermination de ξ L'expression de la Mean Excess Function
e (u1) =β − ξu1− ξ
+ξ
1− ξu1
suggère naturellement d'estimer le paramètres ξ en calculant e (u1) pour dif-férentes valeurs de u et en régressant e (u) sur u.
Choix du seuil u Le choix du seuil u est soumis à deux impératifs:
• u doit être susamment grand pour que les résultats asymptotiques soientvalables
• il ne doit pas être trop grand pour que l'estimation de F (u) par la fonctionde répartition empirique soit valable
Ces ramarques suggèrent que l'on a sans doute intérêt à choisir le plus petitupossible pour lequel les résultats asymptotiques soient valables. Pour un telchoix, on choisit un seuil u se rapprochant du seuil u1 déjà déni dans la sectionprécédente.
30
Détermination de β Le choix de u permet d'obtenir une valeur initiale per-tinente pour le facteur β. En eet, Y = X − u/X > u suit une GDPξ,β d'où
E(Y ) = E(X − u/X > u) =β
1− ξ
soit une valeur initiale de β serait
β(u) = (1− ξ)× E(X − u/X > u)
Ainsi, à travers cette démarche, les valeurs initiales des paramètres de la loi desexcès GDPξ,β sont dénis et un algorithme de maximisation permet de retrouverles valeurs pertinentes de ces deux paramètres.
Le choix du paramètre β dépend du seuil u choisi donc pour diérents choix deu, nous avons diérents paramètres β soit diérents quantiles d'où la nécessitéde vérier l'inuence du choix du seuil u sur l'intervalle de variation du quantile.
Estimation des paramètres de la GDP
Calcul de la vraisemblance La densité de Yi étant donnée par
f(x) =1β
(1 + εx
β)−( 1
ε+1),
la fonction de vraisemblance de l'échantillon [Y1, ....., Yn] est donnée par :
U(θ, Y ) =∏
f(yi)
où θ = (ξ, β) soit
U(θ, Y ) =∏ 1
β(1 + ξ
yiβ
)−( 1ε+1)
La log vraisemblance est donc égale à
ln(U(θ, Y )) = ln(1β
)n −∑
(1 +1ξ
) ln(1 +ξ
βyi)
soit
ln(U(θ, Y )) = −n ln(β)− (1 +1ξ
)∑
ln(1 +ξ
βyi)
31
Matrice d'information de Fisher L'information de Fisher est une notionstatistiquee qui quantie l'information relative à un paramètre contenu dansune distribution. Elle mesure l'écart-type par rapport au paramètre estimé.
La matrice d'information de Fisher est donnée par :
I(θ) =(Eθ(
∂ln(f)∂θi
∂ln(f)∂θj
(θ, x)))i,j
ie
I(θ) =
(E((∂ln(f)
∂ξ )2) E(∂ln(f)∂ξ
∂ln(f)∂β )
E(∂ln(f)∂ξ
ln(f)∂β ) E((∂ln(f)
∂β2 )2)
)(3.10)
soit
I(θ) =(I1,1(θ) I1,2(θ)I2,1(θ) I2,2(θ)
)avec
• I1,1(θ) = ( 1ξ2 ln(1 + ξx
β )− (1 + 1ξ )
xβ
1+ ξxβ
)2
• I1,2(θ) = ( 1ξ2 ln(1 + ξx
β )− (1 + 1ξ )
xβ
1+ ξxβ
)(− 1β + (1 + 1
ξ )( ξxβ31
1+ ξxβ
))
• I2,1(θ) = ( 1ξ2 ln(1 + ξx
β )− (1 + 1ξ )
xβ
1+ ξxβ
)(− 1β + (1 + 1
ξ )( ξxβ31
1+ ξxβ
))
• I2,2(θ) = (− 1β + (1 + 1
ξ )( ξxβ31
1+ ξxβ
))2
3.3 Quelques résultats sur la distribution de Paretogénéralisée (GDP)
3.3.1 Analyse de la densité
Si F est une GDP de paramètres ξ et β alors sa densité de probabilité estdonnée par :
f(x) =1β
(1 + ξx
β)−
1ξ−1
32
Densité GDP
0.0
0.2
0.4
0.6
0.8
1.0
1.2
1.4
1.6
1.8
2.0
0% 50% 100% 150% 200% 250% 300%
x
Den
sité
Densité
Figure 3.5: Densité de la GDP
3.3.2 Moments de la GDP
Le moment d'ordre k de la GDP n'est déni que pour ξ < 1k . Les moments
d'ordre 1 et 2 sont alors donnés par
E(X) =β
1− ξ
V (X) =β2
(1− ξ)(1− 2ξ)
Pour ξ faible, l'écart type et la moyenne de distribution sont proches de β.
Dans ce qui suit, on étudie l'inuence des diérents paramètres sur la forme dela densité de la GDP .
Inuence de ξ
Dans le graphique ci-dessous, on a tracé la forme de la densité de la GDP enfonction du paramètre ξ. β étant pris égal à 1.
33
Influence de epsilon
0.5
0.6
0.6
0.7
0.7
0.8
0.8
0.9
0.9
1.0
1.0
0% 5% 10% 15% 20% 25% 30% 35% 40%
x
Den
sité
de
GD
P
epsilon(0) epsilon(0.1) epsilon(0.2) epsilon(0.3) epsilon(0.6)
epsilon(0.7) epsilon(1)
Figure 3.6: Inuence du paramètre de queue
On remarque alors que plus ξ augmente, plus la queue de distribution est épaisse.ξ est alors un paramètre de queue.
Inuence de β
Dans le graphique ci-dessous, on trace l'évolution de la densité de GDP enfonction du paramètre β pour ξ xé égal à 0.4.
Influence de beta
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
0.5
0% 5% 10% 15% 20% 25% 30% 35% 40%
x
Rép
artit
ion
GD
P
beta(0.5) beta(1) beta(1.5) beta(2) beta(2.5) beta(3)
beta(3.5) beta(4) beta(4.5) beta(5)
Figure 3.7: Inuence de β
34
3.4 Application
Dans ce qui suit, on applique la méthode explicitée ci-dessus pour la détermi-nation des quantiles de diérents indices boursiers.
3.4.1 Données Empiriques
Dans cette partie, on présente les diérents indices boursiers sur lesquels on atravaillé.
S&P500 Index
Le S&P 500(SPX) est un indice boursier basé sur 500 grandes sociétés cotéessur les bourses américaines. L'indice est posséde et géré par Standard & Poor's,l'une des trois principales sociétés de notation nancière. Cet indice a été créeen 1920. C'est l'indice le plus représentatif du marché boursier américain parcequ'il est composé d'un plus grand nombre de compagnies et que sa valeur tientcompte de la capitalisation boursière des compagnies composant l'indice.
DJ Eurostoxx
Le Dow Jones EuroStoxx est un indice élargi comportant plusieurs valeurschoisies parmi 11 pays. Les valeurs sont choisies dans un premier temps vialeur capitalisation boursière. La seconde sélection porte sur une répartition sec-torielle des diérentes valeurs. Le DJ Euro Stoxx 50 est une sélection de 50valeurs parmi celles composant le DJ Euro Stoxx. Cette sélection s'opère enfonction du pays et du secteur d'activité des sociétés. Sa composition, reserréeautour de 50 valeurs le rend plus volatile que le DJ EuroStoxx.
Nikkei
Le Nikkei 225 est le principal indice boursier de la bourse de Tokyo. Il estcomposé de 225 sociétés. Il se calcule par une moyenne arithmétique des valeursqui le composent, sans pondération par la capitalisation boursière.
Hang Seng Index
L'indice HSI est le principal indice boursier de la bourse de Hong Kong. Ilest composé de 39 sociétés représentant 65% de la capitalisation du Hong Kongstock exchange. Il se calcule en appliquant une pondération par la capitalisationboursière de chaque société.
35
Nifty Index
L'indice Nifty ou S&P CNX Nifty est l'un des principaux indices boursiersde la bourse de Bombay. Il comporte 50 valeurs réparties sur 22 secteurs del'économie.
Bovespa Index
Le Brésil compte 7 places boursières qui eectuent des opérations locales. Labourse de Sao paulo regroupe les échanges d'actions de ces Bourses régionales.Elle concentre les deux tiers de toutes les opérations boursières du pays. L'indiceBovespa comporte 60 valeurs.
RTS Index
Le RTS Index est un indice boursier basé sur 50 entreprises russes côtée au RTSStock Exchange à Moscou. La liste de ces noms est revue tous les trois mois.
HSCEI Index
Le Hang Seng China Entreprises Index est un indice uniquement composéde valeurs appelées H-shares(actions d'entreprises chinoises immatriculées enChine et nommées par le gouvernement chinois en vue de leur cotation sur labourse de Hong Kong).
HFRXGL Index
HFRX Global Hedge Fund Index est un indice de fonds alternatifs reétantla performance globale du monde des Hedge funds. L'indice permet d'investirà travers les huit stratégies les plus performantes présentes sur les des Hedgefunds.
RJCRB (CRY Index)
Reuters/Jeeries CRB index est la mesure la plus reconnue pour le marché desmatières premières.
3.4.2 Résultats
Quantiles
La valeur du quantile 99% dépend du seuil u choisi. Pour chaque actif, nousavons tracé l'évolution du quantile en fonction de ce seuil u.
36
Evolution des quantiles
1.95%
2.00%
2.05%
2.10%
2.15%
2.20%
2.25%
0.012 0.013 0.014 0.015 0.016 0.017 0.018 0.019 0.02
u
0
200
400
600
800
1000
1200
Quantile
Nombre
Figure 3.8: Evolution du quantile en fonction du choix du seuil u
S&P Index:
37
Evolution des quantiles
2.40%
2.45%
2.50%
2.55%
2.60%
2.65%
2.70%
2.75%
2.80%
2.85%
0.4% 0.6% 0.8% 1.0% 1.2% 1.4% 1.6%
u
qu
anti
le
0
200
400
600
800
1000
1200
1400
Quantile
Nombre
Figure 3.9: Evolution du quantile en fonction du choix du seuil u
DJ Euro Stoxx
38
Evolution des quantiles
2.2%
2.3%
2.4%
2.5%
2.6%
2.7%
2.8%
2.9%
3.0%
3.1%
3.2%
0.4% 0.6% 0.8% 1.0% 1.2% 1.4% 1.6%
u
qu
anti
le
0
200
400
600
800
1000
1200
1400
Quantile
Nombre
Figure 3.10: Evolution du quantile en fonction du seuil u
DJ Euro stoxx 50
39
Evolution des quantiles
3.00%
3.05%
3.10%
3.15%
3.20%
3.25%
2.00% 2.10% 2.20% 2.30% 2.40% 2.50% 2.60% 2.70% 2.80% 2.90% 3.00%
u
0
50
100
150
200
250
300
350
400
450
Quantile
Nombre
Figure 3.11: Evolution du quantile en fonction du seuil u
Nikkei
40
Evolution des quantiles
4.6%
4.7%
4.8%
4.9%
5.0%
5.1%
5.2%
5.3%
2.0% 2.5% 3.0% 3.5% 4.0% 4.5% 5.0%
u
0
100
200
300
400
500
600
700
800
900
Série2
Série1
Figure 3.12: Evolution du quantile en fonction du seuil u
HSI
41
Evolution des quantiles
3.0%
3.2%
3.4%
3.6%
3.8%
4.0%
4.2%
4.4%
1.2% 1.4% 1.6% 1.8% 2.0% 2.2% 2.4% 2.6%
u
Qu
anti
le
0
100
200
300
400
500
600
700
Quantile
Nombre
Figure 3.13: Evolution du quantile en fonction du seuil u
Nifty
42
Evolution des quantiles
7.1%
7.2%
7.3%
7.4%
7.5%
7.6%
7.7%
7.8%
7.9%
8.0%
3.0% 3.5% 4.0% 4.5% 5.0%
u
Qu
anti
le
0
50
100
150
200
250
300
350
400
Quantile
N
Figure 3.14: Evolution du quantile en fonction du seuil u
Bovespa
43
Evolution des quantiles
5.60%
5.70%
5.80%
5.90%
6.00%
6.10%
6.20%
6.30%
6.40%
6.50%
6.60%
6.70%
3.0% 3.5% 4.0% 4.5% 5.0%
u
qu
anti
le
0
50
100
150
200
250
300
350
Quantile
Nombre
Figure 3.15: Evolution du quantile en fonction de u
RTS Index
44
Evolution des quantiles
4.60%
4.70%
4.80%
4.90%
5.00%
5.10%
5.20%
5.30%
5.40%
5.50%
2.5% 3.0% 3.5% 4.0% 4.5% 5.0%
u
Qu
anti
le
0
50
100
150
200
250
300
350
Quantile
Nombre
Figure 3.16: Evolution du quantile en fonction du seuil u
HSCEI
45
Evolution des quantiles
1.69%
1.69%
1.69%
1.69%
1.69%
1.70%
1.70%
1.70%
1.70%
1.70%
1.71%
0.60% 0.65% 0.70% 0.75% 0.80% 0.85% 0.90% 0.95% 1.00%
u
Qu
anti
le
0
200
400
600
800
1000
1200
1400
1600
Quantile
Nombre
Figure 3.17: Evolution du quantile en fonction du seuil u
RJCRB
Conclusion Nous remarquons alors que les quantiles varient faiblement pourdiérents seuils u. Nous avons choisi de garder les valeurs de queue et de quantile99% suivants :
46
Indice seuil u ξ Quantile
S&P 1.25% 0.29 2.13%DJ Euro stoxx 0.51% 0.12 2.8%
DJ Euro stoxx 50 0.5% 0.15 3.07%Nikkei 2.04% 0.16 3.14%
Hang Seng Index 2% 0.3 5.02%Nifty Index 1.58% 0.14 3.8%
Bovespa Index 3.01% 0.26 7.92%RTS Index 3% 0.25 6.38%HSCEI 2.7% 0.16 4.92%
HFRXGL - - -
RJCRB 0.64% ' 0 1.69%
Table 3.1: Résultats Empiriques
Comparaison des queues de distribution théoriques et empiriques
An de vérier la pertinence de l'approche adoptée, nous comparons les queuesde distribution du modèle théorique et de la distribution empirique pour lesdiérentes classes d'actifs (l'approche utilisée est un graphe log-log) :
47
Comparaison des queues de distribution
-10
-9
-8
-7
-6
-5
-4
-3
-2-10 -9 -8 -7 -6 -5 -4 -3 -2
Distribution Empirique
Dis
trib
utio
n th
éoriq
ue
log_théo
Figure 3.18: S&P
S&P
48
Comparaison des queues de distribution
-9.5
-8.5
-7.5
-6.5
-5.5
-4.5
-3.5
-2.5
-1.5-8.5 -7.5 -6.5 -5.5 -4.5 -3.5 -2.5 -1.5
Distribution empirique
Dis
trib
utio
n th
éoriq
ue
log_théo
N_excès
Figure 3.19: DJ EuroStoxx
DJ EuroStoxx
49
Comparaison des queues de distribution
-9
-8
-7
-6
-5
-4
-3
-2
-1-9 -8 -7 -6 -5 -4 -3 -2 -1
Distribution empirique
Dis
trib
utio
n th
éoriq
ue
log_théo
N_excès
Figure 3.20: DJ EuroStoxx50
DJ EuroStoxx50
50
Comparaison des queues de distribution
-10
-9
-8
-7
-6
-5
-4
-3-10 -9 -8 -7 -6 -5 -4 -3
Distribution empirique
Dis
trib
utio
n th
éoriq
ue
log_théo
Figure 3.21: Nikkei
Nikkei
51
Comparaison des queues de distribution
-9.5
-8.5
-7.5
-6.5
-5.5
-4.5
-3.5
-2.5
-1.5-9.5 -8.5 -7.5 -6.5 -5.5 -4.5 -3.5 -2.5 -1.5
Distribution empirique
Dis
trib
utio
n th
éoriq
ue
log_théo
N_excès
Figure 3.22: HSI
HSI
52
Comparaison des queues de distribution
-11
-10
-9
-8
-7
-6
-5
-4
-3
-2
-1-9 -8 -7 -6 -5 -4 -3 -2 -1
Distribution empirique
Dis
trib
utio
n th
éoriq
ue
log_théo
N_excès
Figure 3.23: Nifty
Nifty Index
53
Comparaison des queues de distribution
-6
-5.5
-5
-4.5
-4
-3.5
-3
-2.5
-2-6.5 -6 -5.5 -5 -4.5 -4 -3.5 -3 -2.5 -2
Distrivution empirique
Dis
trib
utio
n th
éoriq
ue
log_théo
N
Figure 3.24: Bovespa
Bovespa Index
54
Comparaison des queues de distribution
-10
-9
-8
-7
-6
-5
-4
-3
-2-9 -8 -7 -6 -5 -4 -3 -2
Distribution empirique
Dis
trib
utio
n th
éoriq
ue
log_théo
N_excès
Figure 3.25: HSCEI
HSCEI
55
Comparaison des queues de distribution
-9
-8
-7
-6
-5
-4
-3
-2-9 -8 -7 -6 -5 -4 -3 -2
Distribution empirique
dis
trib
utio
n th
éoriq
ue
log_théo
N_excès
Figure 3.26: RTSI
RTSI
56
Evolution des queues de distrbution
-11
-10
-9
-8
-7
-6
-5
-4
-3
-2-10 -9 -8 -7 -6 -5 -4 -3 -2
Distribution empirique
Dis
trib
utio
n th
éoriq
ue
log_théo
N_excès
Figure 3.27: RJCRB
RJCRB
Conclusion Ces graphes conrment alors que la distribition théorique coin-cide avec celle empirique.
Niveaux et Temps de retour
Soit à déterminer le niveau de retour à N années. On alors ce niveau est donnépar:
P (X ≤ xp) = 1− 1365×N
d'où
57
xp = u+β
ξ((n
Nu
1365×N
)−ξ − 1)
Les graphes suivants donnent l'évolution des niveaux de retour pour les diérentsindices et diérents temps de retour :
Evolution des niveaux de retour
0%
5%
10%
15%
20%
25%
30%
35%
40%
45%
5 15 25 35 45 55 65 75
temps de retour/année
Niv
eau
de re
tour
S&P
Euro stoxx
Euro stoxx 50
Nikkei
HSI
Nifty
Bovespa
HSCEI
RTS
RJCRB
Figure 3.28: Niveau de retour
Scénarios de stress journalier
Pour les actifs précédents, on détermine les scénarios de stress journalier pourdes temps de retour de 50 ans.
58
Indices Indice de queue Scénarios de stress journalier
S&P 0.29 9.65%DJ Euro stoxx 0.12 9.03%
DJ Euro stoxx 50 0.15 11%Nikkei 0.16 9.83%
Hang Seng Index 0.3 35.62%Nifty Index 0.14 11.18%
Bovespa Index 0.26 41.28%RTS Index 0.25 27.37%HSCEI 0.16 14.52%
HFRXGL - -RJCRB ' 0 3.94%
Table 3.2: Scénarios de stress journalier
Loi asymptotique des records
Nous avons montré, ci-dessus, que si (X1, X2, .....Xn) une série de va iid dedistribution commune F . On a alors ∀a, b :
N(a, b] =∞∑i=1
δXLi (a, b]
représente le point process associé au nombre des records et ce processus est unprocessus de Poisson PRM(µ) où µ est donné par µ(a, b] = R(b) − R(a) avecR(x) = − ln(F (x)).
Ainsi, en prenant a, b tel que b > a > u, F (x) = P (X ≥ u) × P (X − u ≥x− u/X > u) où P (X − u ≥ x− u/X > u) est donnée par la GDP associée.
Les graphes suivants illustrent les lois des records pour les classes d'actifs étudiées:
59
Loi du nombre de records
0%
5%
10%
15%
20%
25%
30%
35%
40%
1 2 3 4 5 6 7 8 9 10
Nbre records
[2%,3%]
[3%,4%]
[4%,5%]
[5%,6%]
[6%,7%]
Table 3.3: S&P : Nombre de records
S&P
60
Loi du Nombre de records
0%
5%
10%
15%
20%
25%
30%
35%
40%
1 2 3 4 5 6 7 8 9
Nbre de records
[1%,2%]
[2%,3%]
[3%,4%]
[4%,5%]
[5%,6%]
[6%,7%]
Figure 3.29: DJ : Nombre de records
DJ euro stoxx
DJ euro Stoxx 50
61
Loi du nombre de records
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
1 2 3 4 5 6 7 8
Nbre de records
[1%,2%]
[2%,3%]
[3%,4%]
[4%,5%]
[5%,6%]
[6%,7%]
Figure 3.30: DJ50 : nombre de records
62
Loi du nombre de records
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
1 2 3 4 5 6 7 8 9
Nbre de records
[4%,5%]
[5%,6%]
[6%,7%]
Figure 3.31: Nikkei : nombre de records
Nikkei
63
Loi du nombre de records
-5%
0%
5%
10%
15%
20%
25%
30%
35%
40%
1 2 3 4 5 6 7 8 9
Nbre de records
[2%,3%]
[3%,4%]
[4%,5%]
[5%,6%]
[6%,7%]
Figure 3.32: HSI : records
HSI
64
Loi du nombre de records
0%
5%
10%
15%
20%
25%
30%
35%
40%
1 2 3 4 5 6 7 8 9
Nbre de records
[2%,3%]
[3%,4%]
[4%,5%]
[5%,6%]
[6%,7%]
Table 3.4: Nifty : records
Nifty
65
Loi du nombre de records
0%
5%
10%
15%
20%
25%
30%
35%
40%
1 2 3 4 5 6 7 8 9
Nbre de records
[4%,5%]
[5%,6%]
[6%,7%]
Table 3.5: Bovespa : Nombre de records
Bovespa
66
Loi du nombre de records
-5%
0%
5%
10%
15%
20%
25%
30%
35%
40%
1 2 3 4 5 6 7 8 9
Nbre de records
[2%,3%]
[3%,4%]
[4%,5%]
[5%,6%]
[6%,7%]
Table 3.6: HSCEI : Nombre de records
HSCEI
67
Loi du nombre de records
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
1 2 3 4 5 6 7 8
Nombre de records
[4%,5%]
[5%,6%]
[6%,7%]
Figure 3.33: RTS : Nombre de records
RTSI
68
Loi du nombre de records
0
0.05
0.1
0.15
0.2
0.25
0.3
1 2 3 4 5 6 7 8 9 10
Nombre de records
[1%,2%]
[2%,3%]
[3%,4%]
[4%,5%]
[5%,6%]
[6%,7%]
Figure 3.34: RJCRB : Nombre de records
RJCRB
69
Chapter 4
Indice des Extrêmes
Dans les sections précédentes, nous avons admis que les rendements des act-ifs sont iid or en réalité et en considérant les marchés nanciers, nous nousapercevons que lors de l'apparition d'une crise, cette dernière se propage dans letemps. Par exemple, lors d'un Krash boursier, nous pouvons remarquer qu'unepremière baisse de valeurs s'accompagne d'une seconde baisse marquée parl'aversion aux risques des investisseurs d'où l'apparition d'un cluster d'événementsextrêmes. On introduit donc l'indice des extrêmes qui est un indicateur permet-tant de caractériser la relation de dépendance des données et la loi asymptotiquede leurs maximas.
An de bien interpréter et estimer cette quantité, on rappelle dans un premiertemps quelques résultats mathématiques sur les séries dépendantes.
4.1 Préliminaires
L'un des point processes les plus représentatifs de la théorie des valeurs extrêmesest le point process of exceedances donné par :
Nn(.) =+∞∑i=1
δ in
(.) I[Xi>u]
où (Xn) est une suite de variables aléatoires et u un nombre réel.
Considérons par exemple l'espace d'état [0, 1], on a alors:
Nn([0, 1]) = card[i ≤ n/Xi > u]
soit Nn([0, 1]) compte le nombre de dépassements du seuil u par les variablesaléatoires Xi, i = 1.......n.
70
Le lien entre ce point process et la théorie des valeurs extrêmes est établi commesuit : soit Xk,n la statistique d'ordre k de l'échantillon X1, ....., Xn alors:
N(0, 1] = 0 = card[i ≤ n/Xi > u] = 0
soitN(0, 1] = 0 = aucun Xi ne depasse u
ieN(0, 1] = 0) = max(X1, ....Xn) ≤ u
où dans un cadre plus général:
N(0, 1] < k) = card[i ≤ n/Xi > u] < k
soit
N(0, 1] < k = moins de k realisations depassent u
ieN(0, 1] < k = Xk,n ≤ u
L'apport inétressant de l'utlisation de ces processus est qu'elle dénit la loiasymptotique du nombre de crises sur un intervalle de temps donné qui estintuitivement lié à la structure de dépendance donc à l'indice des extrêmescomme on le montrera dans les paragraphes suivants.
Néanmoins, plusieurs lois limites sont observées selon que les va sont iid, faible-ment dépendantes ou dépendantes.
Cas où les variables sont iid
Soient (Xi)1≤i≤n des variables aléatoires iid de fonction de répartition F et soit(un) une suite de seuils réels vériant l'approximation de Poisson ie
∀τ ∈ [0,∞], P (Mn ≤ un)→ e−τ ⇔ nF (un) = E(n∑i=
IXi>un)→ τ
alors le point process of exceedance Nn d−→N où N est un processus de Poisson
homogène sur l'espace d'état E = [0, 1] donné par:
P (N([0, 1]) = k) = e−τ(τ)k
k!(4.1)
71
Cas où les variables sont iid et les indices sont aléatoires
Soient (Xi) et (Di) deux suites indépendantes de variables aléatoires iid etTi = D1 + D2 + ..... + Di tel que E(D1) = 1
λ > 0 et N ′(t) = maxi : /T ≤ tle processus de renouvellement associé. Soit
Nn(.) =N ′(n)∑i=1
δTin
(.)IXi>n
le point process of exceedances alors Nn d−→ N où N est un processus de Poisson
homogène sur l'espace d'états E = (0, 1] donné par:
P (N([0, 1]) = k) = e−τλ(τλ)k
k!
Cas des séries dépendantes
On considère une suite (Xi)i≥1 stationnaire de loi marginale F . Par rapport aucadre iid, la dépendance peut aecter simplement la magnitude des extrêmes(queue des distributions) tout comme leur comportement global (loi). Si ladépendance n'est pas trop forte (en un sens précisé dans l'hypothèse suivante),le comportement du maximum de X1, X2, ......., Xn sera le même que celui dede nθ va iid de même marginale F que les Xi. On aura donc, à un changementd'échelle près, la loi de Mn = max(X1, X2, ....., Xn) est la même que dans le casiid. La notion de dépendance se dénit comme suit :
Hypothèse D(un) : ∀p, q, n : 1 ≤ i1 < i2 < i3.....ip < j1 < .... < jq ≤ n telque j1 − ip ≥ l on a:
| P ( maxi∈A1∪A2
Xi ≤ un)− P (maxi∈A1
Xi ≤ un)P (maxi∈A2
Xi ≤ un) |≤ αn,l
où A1 = i1, ....., ip), A2 = j1, ......jq) et αn,ln→∞−−−−→0 pour une suite l = ln =o(n).
Intuitivement, D(un) signie que les maxi:mas sur deux intervalles disjoints sontasymptotiquement indépendants.
Hypothèse D′(un) : Cette hypothèse énonce la relation suivante :
limk→∞
limn→∞
supn[n/k]∑j=2
P (X1 > un, Xj > un) = 0
Cette condition est une condition d 'anti-clustering puisqu'asymptotiquementdépasser le seuil un par la paire de variables (Xi, Xj) devient peu probable.
72
Conclusion Sous les conditions D(un) et D′(un), la limite de la distributiondes maximas pour une série dépendante existe et est une distribution des valeursextrêmes soit elle est dans le domaine d'attraction de la GEV .
Convergence des points process of exceedance
Cas où le processus est stationnaire faiblement dépendant Soit (Xn)un processus stationnaire et (un) une suite de valeurs seuils vériant les condi-tions D(un), D′(un) alors sous ces conditions Nn d−→N où N est un processus
de Poisson homogène sur E = (0, 1] d'intensité τ .
Cas où le processus est stationnaire dépendant Les travaux de Hsing,Hüsler et Leadbetter ont montré que sous certaines conditions de dépendanceplus fortes que D(un), les point processes of exceedances convergent faiblementvers des processus de Poisson composés.
Nn(.) n→∞−−−−−→N(.)
où
N =+∞∑i=1
ξiδXi (4.2)
avec (Xi) les atomes d'un processus de Poisson homogèneN sur [0,∞) d'intensitéλ et ξi une suite de variables aléatoires entières iid indépendantes de N . Cesvariables donnent la taille des durées de crise : quand la ime crise survient, ξiexcès sont observés. Les probabilités πk = P (ξ1 = k), k ≥ 0 sont les probabilités
des clusters de N .
4.2 Indice des extrêmes
4.2.1 Dénition
L'indice des extrêmes θ comme précisé auparavant est une mesure du degréde dépendance locale des extrêmes d'un processus stationnaire. En eet, ceparamètre tient compte des diérentes dépendances qui apparaîssent sur lesmarchés nanciers:
• dépendance cyclique : dépendance de diérentes contreparties des facteursmacroéconomiques générant des clusters de rendements.
• contagion : la corrélation entre les réactions des investisseurs et des dif-férentes institutions nancières face à une situation de crise sur les marchés.
73
L'indice des extrêmes est déni comme suit :
Soit (Xn) un processus stationnaire et θ un nombre positif. On admet que∀τ > 0 il ∃(un) telle que:
limn→∞
nF (un) = τ
limn→∞
P (Mn ≤ un) = e−θτ
alors θ est l'indice des extrêmes du processus stationnaire (Xn).
Les questions qui se posent sont alors : quelle est l'inuence de l'indice desextrêmes sur la fonction de répartition des maximas? Comment interpréterquantitativement cet indice?
La réponse à ces questions fera l'objet de la section suivante.
4.2.2 Interprétation et estimation de l'indice des extrêmes
Interprétation
Nous avons montré (voir section sur les point process) que sous certaines con-ditions (conditions un peu plus fortes que celles de D(un)) les point processesof exceedances
Nn =n∑i=1
δ inIXi>un
convergent faiblement vers un processus de Poisson Composé
N(.) =∞∑i=1
ξiδγi(.)
Le processus de Poisson sous-jacent au processus N(.) est d'intensité θτ et lesvariables iid ξi donnant les tailles de cluster de N(.) ont la distribution πj surIN avec πj dénie telle que:
πj = limn→∞
πj(n)
soit
πj = limn→∞
P (r∑i=1
IXi>un = j/
r∑i=1
IXi>un > 0)
avec r la taille du bloc de maximas dénie par la méthode des maximas commeexposée ci-dessous.
74
On a alors E(N(0, 1]) = E(∞∑i=1
ξiδγi(0, 1]) = θτE(ξ1)
Ainsi τ = limn→∞
nF (un) = limn→∞
E(∞∑i=1
IXi>un) = limn→∞
E(Nn(0, 1]) or comme
on a Nn converge en loi vers N alors E(Nn)→ E(N) d'où
τ = E(N(0, 1]) = τθE(ξ1)
Soitθ = E(ξ1)−1
donc θ peut être interprété comme la réciproque de la durée moyenne de la crise.
Estimation
Méthode des blocs La méthode des blocs de maximas est un outil essen-tiel à l'estimation de l'indice des extrêmes. En eet cette méthode découle del'estimation empirique de P (Mn ≤ un) pour des processus stationnaires.
La condition D(un) donne
P (Mn ≤ un) ≈ P k(M[nk ] ≤ un)
pour k constante ou faiblement croissante k = k(n). L'approximation précé-dente forme la base de la méthode des blocs:
• Soit n = rk pour r = r(n)→∞ et k = k(n)→∞
• L'échantillon d'observations est divisé en k blocs de taille r
X1, X2, ....Xr, X(k−1)r+1, .......Xkr
• Pour chaque bloc, on détermine le maximum
M (i)r = max(X(i−1)r+1, ...., Xir), i = 1, 2, ......, k
• Ainsi P (Mn ≤ un) = P ( max1≤i≤k
M (i)r ≤ un) ≈ P k(Mr ≤ un) = (
1k
k∑i=1
IM(i)r ≤un
)k
75
Estimation de l'indice des extrêmes L'interprétation de θ suggère alorsune méthode d'estimation de θ:
θ = E(ξ1)−1
d'où
θ =
k∑i=1
IM(i)r >un
n∑i=1
IXi>un
=K
N
où K est le nombre de clusters en excès et N le nombre total d'excès au-dessusdu seuil donné.
Fonction de répartition des maximas
Dans ce qui suit, nous nous intéressons à l'étude de la distribution asymptotiquedes maximas pour des variables stationnaires.
Soit (Xi, i = 1, 2.....) un processus stationnaire de variables aléatoires de distri-bution marginale H et soit (Xi∗, i = 1, 2.....) une suite de variables aléatoiresiid de même fonction de répartition H.
On note Mn = max(X1, X2, .......Xn) et Mn∗ = max(X1∗, ......, Xn∗)
Leadbetter a montré que les relations :
limn→+∞
nF (un) = τ
limn→+∞
P (Mn ≤ un) = e−θτ
sont équivalentes à :
limn→+∞
P (Mn∗ ≤ un) = e−τ
donc pour cn > 0 et dn ∈ IR deux constantes normatives appropriées et enposant:
∀x ∈ IR, un = un(x) = cnx+ dn
on obtient:
limn→∞
P (Mn ≤ un) = limn→∞
P (c−1n (Mn−dn) ≤ x) = lim
n→∞P (c−1
n (Mn∗−dn) ≤ x)θ
76
soit en posant G la fonction de répartition de max(X1, X2, ...., Xn) et F lafonction de répartition de max(X1∗, X2∗, .....) on obtient :
limn→∞
G(un) = limn→∞
F θ(un)
La théorie classique des valeurs extrêmes énonce que le max de variables aléa-toires iid est asymptotiquement dans le domaine d'attraction de la GEV donnéepar:
FGEV (x) = exp(−1 + ξx− µσ−
1ξ )
Comme l'égalité précédente le suggère
max(X1, X2, ....., Xn)→ F θGEV (x) (4.3)
où F θGEV = GEV (µθ, σθ, ξ) où µθ = µ− σ 1−θξξ et σθ = σθξ
Temps de retour des séries dépendantes
Si (Xt)t≥0 est un processus stationnaire d'indice extrêmal θ alors le temps deretour de la valeur seuil x est donnée par :
T (x) =1
1−Gmax(x)1nθ
où Gmax(x) = P (max(X1, X2, ....., Xn) ≤ x) la fonction de répartition des max-imas. Or, d'après ce qui précède :
Gmax(x) = Fmax(x)θ
où Fmax est la fonction de répartition de max(X∗1 , X∗2 , ....., X
∗n) avec (X∗1 , X
∗2 , ......, X
∗n)
suite de va iid de distribution commune H- H étant aussi la loi jointe du pro-cessus stationnaire. Le temps de retour s'écrit alors :
T (x) =1
1−H(x)
Ainsi, pour obtenir un niveau de retour pour un temps de retour donné, on a be-soin d'un échantillon de va iid de même distribution marginale que l'échantillond'origine. Une façon d'obtenir ceci est de permuter aléatoirement les observa-tions initailes (random resampling selon les travaux d'ancona Navarrete et Tawn- 2000).
La détermination du niveau de retour est alors semblable à celle utilisée dans lecadre iid (cf plus haut).
77
4.3 Mise en application
Estimation de l'indice extrêmal On procède à l'estimation statistique del'indice des extrêmes. On applique la méthode du bloc des maximas en prenant50 comme taille des blocs pour les diérents classes d'actifs.Les calculs sontmenés sur des quantiles variant entre 99% et 99.5%.
Evolution de l'indice des extrêmes
0.4
0.5
0.6
0.7
0.8
0.9
99.0% 99.1% 99.2% 99.3% 99.4% 99.5%
p
Inde
x
S&P
DJ Eurostoxx
DJ Eurostoxx50
Nikkei
HSI
Nifty
Bovespa
RTS Index
HSCEI
RJCRB
Figure 4.1: Evolution de l'indice des extrêmes
Les indices des extrêmes sont alors pris comme suit :
78
Indices Indice des extrêmes Durée moyenne de crise
S&P 0.65 1.54DJ Euro stoxx 0.725 1.38
DJ Euro stoxx 50 0.63 1.59Nikkei 0.77 1.35
Hang Seng Index 0.66 1.51Nifty Index 0.58 1.72
Bovespa Index 0.8 1.11RTS Index 0.62 1.61HSCEI 0.65 1.54
HFRXGL - -RJCRB 0.75 1.33
Table 4.1: Estimation de l'indice des extrêmes
Temps de retour
Pour un temps de retour de 50 ans, nous déterminons les stress journaliers dansle cas de dépendance et le comparons au cas iid.
Indice Paramètre de queue Stress (iid) Stress (dépendantes)
S&P 0.29 9.65% 10.6%DJ Euro stoxx 0.12 9.03% 11.3%
DJ Euro stoxx 50 0.15 11% 16.15%Nikkei 0.16 9.83% 6.5%
Hang Seng Index 0.3 35.62% 31.4%Nifty Index 0.14 11.18% 20.9%
Bovespa Index 0.26 41.28% 17.44%RTS Index 0.25 27.37% 18.63%HSCEI 0.16 14.52% 24.2%
HFRXGL - - 1.3%RJCRB ' 0 3.94% 3.74%
Table 4.2: Comparaison des scénarios de stress entre variables iid et station-naires
Conclusion Nous remarquons que l'inuence de l'indice extrêmal est impor-tante puisque les niveaux de stress peuvent varier de manière assez importanteentre les séries iid et stationnaires. Ceci pourrait avoir des eets assez néfastessur la gestion des risques. Imaginons, par exemple, le cas de la gestion CPPI :nous savons que le coussin reste positif pour un levier m < 1
d où d est le niveaude stress appliqué sur l'actif risqué. Supposons que d est associé au stress de
79
variables aléatoires iid et supposons le cas d'un Krash boursier où le drawdownobservé sur l'actif risqué dépasse ce stress d, le coussin devient négatif et lagestion CPPI craque.
80
Chapter 5
ANNEXE
Dans cette partie, nous apportons quelques éléments de preuve aux assertionset aux théorèmes des sections précédentes.
5.0.1 Gestion CPPI
L'objectif de cette partie est de regrouper quelques formules utiles à la bonnecompréhension de la gestion CPPI dite gestion type coussin.
Hypothèse du modèle:
On emploie les notations suivantes :
• St, la valeur du sous-jacent à la date t
• Vt, la valeur du fonds à la date t
• Bt = e−r(T−t), valeur à la date t du zéro-coupon de même maturité T quele fonds
• Ct = Vt −Bt le coussin du fonds
• αt = mCtVt
, l'expression du fonds de type coussin avec multiplicateur m
En se plaçant en temps continu et dans un cadre Black & Scholes, les accroisse-ments instantanés du sous-jacent sont guidés par l'équation suivante :
dSt = St(µdt+ σdWt)
où Wt désigne un mouvement Brownien standard.
81
Evolution du fonds
La méthode du coussin consiste à mainteneir à chaque date la stratégie d'investuissementsuivante :
• ARt = mCt est investi en actif risqué
• ASRt = Vt −mCt est investi en actif sans risque
Instantanément, la valeur du fonds évolue donc de la façon suivante :
dVt = mCtdStSt
+ (Vt −mCt)dBtBt
Le coussin évolue quant à lui comme :
dCt = dVt − dBt
Après réajustement, il apparaît que :
dCt = Ct(mdStSt
+ (1−m)rdt)
caddCt = Ct[(m(µ− r) + r)dt+mσdWt]
Cette équation permet donc de caractériser le fonds CPPI comme suit :
Ct = C0exp((m(µ− r) + r − m2σ2
2)t+mσWt)
Vt = Ct +Bt
La modélisation en continu semble indiquer que quelque soit le multiplicateur(le levier choisi), le coussin reste positif. Cela provient de la continuité destrajectoires du mouvement brownien. Plaçons-nous à une date arbitraire etsupposons qu'instantanément la valeur du sous-jecent puisse biasser de stress%et qu'on ait un choc au niveau des taux d'intrérêt (augmentation de h%). Aprèschoc, la valeur du fonds s'exprime comme :
Vstress = mCt(1− d) + (Vt −mCt)(1 + h)
alors que le plancher vaut Bstress = Bt(1 + h). Le nouveau coussin vaut donc :
Cstress = Ct(1 + h−m(d+ h))
82
Le fonds reste donc au dessus de sa valeur plancher si et seulement si Cstress > 0.Ceci implique que m doit vérier la condition suivante :
m <1 + h
d+ h
soit en l'absence de tout scénario de stress sur les taux, on a :
m <1d
5.0.2 Méthode des excès de Gumbel (3.1)
Rappel sur la statistique d'ordre
Soit X1, X2, ......Xn une suite de variables aléatoires iid de fonction de réparti-tion F . On dénit l'écahntillon des ordres sur cet échantillon de données par:
Xn,n ≤ ....... ≤ X1,n
La variable Xk,nest notée la statistique d'ordre k de l'échantillon de données.
Fonction de répartition de la kème statistique d'ordre
Pour k = 1, 2, .....n, soit Fk,n la fonction de répartition de Xk,n alors on a:
Si F (la fonction de répartition de l'échantillon) est continue alors:
Fk,n =∫ x
−∞fk,n(z)dF (z)
où
fk,n(x) =n!
(k − 1)!(n− k)!Fn−k(x)(1− F (x))k−1
où fk,nest la densité de Fk,n.
Démonstration de la formule de Gumbel
On considère l'échantillon de données de taille r[Xn+1, ...., Xn+r] et on noteSnr (k) =
∑ri=1 I[Xn+i>Xk,n] le nombre d'observations de l'échantillon [Xn+1, ...., Xn+r]
qui excèdent la statistique d'ordre Xk,n. On cherche à déterminer P (S = j).
Par application de la probabilité conditionnelle, ona :
83
P (S = j) =∫ ∞
0
P (S = j/Xk,n = u)dFk,n(u)
soit
P (S = j) =∫ ∞
0
P (r∑i=1
I[Xn+i>Xk,n] = j/Xk,n = u)dFk,n(u)
cad
P (S = j) =∫ ∞
0
P (r∑i=1
I[Xn+i>u] = j)dFk,n(u)
on note
Br =r∑i=1
I[Xn+i>u]
Br est la somme de r variables aléatoires iid suivant une loi de Bernouilli deparamètre:
E(I[X>x]) = P (X > x) = 1− F (x)
donc Br est une variable aléatoire suivant une loi de Bernouilli de paramètres(r, 1− F (x))
d'où
P (S = j) =∫ ∞
0
Cjr (1−F (u))jF (u)r−jn!
(k − 1)!(n− k)!Fn−k(u)(1−F (u))k−1dF (u)
soit
P (S = j) =∫ ∞
0
Cjrn!
(k − 1)!(n− k)!(1− F (u))j+k−1F (u)r+k−j−1dF (u)
soit
P (S = j) =∫ 1
0
Cjrn!(k − 1)!(n− k)!
(1− t)j+k−1tr+k−j−1dt
d'où le résultat obtenu par intégration par parties itérative.
84
5.0.3 Etude du nombre de records (3.2)
On suppose qu'on ait Xi variables aléatoires iid de fonction de répartition F .On note Mn = max [X1, ...., Xn] . Une donnée Xn est un record si Xn > Mn−1.
On dént le processus de comptage des records par le processus suivant :
N1 = 1
Nn = 1 +n∑k=2
IXk>Mk−1
On a alors
E(Nn) = 1 + E(n∑k=2
IXk>Mk−1) , n ≥ 2
soit
E(Nn) = 1 +n∑k=2
P (Xk > Mk−1)
d'où
E(Nn) = 1 +n∑k=2
∫ +∞
−∞P (Xk > u)dP (Mk−1 ≤ u)
or P (Mk−1 ≤ u) = F (u)k−1 donc
E(Nn) = 1 +n∑k=2
∫ +∞
−∞(k − 1)(1− F (u))F (u)k−2dF (u)
soit en eectuant un changement de variables et en posant F (u) = t, on obtient:
E(Nn) = 1 +n∑k=2
∫ 1
0
(k − 1)(1− t)tk−2dt
d'où le résultat obtenu par intégration par parties.
85
Distribution jointe de la fonction de répartition des maximasLoi dunombre de records (3.3)
Le processus (Mn)n≥1 dénit un processus stochastique discret. On consid-ère la distribution jointe de ce processus et on applique un raisonnement parrécureence :
Soit (x1, x2) deux nombres réels et (n1, n2) deux entiers, on a alors :
P (Mn1 ≤ x1,Mn2 ≤ x2) = P (Mn1 ≤ x1,∨n2
n1 + 1Xi ≤ x2)
soitP (Mn1 ≤ x1,Mn2 ≤ x2) = P (Mn1 ≤ x1)P (Mn2−n1 ≤ x2)
doncP (Mn1 ≤ x1,Mn2 ≤ x2) = Fn1(x1)Fn2−n1(x2)
et si x1 > x2 on a :
P (Mn1 ≤ x1,Mn2 ≤ x2) = F t2(x2)
d'oùP (Mn1 ≤ x1,Mn2 ≤ x2) = Fn2(x2)
soit par récurrence on obtient :
P (Mn1 ≤ x1,Mn2 ≤ x2, .........,Mnm ≤ xm) = Fn1(∧m1 xi)× Fn2−n1(∧m2 xi).........Fnm−nm−1(xm)
5.0.4 Temps et niveau de retour (3.5)
Pour des variables aléatoires Xi iid, on dénit le temps τu de dépassement duseuil u par :
τu = min(i/Xi > u)
Sous l'hypothèse iid, on peut obtenir explicitement la loi du temps τu. En eet,on a:
P (τu = k) = F k−1X (u)(1− FX(u))
le temps de retour du seuil u est alors donné par E(τu).
On a :
86
E(τu) =+∞∑k=1
kP (τu = k)
soit
E(τu) =+∞∑k=1
k F k−1X (u)(1− FX(u))
d'où en posant t = FX(u), on obtient:
E(τu) =+∞∑k=1
k tk−1(1− t)
d'où
E(τu) =+∞∑k=1
k tk−1 −+∞∑k=1
(k + 1) tk ++∞∑k=1
tk
soit par application des calculs sur les séries entières de rayons de convergence1 et sur leur dérivée, on obtient:
E(τu) =1
1− FX(u)
On note k = E(E(τu)) la partie entière de E(τu), on a alors
P (τu ≤ E(τu)) = P (τu ≤ E(E(τu))) = 1− F kX(u)
puisque pour τu ≤ k ⇔ card(i/Xi > u) ≤ k.
soit
limu−>+∞
P (τu ≤ E(τu)) = limFX(u)−>0
1− FX(u)E( 1
FX (u))
soiten notant FX(u) = 1− p
1− (1− p)E( 1p ) = 1− eE( 1
p ) ln(1−p)
On a par encadrement,
87
1p− 1 ≤ E(
1p
) ≤ 1p
+ 1
d'où
1− pp
ln(1− p) ≤ E(1p
) ln(1− p) ≤ 1 + p
pln(1− p)
soit commpe pour p− > 0
ln(1− p) = −p− p2
2+ o(p2)
on obtient par développement limité au sein de l'exponentielle et par passage àla limite au niveau de l'encadrement:
eE( 1p )ln(1−p) ∼ e−1
d'où le résultat.
5.0.5 Sensibilité des moments de la distribution de ParetoGénéralisée au paramètre d'échelle
On dénit la sensibilité de l'espérance et de l'écart-type au facteur β par leursdérivées successives qui sont données par:
∂E
∂β=
11− ξ
∂σ
∂β=
1(1− ξ)(1− 2ξ)
On a alors:
sensibilit =∂E∂β
∂σ∂β
= (1− 2ξ)
d'où sensibilit < 1pour ξ < 1/2 (valeur pour laquelle les deux premiers momentsexistent). Ainsi, l'écart-type est plus sensible à la variation de β d'où β peutêtre interprété comme un paramètre de dispersion.
88
5.0.6 Simulation d'une GDP
Pour la simulation d'une GDP, on utilise la propriété suivante:
Soit f la densité d'une loi de probabilité, que l'on suppose continue et strictementpositive sur un intervalle I =]a, b[, et soit F la fonction de répartition de cetteloi. Alors, si cette loi est la loi d'une variable aléatoire X, la variable U = F (X)suit une loi uniforme sur ]0, 1[.
F est continue croissante sur I, sa restriction à I est donc inversible, on note cettefonction réciproque F−1, elle même strictement croissante sur ]0, 1[ à valeursdans I. Soit u un réel et FU la fonction de répartition de la loi de U . Pardénition; FU (u) = P (U ≤ u).
FU vérie :
• si u ≤ 0, FU (u) = P (F (X) ≤ u) = 0, car F est positive et P (F (X) =0) = P (X ≤ a) = 0
• si 0 < u < 1, FU (u) = P (F (X) ≤ u) = P (X ≤ F−1(u)) = F (F−1(u))
• si 1 ≤ u, FU (u) = 1 car les valeurs prises par U étant des probabilités,U ≤ 1 est l'événement certain.
FU est dons la fonction de répartition de la loi uniforme sur ]0, 1[.
On en déduit que si U est uniforme sur ]0, 1[, alors la variable X à valeursdans I, dénie par X = F−1(U), suit la loi dont la fonction de répartition estF . Cette proporiété permet, si F−1 est calculable, de produire par simulationdes échantillons de valeurs d'une variable aléatoire continue de loi quelconque àdensité non nulle sur un intervalle I.
Dans le cas de la GDP, on a pour ξ > 0, ce qui est le cas pour les sériesnancières,
Gε,β(y) = 1− (1 + ξy
β)−
1ξ
On obtient alors par inversion
G−1ε,β(u) =
β
ξ((1− u)−ξ − 1)
d'où par application de la propriété et pour u une variable aléatoire suivant uneloi uniforme X = G−1
ξ,β(u) suit une loi GDP.
89
5.0.7 Mean Excess function pour X/X > u (3.7)
Dans ce qui suit, on calcule la Mean Excess function au dessus d'un seuil u1 telque u1 > u pour cette variable aléatoire :
e(u1) = E(X − u1/X > u1)
soit
e(u1) =1
1−Gξ,u,β(u1)
∫ +∞
u1
(x− u1)dGξ,u,β(x)
d'où
e(u1) =1
1−Gξ,u,β(u1)
∫ +∞
u1
1β
(x− u1)(1 +ξ
β(x− u))−
1ξ−1
En eectuant une intégration par parties, on retrouve:
e(u1) =β
1− ξ+
ξ
1− ξ(u1 − u)
soit
e(u1) =β − ξu1− ξ
+ξ
1− ξu1
5.0.8 Revue de la méthode d'optmisation du GradientConjugué
La méthode utilisée an d'optimiser ce problème est la méthode du gradientavec comme seules contraintes les bornes appliquées aux deux paramètres. Leproblème d'optimisation est alors le suivant:
Problème: minxdsIR − f(x)
Contraintes: ε > 0 : valeur pour laquelle la méthode de vraisemblance donnedes valeurs pertinentes pour les série de données
β > 0 : valeur d'échelle qui doit être toujours positive
90
Description: Il s'agit d'une méthode itérative qui permet de déterminer lesparamètres minimisant une fonction donnée.
• On part d'un état x0 = [ε0, β0]et k = 0.
• On pose d = ∇(f(xk)) qui donne la direction de descente.
• On détermine le pas de descente α et on obtient dk = xk + αd
• On projette le point obtenu dans la boîte formée des bornes: xk+1 = p(dk).
• La minimisation s'arrête lorsque ‖xk+1 − xk‖ = 0
5.0.9 Détermination des éléments de la matrice de Fisher(3.10)
• I1,1 = E((∂ln(f)∂ξ )2)
On a ∂(ln(f))∂ξ = 1
ξ2 ln(1 + ξ xβ )− (1 + 1ξ )(
ξβ
1+ ξxβ
)
• I1,2 = ∂ln(f)∂ξ
∂ln(f)∂β
On a ∂(ln(f))∂β = − 1
β + (1 + 1ξ )
ξx
β2
1+ξ xβ
d'où ∂(ln(f))∂ξ = 1
ξ2 ln(1 + ξ xβ )− (1 + 1ξ )(
ξβ
1+ ξxβ
)
• I2,1 = I1,2
• I2,2 = E((∂(ln(f))∂β )2)
On a ∂(ln(f))∂β = − 1
β + (1 + 1ξ )
ξx
β2
1+ξ xβ
5.0.10 Quantiles (3.9, 3.9)
La fonction de répartition des excès est donnée par :
Fu(y) = P (X − u ≤ y/X > u) = P (Y ≤ y/X > u)
On a alors1− Fu(y) = P (X − u > y/X > u)
91
1− Fu(y) =P ((X − u > y) ∩X > u)
P (X > u)
d'où
(1− Fu(y))(1− F (u)) = 1− F (u+ y)
Si ξ > 0, alors le support de la distribution de la GDP est [0,+∞] et on a alors:
1− F (y) =1n
∑IXi>u) =
Nun
où n représente la taille de l'échantillon et Nu le nombre de données dépassantle seuil u.
1− Fu(y) = 1−Gξ,β(y) = (1 + ξy
β)−1/ξ
donc une estimation de 1− F (u+ y) est donnée par :
1− F (u+ y) =Nun
(1 + ξy
β)−1/ξ
d'où en notant F (u+ y) = p,
1− p =Nun
(1 + ξy
β)−1/ξ
d'où
y =β
ξ((n
Nu(1− p)−ξ − 1)
or y = xp − u où xp est le quantile recherché donc on obtient :
xp = u+β
ξ((n
Nu(1− p)−ξ − 1)
Si ξ = 0, alors en gardant les notations précédentes, on a :
1− Fu(y) = exp(− yβ
)
d'où
92
1− p =Nunexp(− y
β)
d'où
y = −βln(n
Nu(1− p))
comme y = xp − u alors on obtient:
xp = u− βln(n
Nu(1− p))
5.0.11 Indice des extrêmes
Convergence faible des point processes of exceedances : cas où les vasont iid (4.1)
condition 1 On applique le théorème de Kallenberg: soit A = (a, b] ⊂ [0, 1]alors on a :
Nn(A) =+∞∑i=1
δ in
(A) IXi>un
soit
Nn(A) =[nb]∑
i=[na]+1
IXi>un
On a alors Nn(A) est binomiale de paramètres ([nb] − [na], F (un)) d'où et parapplication de l'approximation de Poisson
E(Nn(A)) = ([nb]− [na])F (un) ∼ n(b− a)τ
n= τ(b− a)
or ona pour N un processus de Poisson homogène d'intensité τ , E(N(A)) =τ(b− a)
d'où la condition 1 de convergence est vériée
condition 2 Soit B =k⋃i=1
(ci, di] on a alors :
P (Nn(B) = 0) = P (Nn((ci, di]) = 0, i = 1, ........, k)
93
soitP (Nn(B) = 0) = P ( max
[nci]+1<j≤[ndi]Xj ≤ un, i = 1, ......., k)
d'où
P (Nn(B) = 0) =k∏i=1
P ( max[nci]+1<j≤[ndi]
Xj ≤ un)
ie
P (Nn(B) = 0) =k∏i=1
P (Nn((ci, di]) = 0)
or on a pour (Xj)j≥1 iid P ( max[nci]+1<j≤[ndi]
Xj ≤ un) = F (un)([ndi]−[nci]) = (1 −
F (un))([ndi]−[nci]
or comme on a nF (un)→ τ , (1− F (un))([ndi]−[nci]) = e([ndi]−[nci])ln(1−F (un) =e([ndi]−[nci])ln(1− τn+o( 1
n ) = en(di−ci)(− τn+o( 1n )) = e−τ(di−ci)
d'où le résultat nal :
P (Nn(B) = 0)→k∏i=1
e−τ(di−ci)
et on a par dénition d'un processus de Poisson homogène d'intensité τ :
P (N(B) = 0) = e
−τ
k∑i=1
(di − ci)
Ainsi, la condition 2 est vériée et la convergence est ainsi démontrée.
Quelques résultats intéressants donnés par l'hypothèse D(un)
Hypothèse D(un) : ∀p, q, n : 1 ≤ i1 < i2 < i3.....ip < j1 < .... < jq ≤ n telque j1 − ip ≥ l on a:
| P ( maxi∈A1∪A2
Xi ≤ un)− P (maxi∈A1
Xi ≤ un)P (maxi∈A2
Xi ≤ un) |≤ αn,l
où A1 = i1, ....., ip), A2 = j1, ......jq) et αn,ln→∞−−−−→0 pour une suite l = ln =o(n).
A partir de cette hypothèse, on peut déduire les résultats suivants :
94
• Pour k constant ou progressivement croissant (k(n)),
P (Mn ≤ un) = P k(Mnk≤ un) + o(1)
où Mn = max(X1, X2, ......, Xn) avec (Xi)i≤n une suite stationnaire.
• On suppose que c−1n (Mn−dn) d−→G avec cn > 0 et dn ∈ IR deux constantes
appropriées. Si la condition D(cnx+dn) est vériée pour tout réel x alorsG est une distribution des valeurs extrêmes.
Preuve Nous savons que G est une distribution des valeurs extrêmes si etseulement si G est max stable. Or ona G est max_stable si la relation
max(X1, X2, ...., Xn) =d cnX + dn
pour X,X1, X2, ....., Xn des va iid de distribution G et cn, > 0 et dn ∈ IR desconstantes appropriées.
Le premier résultat ci-dessus donne :
P (Mnk ≤ cnx+ dn) = P k(Mn ≤ cnx+ dn) + o(1)→ Gk(x)
or on aP (Mnk ≤ cnkx+ dnk)→ G(x)
D'après le théorème de Convergence des types il existe des constantes ck > 0 et
dk ∈ IR tel que:
limn→∞
cnkcn
= ck et limn→∞
dnk − dncn
= dk
alors pour des va iid X1, X2, ......Xk de fonction de répartition G on a:
max(X1, ...., Xk) =d ckY1 + dk
Ainsi, sous la condition D(cnx+ dn) la limite de la distribution des max si elleexiste est une distribution des valeurs extrêmes (ie max stable) : reste doncà préciser les conditions susantes pour lesquelles cette limite existe soit pourlequelles P (Mn ≤ un) existe pour une suite undonnée satisfaisant : nF (un)→ τoù F est la marginale de la suite stationnaire (Xi).
On sait déjà que par le théorème d'approximation de Poisson nF (un) → τ ⇔P (Mn ≤ un) → e−τoù Mn = max(X1, X2, ......, Xn) avec (Xi)i≤ndes va iid dedistribution F mais ceci n'est pas vérié pour Mn. La condition qui suit permetde dénir une condition susante pour l'existence de cette limite est la conditionsuivante.
95
Hypothèse D′(un) : Cette hypothèse énonce la relation suivante:
limk→∞
limn→∞
supn[n/k]∑j=2
P (X1 > un, Xj > un) = 0
Conclusion Si le processus stationnaire (Xn) et la suite des seuils un satisfontles conditions D(un) et D′(un) et pour τ ∈ [0,∞) on a :
nF (un)→ τ ⇔ limn→∞
P (Mn ≤ un) = e−τ
Convergence des point processes of exceedances : cas où les va sontfaiblement dépendantes (4.2)
condition 1 La condition 1 de convergence est vériée par application duthéorème de Kallenger. (cf ci-dessus)
condition 2 Pour la vérication de cette condition, on se restreint à deuxintervalles (c1, d1] et (c2, d2]. On a :
P (Nn(B) = 0) = P (Nn((c1, d1] = 0, Nn((c2, d2] = 0)
ieP (Nn(B) = 0) = P ( max
c1≤ in≤d1
Xi ≤ un, maxc2≤ i
n≤d2Xi ≤ un)
soit par application de la condition D(un)
P (Nn(B) = 0) = P ( maxc1≤ i
n≤d1Xi ≤ un)P ( max
c2≤ in≤d2
Xi ≤ un) + o(1)
soit pour un choix de d1 et c2 tel que n(c2 − d1) > ln = o(n) , par stationnaritédu processus et par application du théorème sur la limite, on a :
P (Nn(B) = 0)→ e−τ((d1−c1)+(d2−c2)) = P (N(B) = 0)
où N est un processus de Poisson homogène d'intensité τ. Ainsi, la condition 2est vériée.
96
Fonction de répartition des maximas (??)
On a
F θGEV (x) = e−θ(1+ξ x−µσ )− 1ξ
soit
F θGEV (x) = e−(θ−ξ+ξθ−ξ x−µσ )− 1ξ
d'où et après quelques modications :
F θGEV (x) = e−(1+ξ(x−µ)+σ(1−θξ)
σθξ)− 1ξ
d'où
F θGEV (x) = e−(1+ξx−µ+σ 1−θξ
ξ
σθξ)− 1ξ
soit
F θGEV (x) = e−(1+ξ
x−µθσθ
)− 1ξ
où µθ = µ− σ 1−θξξ et σθ = σθξ.
97
Bibliographie
[1] Paul Embrechts, Claudia Klüppelberg, Thomas Mikosch : Modelling Extre-mal Events for Insurance and Finance (Springer 2000)
[2] Jérôme Legras : Designing stress scenarios for illiquid market (Research andInnovation Notes-N2000-03)
[3] Extreme Value Statisctics in Meterology and the Environment :
[4] Alexander J.McNeil : Estimating the tails of loss severity distributions usingextreme value theory (Department Mathematik ETH Zentrum, Zürich De-cember 9,1996)
[5] Jean Noël Bacro : Modélisations stochastiques et valeurs extrêmes (LaHouille Blanche/N5-2006)
[6] Kay Giesecke, Lisa R. Goldberg : Forecasting Extreme nancial risk (Cornelluniversity, MSCI Barra Inc, November 2004)
[7] Chavez-Demoulin, Davison, A.J.McNeil : Estimating Value-at-Risk for -nancial time series : an approach combining self-exciting processes and ex-treme value theory (Zürich 2002)
[8] Cyrus A.Ramezani, Yong Zeng : Maximum Likelihood Estimation of Asym-metric Jump-Diusion Processes : Application to Security Prices (CaliforniaPolytechnic, University of Missouri, December 1998)
[9] Henri Klajnmic : Estimation et comparaison de niveaux de retour pour lesvitesses extrêmes des vents (Revue MODULAD, 2005, Numéro 32)
98