Mémoire présenté le : Pour l’obtention du Diplôme Universitaire d’actuariat de l’ISFA et l’admission à l’Institut des Actuaires Par : Titre : Isabelle VIDAL Prédiction de l’acte de résiliation et tarification de la garantie RC des j eunes conducteurs Confidentialité : NON OUI (Durée : 1 an 2 ans) Les signataires s’engagent à respecter la confidentialité indiquée ci-dessus. Membre présents du jury de l’Institut des Actuaires Entreprise : AXA France. Nom : Thomas GAUTHRON Signature : Membres présents du jury de l’ISFA Directeur de mémoire en entreprise. Nom : Gérald LUCAS Signature : Invités. Nom : Signature : Autorisation de publication et de mise en ligne sur un site de diffusion de documents actuariels (après expiration de l’éventuel délai de confidentialité) Signature du responsable entreprise Secrétariat : Signature du candidat Bibliothèque :
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Mémoire présenté le :
Pour l’obtention du Diplôme Universitaire d’actuariat de l’ISFA et l’admission à
l’Institut des Actuaires
Par :
Titre :
Isabelle VIDAL
Prédiction de l’acte de résiliation et tarification de la garantie RC des jeunes
conducteurs
Confidentialité : NON OUI (Durée : 1 an 2 ans)
Les signataires s’engagent à respecter la confidentialité indiquée ci-dessus.
Membre présents du jury de l’Institut
des Actuaires
Entreprise : AXA France.
Nom : Thomas GAUTHRON
Signature :
Membres présents du jury de l’ISFA Directeur de mémoire en entreprise.
Nom : Gérald LUCAS
Signature :
Invités.
Nom :
Signature :
Autorisation de publication et de mise en ligne sur un site de diffusion de documents actuariels
(après expiration de l’éventuel délai de confidentialité)
2.3 Nécessité d’une nouvelle tarification auto sur les « jeunes » ........................................................ 17
PREMIERE PARTIE ................................................................................................................................... 18
PREDICTION DE L’ACTE DE RESILIATION DES SANS ANTECEDENT D’ASSURANCE ....................... 18
1 Mise en place d’indicateurs du taux de résiliation ............................................................................... 19
2 Constitution de la base de données .................................................................................................... 22
3 Sélection des variables associées à l’acte de résiliation ..................................................................... 25
3.1 Tris à plat, statistiques descriptives .............................................................................................. 25
3.2 Analyse des correspondances multiples ....................................................................................... 28
3.2.1 Principe de l’ACM .................................................................................................................. 28
3.2.2 Sélection et description des axes .......................................................................................... 28
3.2.3 Projection sur le plan formé par les deux premiers axes ........................................................ 30
4 Modélisation par la régression logistique ............................................................................................ 32
4.1 Choix du modèle logistique........................................................................................................... 32
4.2 Sélection des variables pertinentes .............................................................................................. 32
4.3 Validation du modèle et interprétation des coefficients ................................................................. 36
4.3.1 Validation du modèle ............................................................................................................. 36
4.3.2 Analyse des coefficients associés à chaque variable ............................................................ 37
5 Modélisation par arbre de décision ..................................................................................................... 39
5.1 Les points forts de l’arbre de décision .......................................................................................... 39
Isabelle VIDAL – Etudes sur les jeunes conducteurs
Direction de marché IARD – Auto des particuliers 9
5.2 Création du premier arbre ............................................................................................................ 39
5.3 Sélection de l’arbre optimal ......................................................................................................... 40
5.4 Ajout d’une variable discriminante : la banque du conducteur ...................................................... 42
DEUXIEME PARTIE ................................................................................................................................... 45
VARIABLES EXPLICATIVES ET MODELISATION DE LA GARANTIE RC ................................................ 45
1 Constitution de la base de données finale ........................................................................................... 46
1.1 Périmètre de l’étude ..................................................................................................................... 46
1.2 Description des bases de données ............................................................................................... 47
1.3 Modification de la charge RC ........................................................................................................ 48
1.3.1 Mutualisation des charges fixes en RC matérielle ................................................................. 48
1.3.2 Ecrêtement et mutualisation des sinistres graves en RC corporelle ....................................... 50
1.4 Typologie de la base de données finale........................................................................................ 52
1.4.1 Description des variables à expliquer .................................................................................... 52
1.4.2 Quelques chiffres concernant la base de données finale ....................................................... 52
2 Etude sur nos variables tarifaires ........................................................................................................ 53
2.1 Tris à plat ..................................................................................................................................... 53
2.1.1 Evolution des indicateurs selon les variables tarifaires .......................................................... 53
2.1.2 Etude des corrélations ........................................................................................................... 58
3 Présentation des modèles linéaires généralisés ................................................................................. 62
3.1 Les composantes du modèle ........................................................................................................ 62
3.2 Qualité d’ajustement du modèle ................................................................................................... 64
4 Equivalence entre les deux approches de modélisation ...................................................................... 65
5 Choix des paramètres du modèle ....................................................................................................... 70
5.1 Choix d’une loi de probabilité ........................................................................................................ 70
5.1.1 Distribution de la fréquence ................................................................................................... 70
5.1.2 Distribution du coût moyen .................................................................................................... 72
5.2 Choix des variables à expliquer .................................................................................................... 74
5.3 Choix des variables explicatives ................................................................................................... 74
5.3.1 Méthodes de sélection ........................................................................................................... 74
5.3.2 Explication de la fréquence ................................................................................................... 74
5.3.3 Explication du coût moyen ..................................................................................................... 77
6 Lissage et Estimation des coefficients tarifaires .................................................................................. 79
7 Validation des modèles ....................................................................................................................... 82
7.1 Significativité des coefficients ....................................................................................................... 82
7.2 Comparaison entre nos indicateurs observés et modélisés .......................................................... 83
7.3 Analyse des résidus d’un modèle linéaire généralisé.................................................................... 83
7.4 Validation sur une base de « test » ............................................................................................... 85
Isabelle VIDAL – Etudes sur les jeunes conducteurs
Direction de marché IARD – Auto des particuliers 10
8 Modélisation de la prime pure ............................................................................................................. 87
9 Recherche du modele le plus performant ............................................................................................ 92
TROISIEME PARTIE .................................................................................................................................. 94
IMPACT DES NOUVELLES VARIABLES TARIFAIRES ET MISE EN PLACE OPERATIONNELLE DU
Liste des figures ....................................................................................................................................... 105
Liste des tableaux ..................................................................................................................................... 107
Liste des annexes ..................................................................................................................................... 110
INTRODUCTION
PRESENTATION DU CONTEXTE
INTRODUCTION : Présentation du contexte
Isabelle VIDAL – Etudes sur les jeunes conducteurs
Direction de marché IARD – Auto des particuliers 12
1 PRESENTATION DE L’ENTREPRISE /
1.1 Le groupe AXA
Le groupe AXA est un des premiers groupes mondial d’assurance et de gestions d’actif. Présent
dans 56 pays, 160 000 collaborateurs d’AXA s’engagent aux côtés de 102 millions de clients. C’est la
première marque mondiale d’assurance selon le classement Interbrand pour la 6ème année consécutive.
Les activités d'AXA sont géographiquement diversifiées, avec une concentration sur les marchés d'Europe,
d'Amérique du Nord et de la région Asie-Pacifique.
Figure 1-1 . Répartition du groupe AXA par pays (en % du chiffre d'affaires 2012)
Le cœur de métier d’AXA est de proposer différentes solutions d’assurance à ses clients (particuliers,
professionnels, entreprises ou institutions).
Le groupe est spécialisé dans plusieurs domaines : assurance de biens, assurance de personnes (santé,
prévoyance, épargne et retraite), gestion d’actif, assistance, banque et protection juridique.
En 2013, AXA a réalisé un chiffre d’affaires de 91,2 milliards d’euros, soit une augmentation de 2% en un
an. Le résultat opérationnel pour l’année passée est de 4 728 millions d’euros.
30%
24% 11%
9%
8%
8%
4% 4% 2%
Répartition géographique des activités d'AXA (en % du chiffre d'affaires 2013)
Région Europe du Nord, centrale et del'Est
France
Etats-Unis
Région Méditerranée et Amérique Latine
Asie (hors Japon)
Japon
R.U. et Irlande
Assurance internationale
Direct Dommages
INTRODUCTION : Présentation du contexte
Isabelle VIDAL – Etudes sur les jeunes conducteurs
Direction de marché IARD – Auto des particuliers 13
1.2 Une filiale française : AXA France
AXA France est la filiale française du groupe AXA. 34 000 collaborateurs mettent tout en œuvre
pour satisfaire au mieux leurs 9 millions de clients.
L’ambition d’AXA France est de devenir la société préférée dans son secteur d’activité, et plus
particulièrement devenir la meilleure société de services. C’est pour cela qu’elle place le client au cœur de
ses actions.
AXA France se positionne en leader sur le marché. En effet, il est :
- 1er en assurance santé, prévoyance avec 15% de parts de marché
- 1er en assurances dommages avec 16% de parts de marché
- 3ème en assurance vie avec 8% de parts de marché
Au 31 décembre 2013, le chiffre d’affaires d’AXA France est de l’ordre de 21,6 milliards d’euros. La
répartition du chiffre d’affaires est la suivante :
Figure 1-2 . Répartition du chiffre d'affaires AXA France (en milliards d'euros)
1.3 La direction de marché IARD – Auto du particulier
La Direction de Marché IARD a pour rôle de définir et de mettre en œuvre les politiques techniques en
matière de produits d’assurances dommages, tant pour les nouveaux produits que pour la maintenance du
portefeuille.
Le service «Auto des Particuliers» conçoit des produits d’assurance automobile destinés uniquement aux
particuliers. Son rôle est essentiellement de créer et de tarifer les différents produits mais également
d’assurer leur suivi et de transmettre au reste du groupe les différents indicateurs de ce suivi (nombre
d’affaires nouvelles, nombre de résiliations, sinistralité d’un segment de population, calcul de chiffre
d’affaires, résultats techniques, etc.…). Les produits d’assurance automobile destinés aux particuliers
représentent 35% du chiffre d’affaires IARD d’AXA France. De ce fait, une étroite collaboration avec le
marketing, les bureaux d’études techniques et la direction financière est nécessaire afin de s’assurer qu’un
produit est adapté au marché et obtiendra une rentabilité suffisante. Il convient également d’être à l’écoute
des agents, notamment en ce qui concerne d’éventuelles demandes émanant des clients.
38%
30%
19%
13%
Répartition du chiffre d'affaires AXA France (en milliards d'euros)
Vie Individuelle
Vie Collectives
Dommages Particuliers etProfessionnels
Dommages Entreprises
INTRODUCTION : Présentation du contexte
Isabelle VIDAL – Etudes sur les jeunes conducteurs
Direction de marché IARD – Auto des particuliers 14
2 ANALYSE DU SUJET /
2.1 Panorama de la gamme automobile AXA
Chez AXA, plusieurs offres commerciales automobiles sont proposées au client :
- Solution référence : formule générique où sont applicables les règles de souscription standard ;
- Bonus 50 > à 6 ans : le conducteur doit être bonus 50 depuis plus de 6 ans ;
- Auto/moto : formule proposée aux détenteurs de véhicule auto et moto ;
- Automobis : offre à destination des couples (mariés ou concubins) âgés de 25 à 60 ans possédant
2 véhicules et sans enfant en âge de conduire ;
- Enseignants : formule destinée aux enseignants de l’enseignement public et de l’enseignement
privé ;
- Forfait 8000 km : formule disponible sous certaines conditions pour les « petits rouleurs » qui font
moins de 8000 kilomètres par an;
- Monospace : offre proposée aux détenteurs de monospace, soucieux de transporter leur famille et
leurs biens en toute tranquillité ;
- Assurance auto pour les pros : offre dédiée aux artisans, commerçants et professions libérales, en
dehors de toute activité de transport rémunéré de voyageurs ou de marchandises ;
- Kit 1ère assurance auto : offre proposée aux sans antécédent d’assurance.
Une synthèse des différentes offres est présentée ci-dessous :
Figure 2-1 . Panorama de la gamme auto
INTRODUCTION : Présentation du contexte
Isabelle VIDAL – Etudes sur les jeunes conducteurs
Direction de marché IARD – Auto des particuliers 15
21000
22000
23000
24000
25000
2004 2005 2006 2007 2008 2009
No
mb
re d
e r
ési
liati
on
Evol du nb de résiliations sur les SA
Nombre de résiliation
27% 22% 21%
27%
43%
55%
0%
20%
40%
60%
1ère année 2ème année 3ème année
Tau
x d
e r
ési
liati
on
Tx de résil. sur les Sans Antécédent
Taux de résiliation Taux de résiliation cumulé
2.2 Le kit 1ère assurance auto
2.2.1 Constats et objectifs
Constats
L’offre jeunes a été mise en place suite à des constatations concernant les affaires nouvelles et les
résiliations des sans antécédent.
Figure 2-2 . Evolution du nombre et de la part d'affaires nouvelles sur les Sans Antécédent
Sur les huit années précédant l’offre jeunes (c’est-à-dire de 2004 à 2011), nous observons une chute du
nombre d’affaires nouvelles des sans antécédent (perte de 25000 affaires nouvelles).
De même, concernant les résiliations, le graphique suivant présente l’évolution du nombre de résiliations et
les taux de résiliations vus à 1, 2 et 3 ans.
Figure 2-3 . Evolution du nombre de résiliation sur les Sans Antécédent // Taux de résiliation sur les Sans Antécédent
Le graphique de gauche montre que le nombre de résiliations baisse de 2000 en moins de 6 ans
sur les sans antécédent. Néanmoins, les taux de résiliations restent importants (27% la première année
comparé à 18% sur le reste du portefeuille). Le motif de résiliation prépondérant sur cette population est le
non-paiement. En effet, le taux de résiliation pour le non-paiement est de 9.5% la première année
Evolution du nombre et de la part d'affaires nouvelles sur les Sans Antécédent
nb SA part(*) 2014 - 12 mois glissants à fin septembre.
INTRODUCTION : Présentation du contexte
Isabelle VIDAL – Etudes sur les jeunes conducteurs
Direction de marché IARD – Auto des particuliers 16
Objectifs
C’est après toutes ces constatations qu’une nouvelle offre destinée aux jeunes conducteurs a été
mise en production en février 2012 pour principalement :
- Favoriser la vente de contrats « jeunes conducteurs » ;
- Lutter contre les résiliations des jeunes conducteurs ;
- Sensibiliser les jeunes au risque routier.
2.2.2 L’offre « jeunes »
L’offre « Jeunes Conducteurs » ou kit 1ère assurance auto est destinée aux sans antécédent
d’assurance et permet des avantages tarifaires à la souscription grâce à des clauses. Les sans antécédent
d’assurance sont soit les conducteurs avec moins de 12 mois consécutifs d’assurance dans les 24 derniers
mois soit les conducteurs avec 1 an d’antécédent d’assurance et ayant un ou plusieurs accidents
responsables au cours de cette année.
Réduction
« Enfant d’assuré » Clause TA1
Cible : Enfant d’assuré AXA en Auto
Objectif : Fidéliser les parents et les enfants clients AXA
-20% *
Réduction
« Bonus Parental » Clause TA2
Cible : Enfant d’assuré AXA en Auto de moins de 25 ans dont au moins un des parents a un Bonus/Malus** de 50% et sans sinistre dans les 36 derniers mois (tolérance 1 bris de glace), quelle que soit l’ancienneté du contrat.
Objectif : Fidéliser les parents « bons conducteurs » et conquérir leurs enfants
Jusqu’à
-25% *
Réduction
« Conduite accompagnée »
Clauses TDE, THF,
THG
Cible : 18 – 25 ans sans antécédent d’assurance ayant effectué la conduite accompagnée, la conduite supervisée ou la conduite encadrée
Objectif : Reconnaître et récompenser l’expérience de conduite acquise
Jusqu’à
-15% *
* Sur les garanties « Responsabilité civile » et « Dommages tous accidents ».
** Chaque année sans sinistre engageant la responsabilité de l’assuré entraîne une réduction de 5 % de ce
coefficient. Pour calculer le nouveau coefficient, il suffit de multiplier celui de l’année précédente par 0,95.
Le minimum est fixé à 0,50, ce qui correspond à un bonus de 50 %. Le maximum est de 3,50 car le
coefficient augmente de 25% par sinistre responsable.
Ces réductions sont cumulables dans la limite du tarif avec antécédents d’assurance et proposent un tarif
jusqu’à 40% moins cher que celui d’un sans antécédent sans avantage.
Les deux principaux objectifs de cette offre sont de redynamiser la vente de contrats et fidéliser les jeunes.
INTRODUCTION : Présentation du contexte
Isabelle VIDAL – Etudes sur les jeunes conducteurs
Direction de marché IARD – Auto des particuliers 17
Pour les fidéliser et récompenser leur bonne conduite, AXA propose dans son offre un avantage
exclusif avec le bonus accéléré : 10% de réduction minimum sont appliqués automatiquement, sur la prime
TTC des 1ère et 2ème échéances principales pour les assurés ne déclarant aucun sinistre au cours de
chacune des 2 premières années d’assurance (tolérance 1 bris de glace).
Le kit contient un stage « bonne conduite » qui lui permet des réductions sur sa prime ainsi que
l’assistance « Joker ». Si l’assuré n’est pas en état de conduire, elle lui permet de prêter son véhicule sans
franchise prêt de volant ou de se faire ramener en taxi sous certaines conditions.
2.3 Nécessité d’une nouvelle tarification auto sur les « jeunes »
La population des jeunes conducteurs est une cible très prisée par les assureurs automobile.
L’objectif d’AXA France est d’augmenter son développement de 30% sur le segment des 18-30 ans. Pour
séduire cette population très convoitée, AXA France cherche des solutions d’assurances et des services
plus adaptés à leur besoin. C’est dans cette optique que l’offre « jeunes conducteurs » a été mise en place
en février 2012 avec la mise en place de nouveaux avantages tarifaires. Pour continuer dans cette
direction, il est intéressant de mener deux nouvelles études sur cette population dont les caractéristiques
principales sont le fort taux de résiliation et la grande sinistralité.
Les jeunes assurés de moins de 30 ans sont les personnes qui ont le plus de sinistres et dont le
coût des sinistres est le plus élevé. Des études montrent que la sinistralité des jeunes conducteurs est très
fortement liée à son éducation, son mode de vie, ses valeurs et ses ambitions et tout cela est reflété dans
nos variables explicatives telles que les variables véhicules, les variables géographiques et les variables
conducteurs. C’est également la population qui résilie le plus. Beaucoup de changements s’opèrent dans la
vie d’un jeune entre 18 et 25 ans. C’est pourquoi, la population des jeunes conducteurs est une population
à risque aux yeux des assureurs automobiles. Le challenge pour AXA France est de proposer une
protection efficace à ces jeunes conducteurs à un tarif juste. En effet, la sinistralité des jeunes conducteurs
s’améliore très vite au cours du temps. C’est aussi la période où les jeunes commencent à s’installer et à
s’équiper avec d’autres produits d’assurance. C’est donc dans l’intérêt d’AXA d’assurer ces jeunes et de
tout faire pour les garder dans son portefeuille.
Affaire nouvelle 1er
terme : -10%
au minimum
2ème
terme : -10%
au minimum
Année N Année N+1 Année N+2
PREMIERE PARTIE
PREDICTION DE L’ACTE DE RESILIATION
DES SANS ANTECEDENT D’ASSURANCE
PREMIERE PARTIE : Prédiction de l’acte de résiliation des sans antécédent d’assurance
Isabelle VIDAL – Etudes sur les jeunes conducteurs
Direction de marché IARD – Auto des particuliers 19
Le marché de l’automobile est un marché extrêmement concurrentiel. Plus les primes sont élevées,
moins les assurés souscrivent ou restent chez AXA. A l’inverse, plus les primes sont faibles, plus les
assurés souscrivent ou restent car le produit est plus attractif par rapport à la concurrence.
Il semble alors intéressant d’observer dans quelle mesure les assurés sont sensibles aux prix et ainsi, de
déterminer les caractéristiques liées à l’acte de résiliation chez les sans antécédents. Nous procéderons de
deux manières :
- Prédiction de l’acte de résiliation par une régression logistique
- Prédiction de l’acte de résiliation par des arbres de décision
1 MISE EN PLACE D’INDICATEURS DU TAUX DE RESILIATION /
Cette première étude fait suite à des observations sur le taux de résiliation des sans antécédent
d’assurance.
Le taux de résiliation a été observé sur les sans antécédent de 2011 avant l’ « offre jeunes » et sur les
sans antécédent de 2012 après l’« offre jeunes ». Nous regardons un an après l’affaire nouvelle de 2011
ou de 2012 si la personne est toujours dans le portefeuille tous motifs de résiliation confondus.
Le graphique suivant représente les taux de résiliation vu un an après.
Figure 1-1 . Taux de résiliation des sans antécédent avant et après l'offre Jeunes
Nous constatons une perte d’environ 3 points sur le taux de résiliation après le lancement de l’offre Jeunes
en février 2012.
30,6% 30,5%
31,6% 31,5% 31,5%
30,9%
31,3%
32,1%
29,7%
30,7%
31,6% 31,6%
31,1%
33,4%
29,0%
28,6%
29,3% 29,2%
28,0%
29,9%
28,6% 28,5%
28,0% 27,9%
28,7%
29,8%
29,0%
31,4%
29,4%
30,4%
29,2% 29,5%
30,8%
29,0%
30,2%
27%
28%
29%
30%
31%
32%
33%
janv. fév. mars avr. mai juin juil. août sept. oct. nov. nov. déc.
Taux de résiliation vu à 1 an
2011 2012 2013
PREMIERE PARTIE : Prédiction de l’acte de résiliation des sans antécédent d’assurance
Isabelle VIDAL – Etudes sur les jeunes conducteurs
Direction de marché IARD – Auto des particuliers 20
De plus, nous pouvons nous demander si cette baisse du taux de résiliation n’est pas dû à un effet mix,
c’est-à-dire au fait que la répartition entre les sans antécédent de moins de 30 ans et ceux de plus de 30
ans soit différente d’une année à l’autre. En effet, le taux de résiliation est plus fort chez les sans
antécédent de plus de 30 ans.
Le tableau suivant présente la répartition et les taux de résiliation observés avant la mise en place de l’offre
Jeunes.
Tableau 1-1 . Taux de résiliation observés avant la mise en place de l'offre Jeunes
Avant l’offre « jeunes », les sans antécédent sont répartis comme suit :
- 72% ont moins de 30 ans ;
- 28% ont plus de 30 ans
Le tableau suivant présente la répartition et les taux de résiliation observés après la mise en place de l’offre
Jeunes.
Tableau 1-2 . Taux de résiliation observés après la mise en place de l'offre Jeunes
Après l’offre « jeunes », les sans antécédent sont répartis de la manière suivante :
- 74% ont moins de 30 ans ;
- 26% ont plus de 30 ans
Le taux de résiliation observé en 2012 est de 28.85% avec la répartition des sans antécédent 2012 et le
taux de résiliation observé en 2011 est de 31.39% avec la répartition 2011 et 31.08% avec la répartition
2012.
Finalement, la baisse du taux de résiliation de -2.54 points est expliquée par :
- -0.31 points dû au mix de portefeuille, c’est-à-dire au changement de répartition ;
- -2.23 points dû à l’offre Jeunes
MARS 2011 JANV 2012 Répartition Taux de résiliation
Sans antécédent < 30 ans 72,13% 26,92%
Sans antécédent > 30 ans 27,87% 42,98%
31,39%
MARS 2012 JANV 2013 Répartition Taux de résiliation Taux de résiliation N-1
Sans antécédent < 30 ans 74,12% 25,70% 26,92%
Sans antécédent > 30 ans 25,88% 37,85% 42,98%
28,85% 31,08%
PREMIERE PARTIE : Prédiction de l’acte de résiliation des sans antécédent d’assurance
Isabelle VIDAL – Etudes sur les jeunes conducteurs
Direction de marché IARD – Auto des particuliers 21
Enfin, l’écart de résiliation est expliqué par une meilleure sélectivité des sans antécédent (et plus
précisément les enfants d’assurés). Le graphique suivant présente les taux de résiliation des principaux
motifs des résiliations des sans antécédent.
Figure 1-2 . Taux de résiliation des principaux motifs des résiliations des sans antécédent
La baisse du taux de résiliation s’explique donc par la baisse des résiliations compagnie et plus
particulièrement par la baisse des résiliations pour non-paiement.
Dans l’optique de réduire le taux de résiliation chez les sans antécédent, le but de la première étude est
de :
- Observer dans quelle mesure les assurés sont sensibles aux prix ;
- Déterminer les caractéristiques liées à l’acte de résiliation chez les sans antécédent.
En résumé :
L’offre « jeunes conducteurs » a permis de sélectionner les bons risques et de fidéliser les sans antécédent d’assurance grâce aux avantages tarifaires issus de la clause conduite accompagnée (en effet, des conducteurs ayant effectué la conduite accompagnée disposent d’une expérience sur la route de deux ans de plus et sont donc de meilleurs risques) et des clauses enfant d’assuré et bonus parental (les enfants des bons conducteurs sont en majorité de nouveaux bons conducteurs).
Entre les taux de résiliations avant offre jeunes (i.e. mars 2011 à janvier 2012) et après offre jeunes (i.e. mars 2012 à janvier 2013), la diminution est en moyenne de 2,55 points avec une diminution conséquente de 3,61 points pour les mois de novembre et janvier.
Pour continuer dans cette lancée, la mise en place d’un scoring de résiliation à la souscription semble être un choix judicieux.
0%
2%
4%
6%
8%
10%
12%
14%
Principaux motifs des résiliations des SA - Taux de résiliation
Résil échéance Résil Châtel Résil non-paiement Résil vente Résil autres
OFFRE JEUNES
PREMIERE PARTIE : Prédiction de l’acte de résiliation des sans antécédent d’assurance
Isabelle VIDAL – Etudes sur les jeunes conducteurs
Direction de marché IARD – Auto des particuliers 22
2 CONSTITUTION DE LA BASE DE DONNEES /
Dans un premier temps, il est nécessaire de constituer la base de données que nous allons utiliser pour
prédire l’acte de résiliation chez les « jeunes ».
Nous décidons de constituer notre base de données sur deux populations de sans antécédent :
- Les sans antécédent de mars 2011 à janvier 2012 avant l’offre « jeunes conducteurs »
- Les sans antécédent de mars 2012 à janvier 2013 après l’offre « jeunes conducteurs »
Il est très important de considérer séparément ces deux populations de sans antécédent car elles sont
différentes.
Les contrats suspendus sont comptés en tant que résiliés. Ils représentent 2,5% de notre base de
données.
Nous découpons la base en deux parties : 70% de cette base constitue notre base d’apprentissage et les
30% complémentaire correspondent à la base de test.
Nous avons donc un taux de résiliation à 32,16% sur 70% de la base et 32,13% sur la base totale.
L’analyse des correspondances multiples suivante démontre bien ce résultat.
Principe de l’ACM
L’analyse des correspondances multiples permet d’identifier des groupes de personnes avec des
caractéristiques communes. Elle permet de voir les oppositions et proximités pouvant exister entre les
modalités d’une même variable d’une part, et entre les modalités de variables différentes d’autre part.
Le tableau d’individus est un tableau disjonctif complet noté 𝑋, c’est-à-dire que chaque ligne correspond à
un individu parmi les 𝑛 et chaque colonne correspond à une modalité parmi les 𝐾 au total pour 𝑝 variables
explicatives. Les observations 𝑥𝑖𝑗 sont codées avec 1 si l’individu 𝑖 a la modalité 𝑗, 0 sinon.
Nous appelons tableau de Burt 𝐵 = 𝑋𝑡𝑋. Le tableau de Burt peut être vu comme une juxtaposition de
tableaux de contingence. C’est une matrice carrée symétrique et si nous considérons les données de 𝑋
comme des observations de variables qualitatives alors le tableau de Burt représente la matrice de
variance de 𝑋 à un facteur multiplicatif près.
L’ACM consiste donc à représenter les modalités de variables qualitatives dans un espace euclidien dans
lequel les distances dues entre deux modalités d’une variable sont préservées au mieux.
Pour plus d’informations sur les ACM, sur la sélection des variables et sur l’interprétation des axes,
voir la rubrique « 3.2 Analyse des correspondances multiples ».
Les variables explicatives sélectionnées étaient les suivantes :
Type de garantie, marque du véhicule, énergie du véhicule, ancienneté du véhicule, sexe du
conducteur, zone RC, segment du véhicule, la carrosserie et la classe de prix.
PREMIERE PARTIE : Prédiction de l’acte de résiliation des sans antécédent d’assurance
Isabelle VIDAL – Etudes sur les jeunes conducteurs
Direction de marché IARD – Auto des particuliers 23
Les axes d’étude s’expliquent comme suit :
- Axe 1 : la carrosserie, la classe de prix, l’énergie, le segment et la vitesse maximale
- Axe 2 : la classe de prix, l’énergie, les garanties, le segment et la vitesse maximale
Le premier axe oppose deux catégories d’individus.
Du côté gauche de l’axe, nous trouvons :
les véhicules de segment A ;
la classe de prix est inférieure à la classe E ;
la vitesse maximale du véhicule est inférieure à 160 km/h ;
l’énergie utilisée est l’essence ;
la garantie choisie est la garantie RC.
Le côté droit de l’axe est représenté par :
les véhicules de segment M2 et H ;
la classe de prix est supérieure à la classe L ;
la vitesse maximale du véhicule est supérieure à 190 km/h ;
les carrosseries de type « Break, Minibus, Coupé, Cabriolet, 4x4, Monospace, Ludospace ».
Le deuxième axe d’étude oppose les véhicules « moyens » possédant une classe de prix de F à H, dont la
vitesse maximale est comprise entre 160 et 170 km/h et dont le conducteur s’est assuré tous risques aux
véhicules situés aux extrêmes i.e. les véhicules de classe inférieure à E, de segment A et dont la vitesse
maximale est inférieure à 150 km/h et les véhicules de classe supérieure à L, de segment M2 et H et dont
la vitesse est supérieure à 190 km/h.
PREMIERE PARTIE : Prédiction de l’acte de résiliation des sans antécédent d’assurance
Isabelle VIDAL – Etudes sur les jeunes conducteurs
Direction de marché IARD – Auto des particuliers 24
Figure 2-1 . Analyse des correspondances multiples sur les sans antécédent de 2011 et de 2012
Nous distinguons alors, deux profils de sans antécédent distincts :
- Les sans antécédent de 2011 sont des personnes utilisant des véhicules de segment A et de classe de prix inférieure à E dont la vitesse maximale est inférieure à 160 km/h. Ils utilisent principalement des véhicules « Essence » et ils ont choisi de s’assurer au tiers.
- Les sans antécédent de 2012 sont des personnes utilisant des véhicules de segment M1 et de classe de prix moyenne (classes I, J, K) dont la vitesse maximale est comprise entre 171 et 190 km/h. Ils utilisent des véhicules « Diesel » et ils optent pour le deuxième niveau de garantie IV.
Il semblerait donc que l’ « offre jeunes » ait permis de conquérir des conducteurs ayant des primes plus
élevées (plus de garanties avec des véhicules plus onéreux).
En résumé :
L’offre « jeunes conducteurs » a permis de conquérir de nouveaux conducteurs et le profil de ces nouveaux sans antécédent est différent de celui des sans antécédent ayant effectué leurs affaires nouvelles avant l’offre « jeunes ». Ces nouveaux sans antécédent semblent posséder des véhicules plus onéreux avec des garanties plus importantes que seulement la formule Tiers.
Autres carrosseries
Berlines Camionnettes
Monospaces
Classes A B C D E
Classes F G H
Classes I J K
Classes L à Z5
Diesel
Essence Gar RC
Gar IV
Gar DO
Seg A
Seg B
Seg M1
Seg M2
Seg H + autres
<= 150 km/h >= 190 km/h
151 - 160 km/h
161 - 170 km/h
171 - 180 km/h
181 - 190 km/h
SA 2011
SA 2012
-1,00
-0,50
0,00
0,50
1,00
1,50
2,00
-1,50 -1,00 -0,50 0,00 0,50 1,00 1,50 2,00
AX
E 2
AXE 1 carrosserie classeprix energie garanties segmentveh vitessemax sans_antecedents
PREMIERE PARTIE : Prédiction de l’acte de résiliation des sans antécédent d’assurance
Isabelle VIDAL – Etudes sur les jeunes conducteurs
Direction de marché IARD – Auto des particuliers 25
3 SELECTION DES VARIABLES ASSOCIEES A L’ACTE DE
RESILIATION /
Le but de l’étude préliminaire est de savoir avec quelle probabilité un sans antécédent qui rentre
dans le portefeuille en affaire nouvelle va résilier au bout d’une année. Dans ce but, il semble évident de ne
garder que des variables disponibles à la souscription recensées ci-dessous :
Le fractionnement Le nombre de permis au foyer
L’ancienneté de permis La classe de réparation
Le réseau de distribution Le niveau de garantie
La zone RC
Le prélèvement automatique
Le type de garage La situation matrimoniale
Le coefficient agent
La clause TDE
La région AXA
La marque du véhicule
Le segment du véhicule La clause TA1
Le type de population
Le type d’énergie L’alimentation du véhicule
La clause TA2
L’usage du véhicule L’ancienneté du véhicule La vitesse
Le nombre de véhicules au foyer
L’âge du conducteur
La classe de prix
3.1 Tris à plat, statistiques descriptives
Dans un premier temps, nous avons effectué des tris à plat pour détecter les modalités avec les
taux de résiliation les plus élevés et les moins élevés.
Nous représentons dans le tableau suivant les 15 modalités avec le taux de résiliation le plus faible.
PREMIERE PARTIE : Prédiction de l’acte de résiliation des sans antécédent d’assurance
Isabelle VIDAL – Etudes sur les jeunes conducteurs
Direction de marché IARD – Auto des particuliers 29
Le tableau suivant représente les variables et les modalités qui sont représentatives pour l’analyse des
correspondances multiples. La contribution et la coordonnée pour les deux axes sont également indiquées.
Variables Modalités Axe 1 Axe 2
Coordonnée Contribution Coordonnée Contribution
Enfant d'assuré NON 0,60 5,60% 0,04 0,04%
OUI -1,03 9,63% -0,06 0,07%
Profession
autres professions 0,60 1,57% 0,45 1,60%
salariés 0,39 2,01% -0,21 1,06%
étudiants -1,04 8,09% 0,11 0,17%
Garanties
DO -0,49 0,91% 1,28 11,35%
IV -0,20 0,23% -0,07 0,06%
RC 0,20 0,62% -0,29 2,33%
Ancienneté de permis
<= 1 an -0,72 6,40% -0,14 0,45%
1 - 4 ans 0,29 0,35% -0,35 0,96%
5 - 14 ans 0,90 3,70% 0,03 0,01%
>= 15 ans 1,00 3,62% 0,84 4,80%
Fractionnement
annuel -0,56 2,15% 0,88 9,86%
mensuel 0,20 0,68% -0,43 5,96%
semestriel 0,35 0,15% 1,18 3,05%
Bonus parental NON 0,42 3,28% 0,00 0,00%
OUI -1,29 10,11% 0,00 0,00%
Alimentation du véhicule
ELC+GPL+CAR -0,03 0,00% -0,56 1,03%
IDS 0,12 0,11% 0,66 6,06%
INJ -0,13 0,22% -0,25 1,63%
INS+GNV+HES+HGO 0,64 0,60% -0,25 0,18%
Prélèvement automatique
NON -0,33 1,00% 0,80 10,68%
OUI 0,19 0,56% -0,45 5,97%
Age du conducteur
<= 20 ans -0,94 8,74% -0,03 0,01%
21 - 25 ans 0,12 0,08% -0,46 2,13%
26 - 30 ans 0,70 1,41% -0,18 0,17%
31 - 40 ans 0,95 3,04% 0,19 0,23%
41 - 50 ans 1,02 2,04% 0,57 1,19%
>= 61 ans 1,00 1,37% 1,08 3,01%
Ancienneté du véhicule
<= 5 ans -0,19 0,13% 1,33 11,61%
6 - 7 ans -0,03 0,00% 0,61 1,37%
8 - 9 ans -0,02 0,00% 0,28 0,42%
<= 10 ans 0,05 0,04% -0,40 5,01%
Acte de résiliation
NON RESILIATION -0,22 0,07
RESILIATION 0,47 -0,15
Tableau 3-3 . Coordonnées et contributions à l'inertie des variables
PREMIERE PARTIE : Prédiction de l’acte de résiliation des sans antécédent d’assurance
Isabelle VIDAL – Etudes sur les jeunes conducteurs
Direction de marché IARD – Auto des particuliers 30
Dans notre cas, l’inertie moyenne est de 1 64⁄ = 1,56%.
L’axe 1 nous renseigne sur le conducteur c’est-à-dire la présence des clauses « enfant d’assuré » et
« bonus parental », la profession, l’ancienneté de permis et l’âge du conducteur.
L’axe 1 oppose deux catégories d’individus.
- Du côté gauche de l’axe, nous retrouvons des étudiants de moins de 20 ans avec une ancienneté
de permis inférieure à 1 an et disposant des clauses « enfant d’assuré » et « bonus parental ».
- De l’autre côté, nous apercevons des personnes non étudiantes âgées de plus de 26 ans dont
l’ancienneté de permis et supérieure à 5 ans. Cette population ne dispose pas des clauses « enfant
d’assuré » et « bonus parental ».
L’axe 2 nous renseigne sur le contrat c’est-à-dire le niveau de garantie, le fractionnement, l’alimentation du
véhicule, le prélèvement automatique et l’ancienneté du véhicule.
- En haut de l’axe, nous trouvons des personnes assurées tous risques qui payent annuellement ou
semestriellement mais pas en prélèvement automatique et dont l’ancienneté de véhicule est
inférieure à 10 ans.
- En bas de l’axe, nous avons des personnes assurées au Tiers et Tiers étendu qui payent en
prélèvement automatique mensuellement. L’ancienneté de véhicule de ces personnes est
supérieure à 10 ans.
3.2.3 Projection sur le plan formé par les deux premiers axes
Après avoir interprété les axes de l’analyse des correspondances multiples, nous pouvons dresser
un profil pour chaque catégorie d’individus : les personnes qui résilient et celles qui ne résilient pas.
Le graphique suivant présente les modalités des variables sélectionnées dans le plan factoriel. Le groupe
des résiliés figure en rouge alors que le groupe des non résiliés figurent en vert. Il est intéressant de
remarquer que nous arrivons aux mêmes conclusions qu’avec les statistiques descriptives précédentes.
PREMIERE PARTIE : Prédiction de l’acte de résiliation des sans antécédent d’assurance
Isabelle VIDAL – Etudes sur les jeunes conducteurs
Direction de marché IARD – Auto des particuliers 31
Figure 3-3 . Analyse des correspondances multiples sur les sans antécédent qui résilient et ceux qui ne résilient pas
En résumé :
L’étude des tris à plat et l’analyse des correspondances multiples permettent de dissocier deux catégories de profils : ceux qui ont plus tendance à résilier et ceux qui restent dans le portefeuille un an après tous motifs de résiliation confondus. Les mauvais risques du portefeuille i.e. ceux qui résilient un an après l’affaire nouvelle semblent être les « faux » sans antécédent.
On définit les « faux » sans antécédent comme étant des personnes âgées de plus de 26 ans, non célibataires, non étudiants donc étant déjà dans la vie active et fractionnant mensuellement. Ils sont détenteurs de gros véhicules onéreux et ayant une vitesse élevée.
TA1 NON
TA1 OUI
csp autre
salariés
étudiants
DO
IV RC ancp -1an
ancp 1-4ans
ancp 5-14ans
ancp +15ans annuel
mensuel
semestriel
TA2 NON
TA2 OUI
ELC+GPL+CAR
IDS
INJ INS+GNV+HES+HGO
prelauto NON
prelauto OUI
<=20ans
21-25ans
26-30ans
31-40ans
41-50ans
>=51ans
ancv -5 ans
ancv 6-7ans
ancv 8-9ans
ancv +10ans
NON RESILIATION
RESILIATION
-1,0
-0,5
0,0
0,5
1,0
1,5
-1,5 -1,0 -0,5 0,0 0,5 1,0 1,5
Axe
2
Axe 1
ACM: Profil des résiliés et des non résiliés
PREMIERE PARTIE : Prédiction de l’acte de résiliation des sans antécédent d’assurance
Isabelle VIDAL – Etudes sur les jeunes conducteurs
Direction de marché IARD – Auto des particuliers 32
4 MODELISATION PAR LA REGRESSION LOGISTIQUE /
La première méthode pour modéliser l’acte de résiliation chez les sans antécédent est d’utiliser la
régression logistique.
4.1 Choix du modèle logistique
Le but est donc de modéliser l’acte de résiliation à 2 modalités : 1 ou 0, résiliation ou non résiliation, à
partir de variables explicatives.
Soit 𝑍 l’évènement « acte de résiliation » qui est notre variable à expliquer, nous disposons alors de deux
probabilités :
- 𝑃(𝑍 = 1) correspond à la probabilité que l’acte de résiliation survienne ;
- 𝑃(𝑍 = 0) correspond à la probabilité qu’il ne survienne pas.
L’idée est de modéliser les probabilités de résilier ou non conditionnellement aux variables explicatives
PREMIERE PARTIE : Prédiction de l’acte de résiliation des sans antécédent d’assurance
Isabelle VIDAL – Etudes sur les jeunes conducteurs
Direction de marché IARD – Auto des particuliers 35
- Courbe ROC : le but est de se rapprocher au maximum de 100%, ce qui signifie que le modèle est
de mieux en mieux ;
- Taux de bon reclassement : il est défini comme étant la part d’observations dont la variable à
expliquer est bien prédite. Le but est de le maximiser.
En comparant les deux modèles, l’un d’entre eux semble légèrement meilleur que l’autre. Nous choisissons
de conserver le modèle sélectionné avec le critère AIC.
La régression logistique s’effectue donc avec les 17 variables sélectionnées par le critère AIC. Nous
cherchons alors combien de variables nous allons garder dans notre régression logistique. Plus de
variables seront intégrées au modèle, plus celui-ci sera robuste mais plus sa prédiction sera faible sur un
autre échantillon de données et inversement. Nous regardons tous les critères pour sélectionner le nombre
de variables à prendre en compte.
Modèle testé Taux de paires concordantes
Aire sous la courbe
ROC AIC
Taux de bon reclassement
Taux de bon reclassement sur la base de
test
Avec les 17 variables les plus pertinentes
73,10% 73,30% 93370 67,10% 66,82%
Avec les 16 variables les plus pertinentes
73,10% 73,20% 93400 67,10% 66,94%
Avec les 15 variables les plus pertinentes
73% 73,20% 93482 67% 67,02%
Avec les 14 variables les plus pertinentes
73% 73,10% 93543 67% 66,87%
Avec les 13 variables les plus pertinentes
72,90% 73% 93619 66,90% 66,94%
Tableau 4-2 . Sélection du nombre de variables pour notre modèle
Le modèle avec les 15 variables semble meilleur que tous les autres. En effet, c’est le seul qui
appréhende aussi bien la base d’apprentissage et la base de validation. Nous décidons donc de conserver
ce modèle.
PREMIERE PARTIE : Prédiction de l’acte de résiliation des sans antécédent d’assurance
Isabelle VIDAL – Etudes sur les jeunes conducteurs
Direction de marché IARD – Auto des particuliers 36
4.3 Validation du modèle et interprétation des coefficients
4.3.1 Validation du modèle
Après avoir présélectionné notre modèle pour la régression logistique, il faut à présent s’assurer
que le modèle et les variables soient significatifs. Le tableau suivant propose plusieurs tests pour juger de
la significativité du modèle.
Test Khi 2 DF Pr > Khi 2
Likelihood ratio 12 790,84 49 < 0,0001
Score 11 385,42 49 < 0,0001
Wald 9 718 49 < 0,0001
Tableau 4-3 . Test de l'hypothèse nulle globale : Beta=0
La dernière colonne du tableau précèdent nous renseigne sur le caractère significatif du modèle. Nous
pouvons conclure alors que le modèle que nous avons sélectionné est globalement bon. En effet, les trois
tests rejettent l’hypothèse nulle du modèle. Concernant les variables, le tableau suivant nous donne les
informations nécessaires pour juger nos variables présélectionnées.
Variables DF Khi 2 de Wald Pr > Khi 2
Enfant d’assuré 1 214,06 < 0,0001
Type de population 2 481,70 < 0,0001
Niveau de garantie 2 313,58 < 0,0001
Ancienneté de permis 3 571,31 < 0,0001
Fractionnement 2 530,59 < 0,0001
Segment du véhicule 4 311,64 < 0,0001
Bonus parental 1 261,71 < 0,0001
Coefficient agent 7 112,38 < 0,0001
Alimentation 3 111,02 < 0,0001
Région AXA France 4 111,79 < 0,0001
Prélèvement automatique 1 77,21 < 0,0001
Age du conducteur 5 83,69 < 0,0001
Zone RC 9 90,46 < 0,0001
Ancienneté du véhicule 3 79,62 < 0,0001
Nombre de permis au foyer 2 64,04 < 0,0001
Tableau 4-4 . Test de nullité des coefficients
L’hypothèse nulle des coefficients est rejetée pour chacune de nos 15 variables. Elles sont donc toutes
significatives.
PREMIERE PARTIE : Prédiction de l’acte de résiliation des sans antécédent d’assurance
Isabelle VIDAL – Etudes sur les jeunes conducteurs
Direction de marché IARD – Auto des particuliers 37
4.3.2 Analyse des coefficients associés à chaque variable
Pour chacune de nos 15 variables explicatives, nous observons sur les graphiques suivants les
coefficients associés à chacune des modalités. Le reste des graphiques se situe en Annexe 3. Dans la
suite, nous rappelons que nous avons modélisé l’acte de ne pas résilier.
Figure 4-3 . Coefficients liés au niveau de garantie
Pour pouvoir interpréter les résultats nous calculons les rapports de côte (Odds Ratio) pour chaque
modalité de chaque variable.
Sur le graphique, nous observons que le taux de non résiliation augmente avec le niveau de garantie.
Une personne sans les clauses de l’offre « jeunes conducteurs » aura tendance à plus résilier que
quelqu’un qui les possède. Un enfant d’assuré résilie 1,5 fois moins et une personne possédant la clause
« bonus parental » résilie 1,7 fois moins.
Concernant les variables du véhicule, plus le segment du véhicule est important, plus la probabilité de
résilier est importante. A contrario, la probabilité de résiliation est plus importante pour les véhicules
récents que pour les vieux véhicules. En effet, nous avons vu que les sans antécédent de moins de 30 ans
qui possèdent en général un vieux véhicule résiliaient moins que les sans antécédent de plus de 30 ans qui
ont tendance à conduire des véhicules neufs.
Les personnes fractionnant annuellement ont 1,7 fois plus de chance de ne pas résilier que celles qui
fractionnent semestriellement et 2,3 fois plus que celles qui fractionnent mensuellement.
Au final, nous retrouvons les résultats que nous avions constatés dans nos analyses descriptives.
0,00%
10,00%
20,00%
30,00%
40,00%
50,00%
60,00%
70,00%
80,00%
90,00%
100,00%
-0,05
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
RC IV DO
Co
eff
icie
nts
Garanties
Part Coefficients
PREMIERE PARTIE : Prédiction de l’acte de résiliation des sans antécédent d’assurance
Isabelle VIDAL – Etudes sur les jeunes conducteurs
Direction de marché IARD – Auto des particuliers 38
En résumé :
Premièrement, l’acte de résiliation est modélisé par une régression logistique. La sélection des variables qui sont susceptibles de rentrer dans le modèle est faite par la méthode Forward grâce aux critères AIC et BIC. Les variables obtenues grâce au critère AIC sont retenues. Nous privilégions ce critère suite à l’étude de divers indicateurs tels que le taux de paires concordantes, la courbe ROC et les taux de bon reclassement sur la base d’apprentissage et sur la base de test.
Ces critères sont à nouveau analysés pour sélectionner le nombre de variables à prendre en compte. Au final, le modèle contient 15 variables de type conducteurs, géographiques et véhicules. Les variables les plus discriminantes en termes de résiliation sont :
- Enfant d’assuré : une personne disposant de la clause résilie moins; - Profession du conducteur : les étudiants résilient le moins en comparaison avec les salariés ; - Niveau de garantie : le taux de résiliation diminue avec le niveau de garantie ; - Ancienneté de permis : les personnes avec une ancienneté de permis inférieure à un an résilient le
moins ; - Fractionnement : le fractionnement mensuel est lié à l’acte de résiliation ; - Segment du véhicule : posséder un gros véhicule est synonyme de résiliation chez les sans
antécédent.
Le modèle est validé par le test de Khi 2. Le modèle est globalement bon et les variables sont toutes significatives.
PREMIERE PARTIE : Prédiction de l’acte de résiliation des sans antécédent d’assurance
Isabelle VIDAL – Etudes sur les jeunes conducteurs
Direction de marché IARD – Auto des particuliers 39
5 MODELISATION PAR ARBRE DE DECISION /
La deuxième méthode consiste à modéliser l’acte de résiliation par des arbres de décision. Dans la
littérature, les arbres de décision se sont montrés plus performants que les régressions.
5.1 Les points forts de l’arbre de décision
Le point fort de la méthode est sa simplicité. En effet, il s’agit d’effectuer une classification de nos
individus sous forme d’un arbre de décision. La finalité de cette méthode repose sur la répartition des
individus en groupes homogènes du point de vue de la variable à prédire.
Le but de l’arbre de décision est de déterminer les meilleures modalités à placer à chaque nœud pour que
l’arbre soit le plus petit possible et pour que ces prédictions soient bonnes : plus l’arbre est petit, plus la
prédiction sera facile à obtenir. Il est important de connaître sa classe de départ c’est-à-dire si cet individu
a résilié ou non car les arbres de décision travaillent sur la classification en mode supervisée. La
classification supervisée consiste à classer des individus par groupes sachant qu’on connait au préalable
leur classe de départ individuellement.
L’arbre de décision est composé de nœuds. Chaque nœud est indiqué par une ou plusieurs
modalités d’une même variable. Enfin, les nœuds terminaux sont appelés des feuilles.
Plusieurs algorithmes sont connus pour construire des arbres de décision tels qu’ID3, C4.5, CART et
CHAID.
Nous choisissons d’opter pour l’algorithme de CART qui a les avantages suivant :
- Règles de décision simples ;
- Modèle robuste vis-à-vis des valeurs aberrantes et extrêmes ;
- Il n’est pas nécessaire de disposer d’hypothèses sur les variables. De plus, elles peuvent être
discrètes ou continues ;
- Il s’agit d’un arbre binaire : deux nœuds fils pour chaque nœud parent.
5.2 Création du premier arbre
Nous utilisons la fonction 𝑟𝑝𝑎𝑟𝑡 de 𝑅 pour construire nos arbres de décision. Pour créer notre
premier arbre, nous utilisons la méthode par défaut de l’ordinateur définie comme suit :
Le paramètre 𝑚𝑖𝑛𝑠𝑝𝑙𝑖𝑡 = 𝑥 représente le nombre minimal d’observations dans un nœud pour lequel la
coupe est calculée. Ce paramètre va être choisi de telle sorte qu’on ait de 1% à 6% d’observations par
nœud.
La deuxième étape après la sélection de l’arbre et des paramètres de classification est la simplification de
l’arbre, aussi appelée élagage. Pour choisir le bon nombre de feuilles, nous procédons par validation
croisée. En effet, si l’arbre est trop complexe et trop spécifique aux données de la base d’apprentissage
alors il ne s’adaptera pas bien sur une autre base de données indépendante.
PREMIERE PARTIE : Prédiction de l’acte de résiliation des sans antécédent d’assurance
Isabelle VIDAL – Etudes sur les jeunes conducteurs
Direction de marché IARD – Auto des particuliers 41
Le but est de déterminer l’arbre de décision qui prédit le mieux l’acte de résiliation sur notre base
d’apprentissage mais qui le prédit aussi bien sur une autre base.
Le processus d’élagage de CART via la fonction 𝑝𝑟𝑢𝑛𝑒 de 𝑅 va nous permettre de retenir l’arbre pour
lequel le taux d’erreur estimé est le plus bas possible.
Ensuite, afin d’évaluer les performances de nos différents arbres sur la base d’apprentissage et sur la base
de test, nous utilisons la fonction 𝑝𝑟𝑒𝑑𝑖𝑐𝑡 de 𝑅 pour estimer les probabilités d’appartenance aux classes
pour chaque observation. Par la suite, nous attribuons chaque observation à sa classe : les personnes qui
résilient et celles qui ne résilient pas. Nous construisons ensuite notre matrice de confusion qui nous aide à
déterminer le taux de bon reclassement pour valider la qualité de la prédiction.
Le tableau suivant détaille tous nos arbres de décision construits avec leur taux de bon reclassement
respectif sur les bases d’apprentissage et de test.
Nombre d’observations par
nœud Nombre de classes
Taux de bon reclassement sur la
base d’apprentissage
Taux de bon reclassement sur la
base de test
Méthode par défaut 5 69,57 % 69,68 %
1% d’observations 21 70,52 % 70,06 %
2% d’observations 15 70,29 % 70,21 %
3% d’observations 11 70,18 % 70,13 %
4% d’observations 9 70,02 % 70,01 %
5% d’observations 8 69,95 % 70,14 %
6% d’observations 7 69,85 % 70,12 %
Tableau 5-1 . Validation de la qualité des arbres de décision
Nous avons en moyenne un taux de bon reclassement de 70%. Pour la suite de notre étude, nous
décidons de garder trois arbres de décisions : un à 5 classes, un à 7 classes et un autre à 8 classes qui ont
des taux de bon reclassement satisfaisants sur la base d’apprentissage et meilleurs sur la base de test.
Nous créons trois nouvelles variables contenant les probabilités de ne pas résilier dont nous nous servirons
dans la suite de notre étude.
L’arbre qui semble le mieux appréhender nos données et qui pourra s’ajuster correctement à un autre
échantillon est le suivant :
PREMIERE PARTIE : Prédiction de l’acte de résiliation des sans antécédent d’assurance
Isabelle VIDAL – Etudes sur les jeunes conducteurs
Direction de marché IARD – Auto des particuliers 42
Figure 5-2 . Arbre de décision optimal, à 8 classes
Monter dans la première branche permet de valider l’information disponible dans la case commune
précédente. Le pourcentage indiqué dans chaque bulle est le taux de résiliation observé.
5.4 Ajout d’une variable discriminante : la banque du conducteur
La banque du conducteur est connue lorsque celui-ci est en prélèvement automatique avec son
assurance automobile.
Les variables extraites pour mieux prédire l’acte de résiliation des sans antécédent au bout d’un an sont les
suivantes :
- La banque du conducteur à l’affaire nouvelle ;
- La banque du conducteur au premier terme, un an après l’affaire nouvelle ;
- Le fait que la personne change de banque ou non durant sa première année de contrat auto.
Les tableaux suivants récapitulent les taux de résiliation selon les trois variables expliquées
précédemment.
PREMIERE PARTIE : Prédiction de l’acte de résiliation des sans antécédent d’assurance
Isabelle VIDAL – Etudes sur les jeunes conducteurs
Direction de marché IARD – Auto des particuliers 43
Tableau 5-2 . Taux de résiliation observé des sans antécédent au bout d'un an selon les variables relatives à la banque de l'assuré
En observation, les sans antécédent qui résilient le plus sont des personnes qui, au terme anniversaire,
sont à la banque postale (avec 43% de résiliation), au Crédit Lyonnais (34%) ou encore au CIC ou à la
Caisse d’Epargne (33%).
On pourrait imaginer que des personnes qui sont capables de changer de banque en un an, seraient aussi
capables de résilier leur assurance auto pour une autre compagnie qu’AXA. Le taux de résiliation pour ces
personnes-là est de 27.7% soit le moins élevé parmi les personnes qui ne changent pas de banque en un
an (28.2%) ou qui ne sont pas en prélèvement automatique (35%).
Le but de l’étude est de prédire un score de résiliation le jour de l’affaire nouvelle du sans antécédent.
Nous décidons d’intégrer la variable « banque du conducteur à l’affaire nouvelle » dans l’arbre de décision
et il s’avère que celle-ci est plus discriminante que le segment du véhicule ou le nombre de permis au
foyer.
Figure 5-11 . Arbre de décision à 8 classes prenant en compte la banque de l'assuré
Banque de l'assuré
à l'affaire nouvelle
Taux de
résiliation
observé
Banque de l'assuré
au terme
anniversaire
Taux de
résiliation
observé
Changement de
banque
Taux de
résiliation
observé
AXA Banque 17,5% AXA Banque 14,9% Oui 27,7%
Non renseignée 25,7% HSBC 25,2% Non 28,2%
HSBC 28,0% Crédit du Nord 26,3%
Crédit Agricole 30,5% Crédit Agricole 27,9%
BNP Paribas 30,7% Crédit Mutuel 28,3%
Crédit du Nord 31,0% Banque Populaire 28,5%
Crédit Mutuel 31,6% BNP Paribas 28,9%
Banque Populaire 32,0% Société Générale 30,0%
Autres 32,8% Autres 31,2%
Société Générale 33,2% Non renseignée 31,3%
CIC 36,2% CIC 33,1%
Caisse d'Epargne 37,0% Caisse d'Epargne 33,2%
Crédit Lyonnais 37,4% Crédit Lyonnais 33,8%
La banque postale 46,6% La banque postale 42,9%
35,0%Pas de prélèvement
auto. avant et après
PREMIERE PARTIE : Prédiction de l’acte de résiliation des sans antécédent d’assurance
Isabelle VIDAL – Etudes sur les jeunes conducteurs
Direction de marché IARD – Auto des particuliers 44
Les taux de bon reclassement sont légèrement meilleurs que ceux précèdents avec 69.98% sur la base
d’apprentissage et 70.12% sur la base de test.
Cependant dans un processus opérationnel où le scoring de résiliation serait intégré dans le calcul
de la prime du client, il est nécessaire de connaitre toutes les informations permettant de déterminer ce
scoring en amont du paiement. C’est pour cette raison que nous gardons l’arbre de décision en figure 5-2.
La résiliation des sans antécédent est une variable qui peut s’avérer discriminante de sa sinistralité
aujourd’hui. C’est dans cette optique que nous créons cette variable que nous utiliserons comme variable
explicative dans la tarification de la garantie RC des jeunes conducteurs.
En résumé :
Dans un deuxième temps, l’acte de résiliation est modélisé à l’aide des arbres de décision. Ceux-ci se sont montrés plus performants que les régressions dans la littérature et il est une fois de plus démontré ici que c’est le cas. L’algorithme utilisé pour la modélisation est celui de CART. Le résultat de cet algorithme est un arbre binaire c’est-à-dire que deux nœuds fils sont issus de chaque nœud parent.
L’arrêt d’un arbre de décision se fait lorsqu’un certain pourcentage est atteint dans chaque case finale. Les arbres de décisions retenus sont ceux à 5, 7 et 8 classes.
Les variables les plus discriminantes et qui interviennent dans la modélisation sont semblables à celles obtenues par la régression logistique : la clause « enfant d’assuré », l’ancienneté de permis, le fractionnement, le niveau de garantie, le segment du véhicule et le nombre de permis au foyer. Le taux de bon reclassement issu de cette modélisation est de 70% soit 3 points de plus que par la régression logistique.
La variable contenant les probabilités de résiliation est créée et sera intégrée dans la modélisation du prix de la garantie RC en tant que facteur explicatif.
DEUXIEME PARTIE
VARIABLES EXPLICATIVES ET
MODELISATION DE LA GARANTIE RC
DEUXIEME PARTIE : Variables explicatives et modélisation de la garantie RC
Isabelle VIDAL – Etudes sur les jeunes conducteurs
Direction de marché IARD – Auto des particuliers 46
1 CONSTITUTION DE LA BASE DE DONNEES FINALE /
La deuxième étape de cette étude est de tarifer la garantie RC pour les jeunes conducteurs. Nous
décidons de nous baser sur un champ plus vaste en considérant comme jeunes conducteurs les sans
antécédent ainsi que les assurés de moins de 30 ans. Nous aurons besoin de plusieurs types de
variables :
- Les variables conducteurs ;
- Les variables géographiques ;
- Les variables véhicules ;
- Les variables relatives aux sinistres.
1.1 Périmètre de l’étude
Nous nous sommes basés sur le périmètre suivant :
- Les 5 années de 2008 à 2012 ;
- Les 5 régions AXA France : Ile-de-France, Nord-est, Ouest, Sud-est et Sud-ouest ;
- Les véhicules à quatre roues standard hors véhicules spéciaux : voiturettes, collection et camping-
cars ;
- Les personnes physiques, hors sociétés ;
- Les contrats non temporaires ;
- Le produit Auto 4 roues standard ;
- Tous les sans antécédent de n’importe quel âge ;
- Les jeunes de moins de 30 ans avec antécédents ;
- La garantie Responsabilité Civile : 63% des sans antécédent sont en niveau 1 et 40% de la base
sont en niveau 1.
DEUXIEME PARTIE : Variables explicatives et modélisation de la garantie RC
Isabelle VIDAL – Etudes sur les jeunes conducteurs
Direction de marché IARD – Auto des particuliers 47
1.2 Description des bases de données
Base sinistres
Nous commençons par récupérer les données sur les sinistres. A chaque mouvement du sinistre, il y a
création d’une image avec une date d’observation uniquement dans la table où il y aura un changement.
Nous avons eu recours à 4 tables sinistres pour créer notre base sinistre :
- La table SINIFIX correspond aux sinistres fixes. Nous y récupérons la date de survenance du
sinistre.
- La table UPAGR correspond aux agrégats par Unité de Prestations (UP). Nous y récupérons
l’information suivante (charge totale du sinistre par UP (RCA : RC matérielle ou RCORP : RC
corporelle)) et nous ne conservons que les sinistres RCA et RCORP.
- La table SINAGR correspond aux agrégats sinistres. Nous récupérons le montant des charges de
sinistres.
- La table SINIMAG correspond aux sinistres images. Nous obtenons des variables qui vont expliquer
le sinistre comme par exemple la nature du sinistre ou encore le niveau de responsabilité qui nous
permettra par la suite de distinguer la charge matérielle responsable et non responsable.
Nous décidons de garder les sinistres avec un vieillissement d’un an. Si le sinistre est clos moins d’un an
après la date d’ouverture alors nous conservons l’image la plus récente. Si le sinistre est clos plus d’un an
après la date d’ouverture, nous gardons l’image la plus proche de la date d’anniversaire de la survenance
du sinistre.
Enfin, nous nous sommes arrangés pour n’avoir qu’une ligne par sinistre. Cela signifie que lorsque deux
UP sont ouvertes sur le même sinistre, les caractéristiques de ces deux UP seront sur la même ligne.
La base « sinistres » est à présent complète.
Base véhicules
Dans cette base, nous récupérons les caractéristiques du véhicule à partir du fichier des véhicules
fourni par SRA (Sécurité et Réparation Automobile). Nous retrouvons des caractéristiques techniques
comme le poids total en charge, la vitesse maximale, la puissance et des caractéristiques commerciales
comme le modèle, la classe de prix, la marque. La caractéristique unique d’un véhicule est son code GTA.
Elle nous permet de relier le fichier des véhicules au fichier des assurés.
Nous définissons les classes de prix et de réparation des véhicules comme suivant : les véhicules avec
une classe A correspondent aux véhicules les moins onéreux alors que les véhicules les plus chers ont une
classe Z.
Base « assurés »
La première étape est d’extraire la base RT : Résultats techniques. Elle regroupe les
caractéristiques des assurés. Des modifications ont été apportées à cette base comme la création de
nouvelles variables déjà présentes dans la tarification actuelle.
Dans un deuxième temps, il a fallu supprimer les groupements. Ce sont par exemple les entreprises qui
assurent leurs salariés collectivement.
DEUXIEME PARTIE : Variables explicatives et modélisation de la garantie RC
Isabelle VIDAL – Etudes sur les jeunes conducteurs
Direction de marché IARD – Auto des particuliers 48
Clause « Bonus parental » de l’offre jeunes
La clause « bonus parental » est obtenue lorsque le sans antécédent est un enfant d’assuré AXA de moins
de 25 ans dont un des parents a un contrat Auto avec un Bonus/Malus de 50% et sans sinistre dans les 36
derniers mois (tolérance 1 bris de glace), cette clause a été mise en place le 13 février 2012 avec l’offre
« jeunes conducteurs ». Il a donc été nécessaire de reconstituer la clause sur les années 2008 à 2012.
Il existe une variable « contrat associé » dans la base des résultats techniques qui représente le numéro
de contrat associé au contrat en cours.
Tout d’abord, nous établissons notre base contenant seulement tous les sans antécédent ainsi que les
personnes ayant moins de 30 ans. Par la suite, nous regardons si les contrats associés des sans
antécédent sont bonus 50 et sans sinistre depuis les 36 derniers mois. Ces contrats-là possèderont
dorénavant la clause « Bonus parental ».
Mise en place de variables en quarts d’années
Actuellement, les contrats sont tarifés en prenant en compte l’âge entier du conducteur, ce qui ne nous
permet pas de savoir le temps qui s’est écoulé depuis leur dernier anniversaire. Nous proposons alors de
prendre en compte l’âge du conducteur, l’ancienneté du véhicule et l’ancienneté de permis en quarts
d’années.
Il est important de remarquer que l’âge est un des facteurs les plus importants dans la tarification. Une
segmentation plus fine des trois variables précédentes dans la tarification pourrait permettre à l’assuré de
payer une prime plus adéquate à son risque.
1.3 Modification de la charge RC
Il est nécessaire de retraiter la répartition des charges de sinistres du portefeuille correspondant aux
charges Responsabilité Civile matérielle et corporelle.
1.3.1 Mutualisation des charges fixes en RC matérielle
Le but est de mutualiser les montants fixes issus des conventions IRSA-IDA et des coûts
d’ouverture des sinistres. En effet, ces montants ne constituent pas des montants « réels » et peuvent
biaiser notre étude par la suite. Nous pouvons remarquer sur les graphiques suivants qu’une loi de
probabilité peut être facilement adaptée à notre répartition de charge après mutualisation des charges
fixes.
DEUXIEME PARTIE : Variables explicatives et modélisation de la garantie RC
Isabelle VIDAL – Etudes sur les jeunes conducteurs
Direction de marché IARD – Auto des particuliers 49
0
2000
4000
6000
8000
10000
12000
14000
16000
18000
20000
10
0
40
0
70
0
10
00
13
00
16
00
19
00
22
00
25
00
28
00
31
00
34
00
37
00
40
00
43
00
46
00
49
00
Répartition de la charge RC matérielle après mutualisation
Nombre de sinistres RC matériels par montant de charge
0
2000
4000
6000
8000
10000
12000
14000
16000
18000
20000
10
0
40
0
70
0
10
00
13
00
16
00
19
00
22
00
25
00
28
00
31
00
34
00
37
00
40
00
43
00
46
00
49
00
Répartition de la charge RC matérielle avant mutualisation
Nombre de sinistres RC matériels par montant de charge
Figure 1-1 . Répartition de la charge RC matérielle avant et après mutualisation des charges fixes
Pour des raisons de simplification et de rapidité de gestion de sinistres, différents assureurs
automobiles ont mis en place les conventions IRSA (Indemnisation Règlement des Sinistres Automobiles)
– IDA (Indemnisation Directe de l’Assuré). Le principe est de se faire indemniser par son propre assureur
et non par l’assureur adverse. Ainsi, les assurés sont indemnisés plus rapidement selon un barème
forfaitaire de responsabilité.
Degré de responsabilité
≤ 2010 2011 – 2012 ≥ 2013
100% 1204 € 1236 € 1242 €
50% 602 € 618 € 621 €
Tableau 1-1 . Barème forfaitaire de responsabilité des conventions IRSA-IDA
De même, lorsqu’un sinistre est ouvert, le montant que nous lui attribuons est forfaitaire. Les coûts
d’ouverture des sinistres sont recensés ci-dessous :
Degré de responsabilité
2008 - 2011 2012 2013
100% 1366 € 1414 € 1435 €
50% 683 € 707 € 717,5 €
Tableau 1-2 . Coûts d’ouverture des sinistres par responsabilité
La somme de ces montants est ensuite répartie selon la part de prime de l’assuré. Le choix de la
répartition a été obtenu par la méthode des moindres carrés. En effet, nous avions imaginé plusieurs
répartitions possibles comme par exemple répartir sur tout le portefeuille ou seulement sur les sinistrés.
DEUXIEME PARTIE : Variables explicatives et modélisation de la garantie RC
Isabelle VIDAL – Etudes sur les jeunes conducteurs
Direction de marché IARD – Auto des particuliers 50
La méthode des moindres carrés permet de comparer des données expérimentales à un modèle
mathématique sensé décrire ses données. Le but est donc de choisir la méthode qui minimise l’erreur.
Finalement, la répartition de la charge totale fixe s’est faite seulement sur les sinistrés. Cela peut
s’expliquer par le fait que la fréquence des sinistres RC matérielle est relativement importante. En effet, la
fréquence des sinistres RC matérielle est douze fois plus importante que celle des sinistres RC corporelle.
1.3.2 Ecrêtement et mutualisation des sinistres graves en RC corporelle
L’hypothèse classique en tarification automobile est celle selon laquelle les risques du portefeuille
sont similaires. La présence des sinistres graves perturbe cette hypothèse. Pour résoudre ce problème, les
sinistres graves sont souvent écrêtés jusqu’à un seuil maximum qu’il faut calculer.
Le choix de ce plafond est obtenu par la méthode suivante : nous choisissons le montant à partir duquel la
sur-crête représente 1% du nombre de sinistres et/ou 50% de la charge totale RC corporelle.
Nous commençons à chercher ce seuil pour chaque année de 2008 à 2012.
Année d’étude Nombre d’années polices Montant à partir duquel la sur-crête représente 1% du nombre
de sinistres
2008 608 086,43 213 989,91 €
2009 608 602,65 208 860,53 €
2010 569 577,67 234 141,00 €
2011 514 474,18 229 370,05 €
2012 484 104,85 202 670,00 €
Montant moyen sur les cinq années : 217 864,09 €
Tableau 1-3 . Montants par année à partir desquels la sur-crête représente 1% du nombre de sinistres
Par la suite, nous avons testé plusieurs montants de seuil en tenant compte du montant moyen
trouvé précédemment mais aussi le montant qui est utilisé actuellement dans la tarification, à savoir
150 000 €.
DEUXIEME PARTIE : Variables explicatives et modélisation de la garantie RC
Isabelle VIDAL – Etudes sur les jeunes conducteurs
Direction de marché IARD – Auto des particuliers 51
Seuil d’écrêtement Pourcentage du nombre de
sinistres RC corporels supérieur au seuil
Pourcentage de la charge totale RC corporelle supérieure
au seuil
150 000 € 1,44 % 55,14 %
200 000 € 1,12 % 51,61 %
220 000 € 0,97 % 49,60 %
230 000 € 0,91 % 48,65 %
240 000 € 0,88 % 48,30 %
Tableau 1-4 . Pourcentages par année du nombre de sinistre et du total de la charge RC corporelle supérieur au seuil
Enfin, nous décidons de garder deux montants : celui qui est déjà utilisé dans la tarification actuelle
150 000€ et celui que nous avons trouvé sur notre base de données 220 000€.
La charge résiduelle, appelée la sur-crête, est répartie sur tout le portefeuille selon la relation suivante :
𝑀𝑢𝑡𝑢𝑎𝑙𝑖𝑠𝑎𝑡𝑖𝑜𝑛 = 𝐸𝑐𝑟ê𝑡𝑒 + 𝑆𝑢𝑟 − 𝑐𝑟ê𝑡𝑒
𝑃𝑎𝑟𝑡 𝑑𝑒 𝑝𝑟𝑖𝑚𝑒
Le choix de répartir sur tout le portefeuille provient de l’étude faite par la méthode des moindres carrés
pour comparer plusieurs répartitions possibles. La fréquence des sinistres RC corporelle est de l’ordre de
1%, il est donc plus judicieux de répartir sur tout le portefeuille.
En résumé :
Les montants de la charge sinistre RC matérielle fixe issue des conventions IRSA-IDA et des coûts d’ouverture des sinistres sont répartis sur les sinistrés selon la part de prime.
L’écrêtement de la charge RC corporelle a été écrêté à 150 000 € (écrêtement dans le tarif actuel) et à 220 000 € (seuil à partir duquel la sur-crête représente 1% du nombre de sinistres et/ou 50% de la charge totale RC corporelle) et la mutualisation de ces montants est faite sur tout le portefeuille selon la part de prime.
DEUXIEME PARTIE : Variables explicatives et modélisation de la garantie RC
Isabelle VIDAL – Etudes sur les jeunes conducteurs
Direction de marché IARD – Auto des particuliers 52
1.4 Typologie de la base de données finale
1.4.1 Description des variables à expliquer
Les variables décrivant la sinistralité sont les suivantes :
Le nombre de sinistres
Cette variable recense le nombre de sinistres déclarés par l’assuré et non pas le nombre de
sinistres réels que l’assuré a pu subir ou causer.
Le coût des sinistres
Il s’agit du montant des sinistres vus avec un vieillissement d’un an.
Les indicateurs expliquant les sinistres
Trois indicateurs rentrent en jeu dans la tarification des garanties en assurance automobile. Ce sont
ces trois indicateurs que nous allons modéliser dans la suite de l’étude. Ils sont calculés comme suit :
La fréquence de sinistres
𝐹𝑟é𝑞𝑢𝑒𝑛𝑐𝑒 𝑑𝑒 𝑠𝑖𝑛𝑖𝑠𝑡𝑟𝑒𝑠 =𝑁𝑜𝑚𝑏𝑟𝑒 𝑑𝑒 𝑠𝑖𝑛𝑖𝑠𝑡𝑟𝑒𝑠
𝐴𝑛𝑛é𝑒𝑠 𝑝𝑜𝑙𝑖𝑐𝑒
Le coût moyen
𝐶𝑜û𝑡 𝑚𝑜𝑦𝑒𝑛 = 𝐶ℎ𝑎𝑟𝑔𝑒 𝑡𝑜𝑡𝑎𝑙𝑒
𝑁𝑜𝑚𝑏𝑟𝑒 𝑑𝑒 𝑠𝑖𝑛𝑖𝑠𝑡𝑟𝑒𝑠
La prime pure
Elle représente le montant attendu des sinistres pour la période d’assurance étudiée. Elle est
calculée de la façon suivante :
𝑃𝑟𝑖𝑚𝑒 𝑝𝑢𝑟𝑒 = 𝐶ℎ𝑎𝑟𝑔𝑒 𝑡𝑜𝑡𝑎𝑙𝑒
𝐴𝑛𝑛é𝑒𝑠 𝑝𝑜𝑙𝑖𝑐𝑒= 𝐹𝑟é𝑞𝑢𝑒𝑛𝑐𝑒 ∗ 𝐶𝑜û𝑡 𝑚𝑜𝑦𝑒𝑛
1.4.2 Quelques chiffres concernant la base de données finale
Nous présentons ci-dessous quelques chiffres clés de notre base de données :
- 2,78 millions d’années police ;
- 333 578 sinistres matériels, soit une fréquence de 11,98% ;
- 27 898 sinistres corporels dont 87% d’entre eux ont également conduit à l’ouverture de sinistres
matériels, soit une fréquence de 1% ;
- 283,4 millions de charge RC matérielle avant mutualisation des charges matérielles fixes;
- 319,2 millions de charge RC matérielle après mutualisation, dû aux sinistres négatifs passés à zéro;
- 281,5 millions de charge RC corporelle avant et après écrêtement et mutualisation.
Par la suite, cette base est divisée en deux parties. La première partie est notre base d’apprentissage et
représente 70% de notre base totale. Les 30% restants nous serviront de base de test pour valider notre
modèle construit sur la base d’apprentissage.
DEUXIEME PARTIE : Variables explicatives et modélisation de la garantie RC
Isabelle VIDAL – Etudes sur les jeunes conducteurs
Direction de marché IARD – Auto des particuliers 53
2 ETUDE SUR NOS VARIABLES TARIFAIRES /
2.1 Tris à plat
2.1.1 Evolution des indicateurs selon les variables tarifaires
Tout d’abord, il est intéressant d’effectuer des statistiques descriptives sur les variables les plus
susceptibles d’intervenir dans nos modèles de fréquence, de coût moyen et de prime pure.
Dans toute la suite des statistiques descriptives, les années polices seront représentées par des
histogrammes bleus. Nous observerons également (avec la charge de sinistres écrêtée à 150 000 €) :
- La prime pure sur la courbe bleue claire
- La fréquence de sinistres sur la courbe bleue foncée
- Le coût moyen de sinistres sur la courbe rouge
Dans un souci de confidentialité, les tris à plats sont donnés en base 100. Tous les tris à plat sont
présentés en Annexe 4.
Le coefficient réduction majoration
Le coefficient réduction majoration correspond à un bonus ou un malus appliqué à la cotisation d’un
automobiliste en fonction qu’il commette ou non un accident responsable. Le coefficient de départ est fixé à
1.
Figure 2-1 . Evolution de la prime pure selon le coefficient réduction / majoration
FIGURE 1-3 . COMPARAISON DU TARIF ACTUEL ET DE LA PRIME PURE DU MODELE JEUNES SUR LA VARIABLE REGLE
DE TARIF ............................................................................................................................................... 97
FIGURE 1-4 . COMPARAISON DU TARIF ACTUEL ET DE LA PRIME PURE DU MODELE JEUNES SUR LA VARIABLE AGE
DU CONDUCTEUR .................................................................................................................................. 97
FIGURE 1-5 . COMPARAISON DES RESULTATS TECHNIQUES DU TARIF ACTUEL ET DU TARIF JEUNES SUR LA
VARIABLE ANCIENNETE DE PERMIS EN QUARTS D'ANNEES ......................................................................... 98
FIGURE 1-6 . COMPARAISON DES RESULTATS TECHNIQUES DU TARIF ACTUEL ET DU TARIF JEUNES SUR LA