Master MARKETING / Pierre Desmet 1 Analyse des données appliquée au marketing 3. Expérimentation Pierre DESMET
Master MARKETING / Pierre Desmet 1
Analyse des donnéesappliquée au marketing
3. Expérimentation
Pierre DESMET
SommaireSommaire
© P
ier r
e D
ESM
ET
1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 2
Sommaire général
1. Introduction
2. Tests
3. Expérimentation et Analyse de Variance
4. Analyses factorielles et des similarités
5. Typologies et Segmentation
6. Régression logistique et Analyse discriminante
7. Mesure et Méthodes avancées
8. Régression
SommaireSommaire
© P
ier r
e D
ESM
ET
1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 3
3. Expérimentation et Analyse de variance
Expérimentation : faire varier de manière contrôlée une variable pour
mesurer son effet sur une autre Mesurer une relation causale
Plan d’expérience
Analyse des résultats Une variable à expliquer (métrique)
1 facteur contrôlé nominal : ANOVA Plusieurs facteurs ANOVA 1 facteur + covariable : ANCOVA
Plusieurs variables à expliquer (métriques) MANOVA MANCOVA
SommaireSommaire
© P
ier r
e D
ESM
ET
1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 4
Causalité et Expérimentation
On cherche à mettre en évidence une relation de cause à effet entre X et Y
Conditions à respecter pour établir la relation causale Variation concomitante (dx, dy) Séquence temporelle / Présence manipulée Élimination des autres causes possibles Indépendance (Orthogonalité) des variables dépendantes entre
elles
Quasi-expérimentation si pas d’affectation aléatoire des individus Exemple mesure Avant-après sur un seul groupe
Variables VI (indépendantes, X) VD (dépendante, Y)
VI manipulée (pack) ou VI invoquée (groupage des individus sur les modalités)
SommaireSommaire
© P
ier r
e D
ESM
ET
1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 5
Procédure
Définition de la question marketing : Quel est l’effet de la mention sur le pack sur les ventes du produit
?
Construction de la base théorique Les variables situationnelles :
Evaluatives : Attention, perception, préférence, choix Attitude (envers l’annonce, la marque,..) Valeur perçue, satisfaction, fidélité
Intermédiaires : risque perçu,
Les variables modératrices : Individuelles : genre, revenu, csp,… Psychologiques stables : aversion pour le risque,… Interactives : relation à la marque, implication produit,…
SommaireSommaire
© P
ier r
e D
ESM
ET
1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 6
Le modèle
Rédiger clairement les hypothèses pour pouvoir les rejeter H1 : La mention « sans colorant » accroît la préférence pour le pack
H1a M(sans) > M(avec) - H1b M(sans)<= M(avec) H2 : Plus la sensibilité à la présence de colorants est forte, plus l’effet de la
mention sur la préférence est élevé. H2a [M(sans,s+) - M(avec,s+) ] > [M(sans,s-) - M(avec,s-) ]
X Y X YZ
Relation de causalité Relation avec médiatrice
X Y
Z
Relation avec modératrice
+
Mention surLe pack
PréférencePour le pack
Sensibilitéaux colorants
Mention surLe pack
Naturalitéperçue
Sensibilitéaux colorants
PréférencePour le pack
SommaireSommaire
© P
ier r
e D
ESM
ET
1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 7
Construire un modèle utile
De la gauche vers la droite : le chemin de l’influence de X sur Y
Puis de la droite vers la gauche : les autres variables importantes qui peuvent influencer Y et qu’il
faut mesurer ou contrôler
Identifier Les hypothèses « validées » (par les connaissances, l’expérience,
le quali..) Les hypothèses « à valider »
Exemple : Maggi souhaite lancer un sachet de soupe déshydratée en 5
assiettes au lieu de 4 … Proposez un modèle
SommaireSommaire
© P
ier r
e D
ESM
ET
1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 8
Plan Inter ou Intra-sujets
Démarche Un échantillon représentatif : accent sur les relations et l’effet
Préférence pour le pack A versus B Des groupes différents : accent sur les modérateurs
Clients de la marque / versus concurrence
Comment éliminer les spécificités personnelles ? Neutraliser : affectation aléatoire à un groupe
Un groupe n’évalue qu’une option les groupes « identiques »
Contrôler par des mesures répétées Un seul groupe qui évalue les options Mais effet de la méthodologie (ordre de la présentation,..)
SommaireSommaire
© P
ier r
e D
ESM
ET
1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 9
Validité des résultats
Interne : Force de la conclusion Facteurs non pris en compte dans l’analyse
Le temps La répétition L’environnement Les mesures L’interaction des répondants avec la méthodologie La modification de l’échantillon (mortalité) L’affectation des répondants
Externe : Généralité de la conclusion Représentativité des répondants Représentativité-réalisme des stimulis Contexte expérimental
SommaireSommaire
© P
ier r
e D
ESM
ET
1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 10
Les causes possibles des variations
Il faut isoler ces effets
Traitement (E) Effet de la manipulation
Histoire (H) évolution de l’environnement
Contamination (I) Modification des réponses en fonction de la connaissance de l’objet de l’expérimentation (effet de demande)
Maturation (M) évolution des sujets (t, t+n)
Test (T) Changement des réponses, ou biais, provoqué par la mesure
Sélection (S) Variation dans la composition de l’échantillon : Auto-sélection; échantillonnage; non réponse
Instrumentation Changement dans l’instrument de mesure (enquêteur,…)
Régression statistique Présence de valeurs extrêmes; sélection successive en fonction de réponses précédentes
Mortalité Réduction de l’échantillon par le refus de participation : collecte contraignante
SommaireSommaire
© P
ier r
e D
ESM
ET
1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 11
Plans expérimentaux
Grandes classes Quasi-expérimental : Avant-Après Expérimental
Double affectation aléatoire des individus aux cellules ; des traitements aux cellules
Observation – Mesure Traitement
Quelles comparaisons Entre les groupes d’individus Entre les réponses d’un même groupe
Après seulement – Groupe de contrôle
Groupe 1 A X O1
Groupe 2 A O2Avant - Après – Groupe de contrôle
Groupe 1 A O1 X O2
Groupe 2 A O3 O4Solomon 4 groupes
Groupe 1 A O1 X O2
Groupe 2 A O3 O4
Groupe 3 A X O5
Groupe 4 A O6
A
O
X
SommaireSommaire
© P
ier r
e D
ESM
ET
1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 12
Mesure des effets
Source : Lambin JJ La recherce Marketing, McGraw Hill
X O1 ?
O1 X O2 O2-O1 E H I M (T) (S)
X O1
O2 O2-O1 E (T) (S)
O1 X O2 O2-O1 E H I M (T) (S)
O3 O4 O4-O3 H M (T) (S)
(O2-O1)-(O4-O3) E I
O1 X O2 D1= O2-O1 E H I M (T) (S)
O3 O4 D2= O4-O3 H M (T) (S)
X O5 D3= O5-(O2+O4)/2 E H (T) (S)
O6 D4= O6-(O2+O4)/2 H (S)
O6 D5= O6-O5 E (T) (S)
D4-D3 = E
D3-D5 = H
D1-D3-(D2-D4)
= I
D2-D4 = M
D4+D5-D3 = (T) (S)
SommaireSommaire
© P
ier r
e D
ESM
ET
1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 13
Plans statistiques
Mise en évidence de l’effet de plusieurs facteurs Effet du prix sur Des magasins de tailles différentes Situés dans des régions différentes
Plans Complet : toutes les possibilités
Permet de tester les effets d’interaction Fractionné : combinaison choisie des modalités
Moins de cellules donc gourmand en effectifs
SommaireSommaire
© P
ier r
e D
ESM
ET
1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 14
Plans statistiques complets
Plan factoriel : 2 variables (X, Y), même nombre de modalités (2) 3 modalités -> 3² groupes = 9 groupes 3 var, 3 modalités ->27 groupes
Plan factoriel en blocs aléatoires Groupage des individus selon une variable à contrôler
Plan factoriel 2 variables
X y
Groupe 1
1 1
Groupe 2
1 2
Groupe 3
2 1
Groupe 4
2 2
SommaireSommaire
© P
ier r
e D
ESM
ET
1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 15
Plans statistiques fractionnés
Carré latin : 3 variables (X, Y, Z), même nombre de modalités (3) le groupe 3 reçoit [3, 1, 2]
Autres tailles Gréco-latin : 4 variables Hyper-gréco-latin : 5 variables
Carré latin 3 variables
X1 X2 X3
Y1 Z1 Z3 Z2
Y2 Z3 Z2 Z1
Y3 Z2 Z1 Z3
3
SommaireSommaire
© P
ier r
e D
ESM
ET
1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 16
Modèle linéaire d’effets indépendants Une moyenne générale () Des effets spécifiques par facteur (i) pour la modalité i du facteur
I Des effets d’interaction (ii) ) Une variable aléatoire () qui dépend des facteurs (i,j) mais aussi
de l’observation (k)
Mesures dans les cellules (combinaison de traitements) Normalité Égalité des variances, surtout si les effectifs sont différents Homogénéité des covariances (échantillons appariés)
Terminologie Variations totales, Factorielles, Résiduelles Variations ou Somme de carrés (ex : VF = ni (mx1 – mx.)2 )
Analyse de variance : Postulats
Yijk i j (i j ) k
SommaireSommaire
© P
ier r
e D
ESM
ET
1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 17
Analyse de variance
Hypothèse Les effets sont linéaires : X = Moyenne + effet du facteur + erreur Hypothèse
H1a : 1 = 2 =3 pas de différence de moyenne entre niveaux H1b : au moins une moyenne est différente des autres
Les facteurs contrôlés sont différents ENTRE les groupes mais identiques à l'intérieur de chaque groupe (VF variations factorielles)
Les facteurs incontrôlés ont la même influence quel que soit le groupe (VR variations résiduelles)
Le théorème de la décomposition de la variance (intra et inter) VT=VF+VR
xik x ki
2 xi x i
2 xik xi
ki
2
SommaireSommaire
© P
ier r
e D
ESM
ET
1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 18
Qualité globale : Test F de Fisher
Test de la qualité globale du modèle I = nombre de niveaux du facteur, N= nombre d’observations (I-1; N-1) degrés de liberté
Interprétation H0 : aucune effet de X sur Y (moyenne identique) Si F calc > F critique : rejet de H0
F( I 1,N 1) Variat Factorielle / ( I 1)
Variat Résiduelle / (N I )Variance factorielle
Variance résiduelle
SommaireSommaire
© P
ier r
e D
ESM
ET
1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 19
Rapport de corrélation - êta carré (2)
Si le F diagnostique l’existence d’une relation, eta carré détermine la force de cette relation
Mesure d’association entre une variable quantitative et une variable non quantitative (nominale ou ordinale) Ex : pouvoir explicatif du genre sur le montant des dépenses
Eta2 = Variations expliquées / Variations totales Eta2 e [0, 1]
S’interprète comme le % des variations de la variable quantitative expliquées par la variable nominale/ordinale
SommaireSommaire
© P
ier r
e D
ESM
ET
1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 20
Exemple de lecture
Effet du prix sur les ventes des magasins (q)
3 niveaux de prix
4 types de magasin, 30 observations par magasin
Relation globalement significative (F) Mais Faible (Eta2 ou R2)
Effet du prix Significatif (t) Dans quel sens ? (demander solution)
SommaireSommaire
© P
ier r
e D
ESM
ET
1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 21
Analyse de variance multivariée : Les interactions
Les effets de variables peuvent se combiner pour S’amplifier ou Se neutraliser
Variabledépendante
Variable indépendante
Sans interactinn
Interactinn dis-ordinaleAvec croisement
Interactinn dis-ordinaleSans croisement
Interactinn ordinale
SommaireSommaire
© P
ier r
e D
ESM
ET
1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 22
2 facteurs avec interaction
Effet du magasin Significatif
Effet de l’interaction Significative
Amélioration de la qualité globale
Attention ! Les effets d’interaction sont toujours à analyser d’abord Car ils changent l’interprétation des effets directs
Yijk i j (i j ) k
SommaireSommaire
© P
ier r
e D
ESM
ET
1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 23
Problème des comparaisons multiples
Quand il y a plusieurs groupes, les tests en t (2 groupes) ne sont pas adaptés
Car pour chaque test d’hypothèse, on additionne les risques d’erreur alpha pour k groupes : k.(k-1)/2 comparaisons… Pour 3 groupes avec un risque alpha=5%, la probabilité
qu’aucune comparaison ne soit significative est (0.95*0.95*0.95)=0.857 soit un risque alpha réel de 14.3%
Objectif des corrections Comparer les moyennes des groupes en contrôlant pour l’inflation
des risques (type I) pour toutes les comparaisons Garder un risque a de 5% pour toutes les comparaisons => le
risque pour chaque comparaison sera d’autant plus petit que le nombre de comparaisons est important
SommaireSommaire
© P
ier r
e D
ESM
ET
1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 24
Bonferroni, Scheffé, Dunnett
Comparaison a priori ou a posteriori des groupes
Corrections pour des comparaisons multiples
Dunn-Bonferroni : (la correction plus simple a priori) corrigé = / nombre de tests. 5%-> 1% si 5 comparaisons
Autres tests ( a posteriori) Dunnett : les groupes sont comparés à un groupe de contrôle
Contrastes non orthogonaux - Usage fréquent Tukey HSD:
Compare toutes les paires possibles adapté s’il y a de nombreux groupes à comparer
Scheffé : très conservateur mais accepte des groupes inégaux. Correction pour toutes les comparaisons possibles (paires ou
composées) en augmentant la différence critique. Une différence à elle seule doit être assez grande pour rendre
le F global significatif.
SommaireSommaire
© P
ier r
e D
ESM
ET
1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 25
Test des différences
Bonferroni (test en t) Scheffé (test en F)
SommaireSommaire
© P
ier r
e D
ESM
ET
1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 26
Contrastes
un test a priori de différences de moyennes (hypothèse préalable)
Un Contraste est une somme pondérée des moyennes dont la valeur attendue sous H0 est nulle C = a1.1 + a2.2 + a3.3
Comparaison sur une combinaison linéaire de plusieurs groupes Test d’une combinaison linéaire des (nb groupes-1) contrastes Si a = [1 0 –1] alors on a C = 1 - 3
Si a = [1 –1/2 –1/2] alors on a C = 1 - 0.5 2 -0.5 3
Contrastes particuliers Helmert (groupes ordonné)
[-1 1 0 0] [-1 -1 2 0] [-1 -1 -1 3] Contraste polynomial
Prise en compte successive d’un trend linéaire, quadratique, cubique
SommaireSommaire
© P
ier r
e D
ESM
ET
1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 27
Contrastes orthogonaux
Des Contrastes orthogonaux sont indépendants les uns des autres
Pour que 2 contrastes soient orthogonaux, il faut que la Somme des produits des coefficients de chaque variable soit
NULLE Somme des coefficients d’un contraste soit NULLE
Exemple C1 : [ -1 0 1] et C2 : [ -1 2 -1] C1 : [ 1 -1 0 0] et C2 : [ 0 0 1 -1]
Générer des contraste orthogonaux : http://www.bolderstats.com/orthogCodes/
Tous les contrastes doivent être orthogonaux 2 à 2
Chaque contraste
a sa somme des carrés
a 1 degré de liberté au numérateur et ddl erreur au dénominateur.
SommaireSommaire
© P
ier r
e D
ESM
ET
1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 28
Type I Hiérarchique :
l’ordre détermine la prise en compte des variables. F de l’effet = SC de l’effet / SC des effets précédents
II Non expérimental F de l’effet = SC de l’effet / SC des effets de son niveau et des
niveaux inférieurs III Régression
F de l’effet = SC de l’effet / SC de tous les autres effets
Préconisations Type I si les variables ont un ordre d’importance ET les groupes de
taille identique Type II déconseillé Type III à privilégier (même si effectifs inégaux) : option par
défaut Approfondir : http://www.lsp.ups-tlse.fr/Doc_pedagogique/PDF/ab-deseq.pdf
Choix des sommes des carrés de Type I à III
SommaireSommaire
© P
ier r
e D
ESM
ET
1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 29
Moyennes et Moyennes estimées
Moyenne (MEAN) correspond à la moyenne arithmétique C’est la moyenne générale
Moyenne estimée (LSMEANS) correspond à la moyenne estimée par le modèle utilisé C’est la moyenne des moyennes des niveaux d’un facteur Elle est ajustée en fonction de la moyenne des variables
indépendantes
Elles sont différentes S’il y a des valeurs manquantes ou des effectifs différents S’il y a des variables explicatives (covariates)
SommaireSommaire
© P
ier r
e D
ESM
ET
1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 30
ANCOVA et MANOVA
ANCOVA Permet de tenir compte d’un facteur/variable que l ’on peut
mesurer mais non contrôler L’effet de la variable non contrôlé est éliminé d’abord avant de
prendre en compte les facteurs
MANOVA Prendre en compte plusieurs variables à expliquer (Y1, Y2, Y3) Voir s’il y a un effet global de la variable explicative Puis chercher sur quelle variable plus particulièrement il y a un
effet par des ANOVA
SommaireSommaire
© P
ier r
e D
ESM
ET
1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 31
Modèles mixtes
Les modèles mixtes prennent en compte la différence des répondants lors d’analyses de mesures répétées
Modèle de base Y = a + b.X + e
Introduction d’une constante par répondant (i) Yit = a + b.Xit + .i + eit
Prise en compte des variations des coefficients selon des caractéristiques des répondants (modèles multi-niveaux ou hiérarchiques) Yit = ai + bi.Xit + .i + it
ai = a + c.Zi + i
bi = b + d.Ki + i