Master MARKETING / Pierre Desmet 1 Analyse des données appliquée au marketing 3. Expérimentation Pierre DESMET.

Master MARKETING / Pierre Desmet 1

Analyse des donnéesappliquée au marketing

3. Expérimentation

Pierre DESMET

SommaireSommaire

© P

ier r

e D

ESM

ET

1 2 3 4 5 6 7 8Master Marketingde Paris-Dauphine 2

Sommaire général

1. Introduction

2. Tests

3. Expérimentation et Analyse de Variance

4. Analyses factorielles et des similarités

5. Typologies et Segmentation

6. Régression logistique et Analyse discriminante

7. Mesure et Méthodes avancées

8. Régression

SommaireSommaire

© P

ier r

e D

ESM

ET


3. Expérimentation et Analyse de variance

Expérimentation : faire varier de manière contrôlée une variable pour

mesurer son effet sur une autre Mesurer une relation causale

Plan d’expérience

Analyse des résultats Une variable à expliquer (métrique)

1 facteur contrôlé nominal : ANOVA Plusieurs facteurs ANOVA 1 facteur + covariable : ANCOVA

Plusieurs variables à expliquer (métriques) MANOVA MANCOVA

SommaireSommaire

© P

ier r

e D

ESM

ET


Causalité et Expérimentation

On cherche à mettre en évidence une relation de cause à effet entre X et Y

Conditions à respecter pour établir la relation causale Variation concomitante (dx, dy) Séquence temporelle / Présence manipulée Élimination des autres causes possibles Indépendance (Orthogonalité) des variables dépendantes entre

elles

Quasi-expérimentation si pas d’affectation aléatoire des individus Exemple mesure Avant-après sur un seul groupe

Variables VI (indépendantes, X) VD (dépendante, Y)

VI manipulée (pack) ou VI invoquée (groupage des individus sur les modalités)

SommaireSommaire

© P

ier r

e D

ESM

ET


Procédure

Définition de la question marketing : Quel est l’effet de la mention sur le pack sur les ventes du produit

?

Construction de la base théorique Les variables situationnelles :

Evaluatives : Attention, perception, préférence, choix Attitude (envers l’annonce, la marque,..) Valeur perçue, satisfaction, fidélité

Intermédiaires : risque perçu,

Les variables modératrices : Individuelles : genre, revenu, csp,… Psychologiques stables : aversion pour le risque,… Interactives : relation à la marque, implication produit,…

SommaireSommaire

© P

ier r

e D

ESM

ET


Le modèle

Rédiger clairement les hypothèses pour pouvoir les rejeter H1 : La mention « sans colorant » accroît la préférence pour le pack

H1a M(sans) > M(avec) - H1b M(sans)<= M(avec) H2 : Plus la sensibilité à la présence de colorants est forte, plus l’effet de la

mention sur la préférence est élevé. H2a [M(sans,s+) - M(avec,s+) ] > [M(sans,s-) - M(avec,s-) ]

X Y X YZ

Relation de causalité Relation avec médiatrice

X Y

Z

Relation avec modératrice

+

Mention surLe pack

PréférencePour le pack

Sensibilitéaux colorants

Mention surLe pack

Naturalitéperçue

Sensibilitéaux colorants

PréférencePour le pack

SommaireSommaire

© P

ier r

e D

ESM

ET


Construire un modèle utile

De la gauche vers la droite : le chemin de l’influence de X sur Y

Puis de la droite vers la gauche : les autres variables importantes qui peuvent influencer Y et qu’il

faut mesurer ou contrôler

Identifier Les hypothèses « validées » (par les connaissances, l’expérience,

le quali..) Les hypothèses « à valider »

Exemple : Maggi souhaite lancer un sachet de soupe déshydratée en 5

assiettes au lieu de 4 … Proposez un modèle

SommaireSommaire

© P

ier r

e D

ESM

ET


Plan Inter ou Intra-sujets

Démarche Un échantillon représentatif : accent sur les relations et l’effet

Préférence pour le pack A versus B Des groupes différents : accent sur les modérateurs

Clients de la marque / versus concurrence

Comment éliminer les spécificités personnelles ? Neutraliser : affectation aléatoire à un groupe

Un groupe n’évalue qu’une option les groupes « identiques »

Contrôler par des mesures répétées Un seul groupe qui évalue les options Mais effet de la méthodologie (ordre de la présentation,..)

SommaireSommaire

© P

ier r

e D

ESM

ET


Validité des résultats

Interne : Force de la conclusion Facteurs non pris en compte dans l’analyse

Le temps La répétition L’environnement Les mesures L’interaction des répondants avec la méthodologie La modification de l’échantillon (mortalité) L’affectation des répondants

Externe : Généralité de la conclusion Représentativité des répondants Représentativité-réalisme des stimulis Contexte expérimental

SommaireSommaire

© P

ier r

e D

ESM

ET


Les causes possibles des variations

Il faut isoler ces effets

Traitement (E) Effet de la manipulation

Histoire (H) évolution de l’environnement

Contamination (I) Modification des réponses en fonction de la connaissance de l’objet de l’expérimentation (effet de demande)

Maturation (M) évolution des sujets (t, t+n)

Test (T) Changement des réponses, ou biais, provoqué par la mesure

Sélection (S) Variation dans la composition de l’échantillon : Auto-sélection; échantillonnage; non réponse

Instrumentation Changement dans l’instrument de mesure (enquêteur,…)

Régression statistique Présence de valeurs extrêmes; sélection successive en fonction de réponses précédentes

Mortalité Réduction de l’échantillon par le refus de participation : collecte contraignante

SommaireSommaire

© P

ier r

e D

ESM

ET


Plans expérimentaux

Grandes classes Quasi-expérimental : Avant-Après Expérimental

Double affectation aléatoire des individus aux cellules ; des traitements aux cellules

Observation – Mesure Traitement

Quelles comparaisons Entre les groupes d’individus Entre les réponses d’un même groupe

Après seulement – Groupe de contrôle

Groupe 1 A X O1

Groupe 2 A O2Avant - Après – Groupe de contrôle

Groupe 1 A O1 X O2

Groupe 2 A O3 O4Solomon 4 groupes

Groupe 1 A O1 X O2

Groupe 2 A O3 O4

Groupe 3 A X O5

Groupe 4 A O6

A

O

X

SommaireSommaire

© P

ier r

e D

ESM

ET


Mesure des effets

Source : Lambin JJ La recherce Marketing, McGraw Hill

X O1 ?

O1 X O2 O2-O1 E H I M (T) (S)

X O1

O2 O2-O1 E (T) (S)

O1 X O2 O2-O1 E H I M (T) (S)

O3 O4 O4-O3 H M (T) (S)

(O2-O1)-(O4-O3) E I

O1 X O2 D1= O2-O1 E H I M (T) (S)

O3 O4 D2= O4-O3 H M (T) (S)

X O5 D3= O5-(O2+O4)/2 E H (T) (S)

O6 D4= O6-(O2+O4)/2 H (S)

O6 D5= O6-O5 E (T) (S)

D4-D3 = E

D3-D5 = H

D1-D3-(D2-D4)

= I

D2-D4 = M

D4+D5-D3 = (T) (S)

SommaireSommaire

© P

ier r

e D

ESM

ET


Plans statistiques

Mise en évidence de l’effet de plusieurs facteurs Effet du prix sur Des magasins de tailles différentes Situés dans des régions différentes

Plans Complet : toutes les possibilités

Permet de tester les effets d’interaction Fractionné : combinaison choisie des modalités

Moins de cellules donc gourmand en effectifs

SommaireSommaire

© P

ier r

e D

ESM

ET


Plans statistiques complets

Plan factoriel : 2 variables (X, Y), même nombre de modalités (2) 3 modalités -> 3² groupes = 9 groupes 3 var, 3 modalités ->27 groupes

Plan factoriel en blocs aléatoires Groupage des individus selon une variable à contrôler

Plan factoriel 2 variables

X y

Groupe 1

1 1

Groupe 2

1 2

Groupe 3

2 1

Groupe 4

2 2

SommaireSommaire

© P

ier r

e D

ESM

ET


Plans statistiques fractionnés

Carré latin : 3 variables (X, Y, Z), même nombre de modalités (3) le groupe 3 reçoit [3, 1, 2]

Autres tailles Gréco-latin : 4 variables Hyper-gréco-latin : 5 variables

Carré latin 3 variables

X1 X2 X3

Y1 Z1 Z3 Z2

Y2 Z3 Z2 Z1

Y3 Z2 Z1 Z3

3

SommaireSommaire

© P

ier r

e D

ESM

ET


Modèle linéaire d’effets indépendants Une moyenne générale () Des effets spécifiques par facteur (i) pour la modalité i du facteur

I Des effets d’interaction (ii) ) Une variable aléatoire () qui dépend des facteurs (i,j) mais aussi

de l’observation (k)

Mesures dans les cellules (combinaison de traitements) Normalité Égalité des variances, surtout si les effectifs sont différents Homogénéité des covariances (échantillons appariés)

Terminologie Variations totales, Factorielles, Résiduelles Variations ou Somme de carrés (ex : VF = ni (mx1 – mx.)2 )

Analyse de variance : Postulats

Yijk i j (i j ) k

SommaireSommaire

© P

ier r

e D

ESM

ET


Analyse de variance

Hypothèse Les effets sont linéaires : X = Moyenne + effet du facteur + erreur Hypothèse

H1a : 1 = 2 =3 pas de différence de moyenne entre niveaux H1b : au moins une moyenne est différente des autres

Les facteurs contrôlés sont différents ENTRE les groupes mais identiques à l'intérieur de chaque groupe (VF variations factorielles)

Les facteurs incontrôlés ont la même influence quel que soit le groupe (VR variations résiduelles)

Le théorème de la décomposition de la variance (intra et inter) VT=VF+VR

xik x ki

2 xi x i

2 xik xi

ki

2

SommaireSommaire

© P

ier r

e D

ESM

ET


Qualité globale : Test F de Fisher

Test de la qualité globale du modèle I = nombre de niveaux du facteur, N= nombre d’observations (I-1; N-1) degrés de liberté

Interprétation H0 : aucune effet de X sur Y (moyenne identique) Si F calc > F critique : rejet de H0

F( I 1,N 1) Variat Factorielle / ( I 1)

Variat Résiduelle / (N I )Variance factorielle

Variance résiduelle

SommaireSommaire

© P

ier r

e D

ESM

ET


Rapport de corrélation - êta carré (2)

Si le F diagnostique l’existence d’une relation, eta carré détermine la force de cette relation

Mesure d’association entre une variable quantitative et une variable non quantitative (nominale ou ordinale) Ex : pouvoir explicatif du genre sur le montant des dépenses

Eta2 = Variations expliquées / Variations totales Eta2 e [0, 1]

S’interprète comme le % des variations de la variable quantitative expliquées par la variable nominale/ordinale

SommaireSommaire

© P

ier r

e D

ESM

ET


Exemple de lecture

Effet du prix sur les ventes des magasins (q)

3 niveaux de prix

4 types de magasin, 30 observations par magasin

Relation globalement significative (F) Mais Faible (Eta2 ou R2)

Effet du prix Significatif (t) Dans quel sens ? (demander solution)

SommaireSommaire

© P

ier r

e D

ESM

ET


Analyse de variance multivariée : Les interactions

Les effets de variables peuvent se combiner pour S’amplifier ou Se neutraliser

Variabledépendante

Variable indépendante

Sans interactinn

Interactinn dis-ordinaleAvec croisement

Interactinn dis-ordinaleSans croisement

Interactinn ordinale

SommaireSommaire

© P

ier r

e D

ESM

ET


2 facteurs avec interaction

Effet du magasin Significatif

Effet de l’interaction Significative

Amélioration de la qualité globale

Attention ! Les effets d’interaction sont toujours à analyser d’abord Car ils changent l’interprétation des effets directs

Yijk i j (i j ) k

SommaireSommaire

© P

ier r

e D

ESM

ET


Problème des comparaisons multiples

Quand il y a plusieurs groupes, les tests en t (2 groupes) ne sont pas adaptés

Car pour chaque test d’hypothèse, on additionne les risques d’erreur alpha pour k groupes : k.(k-1)/2 comparaisons… Pour 3 groupes avec un risque alpha=5%, la probabilité

qu’aucune comparaison ne soit significative est (0.95*0.95*0.95)=0.857 soit un risque alpha réel de 14.3%

Objectif des corrections Comparer les moyennes des groupes en contrôlant pour l’inflation

des risques (type I) pour toutes les comparaisons Garder un risque a de 5% pour toutes les comparaisons => le

risque pour chaque comparaison sera d’autant plus petit que le nombre de comparaisons est important

SommaireSommaire

© P

ier r

e D

ESM

ET


Bonferroni, Scheffé, Dunnett

Comparaison a priori ou a posteriori des groupes

Corrections pour des comparaisons multiples

Dunn-Bonferroni : (la correction plus simple a priori) corrigé = / nombre de tests. 5%-> 1% si 5 comparaisons

Autres tests ( a posteriori) Dunnett : les groupes sont comparés à un groupe de contrôle

Contrastes non orthogonaux - Usage fréquent Tukey HSD:

Compare toutes les paires possibles adapté s’il y a de nombreux groupes à comparer

Scheffé : très conservateur mais accepte des groupes inégaux. Correction pour toutes les comparaisons possibles (paires ou

composées) en augmentant la différence critique. Une différence à elle seule doit être assez grande pour rendre

le F global significatif.

SommaireSommaire

© P

ier r

e D

ESM

ET


Test des différences

Bonferroni (test en t) Scheffé (test en F)

SommaireSommaire

© P

ier r

e D

ESM

ET


Contrastes

un test a priori de différences de moyennes (hypothèse préalable)

Un Contraste est une somme pondérée des moyennes dont la valeur attendue sous H0 est nulle C = a1.1 + a2.2 + a3.3

Comparaison sur une combinaison linéaire de plusieurs groupes Test d’une combinaison linéaire des (nb groupes-1) contrastes Si a = [1 0 –1] alors on a C = 1 - 3

Si a = [1 –1/2 –1/2] alors on a C = 1 - 0.5 2 -0.5 3

Contrastes particuliers Helmert (groupes ordonné)

[-1 1 0 0] [-1 -1 2 0] [-1 -1 -1 3] Contraste polynomial

Prise en compte successive d’un trend linéaire, quadratique, cubique

SommaireSommaire

© P

ier r

e D

ESM

ET


Contrastes orthogonaux

Des Contrastes orthogonaux sont indépendants les uns des autres

Pour que 2 contrastes soient orthogonaux, il faut que la Somme des produits des coefficients de chaque variable soit

NULLE Somme des coefficients d’un contraste soit NULLE

Exemple C1 : [ -1 0 1] et C2 : [ -1 2 -1] C1 : [ 1 -1 0 0] et C2 : [ 0 0 1 -1]

Générer des contraste orthogonaux : http://www.bolderstats.com/orthogCodes/

Tous les contrastes doivent être orthogonaux 2 à 2

Chaque contraste

a sa somme des carrés

a 1 degré de liberté au numérateur et ddl erreur au dénominateur.

SommaireSommaire

© P

ier r

e D

ESM

ET


Type I Hiérarchique :

l’ordre détermine la prise en compte des variables. F de l’effet = SC de l’effet / SC des effets précédents

II Non expérimental F de l’effet = SC de l’effet / SC des effets de son niveau et des

niveaux inférieurs III Régression

F de l’effet = SC de l’effet / SC de tous les autres effets

Préconisations Type I si les variables ont un ordre d’importance ET les groupes de

taille identique Type II déconseillé Type III à privilégier (même si effectifs inégaux) : option par

défaut Approfondir : http://www.lsp.ups-tlse.fr/Doc_pedagogique/PDF/ab-deseq.pdf

Choix des sommes des carrés de Type I à III

SommaireSommaire

© P

ier r

e D

ESM

ET


Moyennes et Moyennes estimées

Moyenne (MEAN) correspond à la moyenne arithmétique C’est la moyenne générale

Moyenne estimée (LSMEANS) correspond à la moyenne estimée par le modèle utilisé C’est la moyenne des moyennes des niveaux d’un facteur Elle est ajustée en fonction de la moyenne des variables

indépendantes

Elles sont différentes S’il y a des valeurs manquantes ou des effectifs différents S’il y a des variables explicatives (covariates)

SommaireSommaire

© P

ier r

e D

ESM

ET


ANCOVA et MANOVA

ANCOVA Permet de tenir compte d’un facteur/variable que l ’on peut

mesurer mais non contrôler L’effet de la variable non contrôlé est éliminé d’abord avant de

prendre en compte les facteurs

MANOVA Prendre en compte plusieurs variables à expliquer (Y1, Y2, Y3) Voir s’il y a un effet global de la variable explicative Puis chercher sur quelle variable plus particulièrement il y a un

effet par des ANOVA

SommaireSommaire

© P

ier r

e D

ESM

ET


Modèles mixtes

Les modèles mixtes prennent en compte la différence des répondants lors d’analyses de mesures répétées

Modèle de base Y = a + b.X + e

Introduction d’une constante par répondant (i) Yit = a + b.Xit + .i + eit

Prise en compte des variations des coefficients selon des caractéristiques des répondants (modèles multi-niveaux ou hiérarchiques) Yit = ai + bi.Xit + .i + it

ai = a + c.Zi + i

bi = b + d.Ki + i

Master MARKETING / Pierre Desmet 1 Analyse des données appliquée au marketing 3. Expérimentation Pierre DESMET.

Documents