LA SEGMENTAZIONE DEL MERCATO LA SEGMENTAZIONE DEL MERCATO Un caso di analisi CHAID Un caso di analisi CHAID COOP COOP Emilio Gagliardi Emilio Gagliardi Debora Facchini Debora Facchini Giulia Brav Giulia Brav [email protected][email protected][email protected]
66
Embed
LA SEGMENTAZIONE DEL MERCATO Un caso di analisi CHAID COOP Emilio GagliardiDebora FacchiniGiulia Bravo [email protected][email protected]@libero.it.
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
LA SEGMENTAZIONE DEL MERCATOLA SEGMENTAZIONE DEL MERCATO
Tecniche di segmentazione a priori basate sull’ implementazione dell’ algoritmo CHAIDCHAID (Chi-squared Automatic Chi-squared Automatic
Interaction DetectionInteraction Detection)
valutazione del grado di omogeneità entro i gruppi e di eterogeneità tra gli stessi tramite il test test 22, la cui significatività
statistica viene normalizzata con fattore di Bonferronifattore di Bonferroni
analisi di un collettivo oggetto di studio al fine di suddividere lo stesso in gruppi di consumatori omogenei al loro interno ma
tra loro eterogenei sulla base di variabili maggiormente correlate ad uno specifico target, per poter così predisporre
specifiche politiche di marketing
OBIETTIVO
Analisi preliminare
Dataset iniziale: 7200 osservazioni, ciascuna delle quali riferita ad un’intervista effettuata in un PV Coop a soci Coop o ad individui appartenenti a nuclei familiari che comprendono soci Coop
Variabili: - socio-demografiche ed economiche- punteggi di soddisfazione sul servizio di distribuzione e relative variazioni - variabili coop
tutte le variabili sono state categorizzate per limitare l’ impatto della metrica sui predittori, e presentano le modalità di seguito illustrate:
EtàEtà: meno di 35 anni; da 36 a 50 anni; da 51 a 65 anni; più di 65 anni
ProfessioneProfessione: ‘1’; ‘2’; ‘3’; ‘4’Titolo di studioTitolo di studio: elementare/media inferiore; media
superiore/universitàStato civileStato civile: celibe/nubile; sposato/a; vedovo/aArea di acquistoArea di acquisto: Romagna/Marche; Veneto; BolognaComponenti della famigliaComponenti della famiglia: 1; 2; 3; più di 3Numero minorenniNumero minorenni: 1; più di 1Numero percettori redditoNumero percettori reddito: 1; 2; più di 2Numero occupatiNumero occupati: modalità corrispondentiNumero auto posseduteNumero auto possedute: 1; più di 1
Analisi preliminare
Punteggi soddisfazione relativi al servizio distributivoPunteggi soddisfazione relativi al servizio distributivo: - bassa (da 1 a 7)
- media (8)- alta (9-10)
Giudizi su variazioni del servizio distributivoGiudizi su variazioni del servizio distributivo: - peggiorato/molto peggiorato - più o meno uguale - migliorato
Preferenza su CoopPreferenza su Coop: dicotomica si/noCanale di VenditaCanale di Vendita: iper; non iper(supermercato,discount,tradizionali,mercato,altro)
Numero di soci presenti in famigliaNumero di soci presenti in famiglia: 1; da 2 in poi
I VALORI MISSING VENGONO INCLUSI NELL’ANALISI COME CATEGORIA DISTINTA
Analisi preliminare
Scelta della variabile target
Target: CANALE DI VENDITACANALE DI VENDITA
MISSING
20.45%29.65%
49.90%
Variabili indipendenti:
- tutte insieme- a blocchi
Primo livello di analisi
Target: SOCIOSOCIOper la modalità NON IPERNON IPER di CANALE DI CANALE DI
VENDITAVENDITA
Scelta della variabile target
43.95%56.05
%
Variabili indipendenti:
- tutte insieme- a blocchi
Secondo livello di analisi
Primo livello di analisi
Intero data setIntero data set variabile target CANALE DI CANALE DI
VENDITAVENDITA
SEGMENTAZIONE IN BASE ALLA VARIABILE TARGET CANALECANALE
Variabile target: CANALE con modalità - IPER - NON IPER
Variabili indipendenti:
- Socio-demografiche ed economiche
- Punteggi di soddisfazione sul servizio di distribuzione e relative variazioni
- Variabili “Coop”
Tasso di corretta classificazione
Dimensione dell’albero che ottimizza il tasso di corretta classificazione: 14 nodi terminali
1 Unità che frequentano PV in Romagna-Marche aventi medio-bassa soddisfazione per pesce
36% 64% 488
2 Unità che frequentano PV in Veneto aventi medio-bassa soddisfazione per pesce
26% 74% 214
3 Unità che frequentano PV in Romagna-Marche e Veneto aventi alta soddisfazione per pesce
44% 56% 367
4 Unità che frequentano PV in zona Bologna aventi alta soddisfazione per pesce
69% 31% 454
5 Unità con media soddisfazione per l’assortimento e soddisfazione non nota per pesce
19% 81% 402
6 Unità con bassa soddisfazione per l’assortimento e soddisfazione non nota per pesce
6% 94% 662
7 Unità con alta soddisfazione per l’assortimento che frequentano PV in zona Bologna e hanno una medio-bassa soddisfazione per pesce
78% 22% 243
8 Unità che frequentano PV in Veneto con alta soddisfazione per l’assortimento e soddisfazione sconosciuta per pesce
10% 90% 79
9 Unità che frequentano PV in Romagna_Marche con alta soddisfazione per l’assortimento e soddisfazione sconosciuta per pesce
23% 77% 175
Descrizione nodi terminali
Variabile target CANALECANALE
10 Unità che frequentano PV in Zona Bologna con alta soddisfazione per l’assortimento e soddisfazione sconosciuta per pesce 67% 33% 151
11 Soci Coop con media soddisfazione per l’assortimento, frequentano punti vendita in zona Bologna e hanno medio-bassa soddisfazione per pesce
69% 31% 270
12 Non soci coop con media soddisfazione per l’assortimento, frequentano punti vendita in zona Bologna e hanno medio-bassa soddisfazione per pesce
45% 55% 128
13 Soci Coop con bassa soddisfazione per l’assortimento, frequentano punti vendita in zona Bologna e hanno medio-bassa soddisfazione per pesce
56% 44% 185
14 Non soci coop con bassa soddisfazione per l’assortimento, frequentano punti vendita in zona Bologna e hanno medio-bassa soddisfazione per pesce
27% 73% 146
SEGMENTAZIONE:VARIABILE TARGET CANALECANALEVARIABILI INDIPENDENTI SOCIO-DEMOGRAFICHE ED SOCIO-DEMOGRAFICHE ED
ECONOMICHE ECONOMICHE
Variabile target: CANALE con modalità - IPER - NON IPERVariabili indipendenti:- Sesso- Età - Professione- Titolo di studio- Stato civile - Area di acquisto - Numero componenti famiglia - Numero minorenni - Numero percettori reddito - Numero occupati - Numero auto possedute
1Unità che frequentano punti vendita in Romagna-Marche
29% 71% 1308
2 Unità che frequentano PV in Veneto 16% 84% 653
3Unità che scelgono altre insegne e che frequentano PV di Bologna
30% 70% 239
4Unità che frequentano PV di Bologna di cui non è nota la preferenza per l’insegna
2% 98% 147
5Unità non soci che frequentano PV Coop a Bologna
49% 51% 435
6Unità soci che frequentano PV Coop a Bologna
66% 34% 1182
Confronto tra modelli
name target
Target event
Root ASE Valid: root ASE
CANALE_TUTTE canale
non iper 0,424182 0,427693
CANALE_COOP canale
non iper 0,444124 0,445294
CANALE_SODDISF
canale
non iper 0,437022 0,445671
CANALE_DEMOG canale
non iper 0,462142 0,460323
il modello canale_demogcanale_demog presenta un errore superiore agli altri modelli considerati
Confronto tra modelli
name target
Target event
Misclassification
Rate
Valid: Misclassification Rate
CANALE_TUTTE canale
non iper 0,265893 0,259259
CANALE_COOP canale
non iper 0,264399 0,288319
CANALE_SODDISF
canale
non iper 0,295409 0,309972
CANALE_DEMOG canale
non iper 0,344097 0,336182
i modelli canale_coop canale_coop e canale_soddisf canale_soddisf presentano un tasso di errata classificazione pressoché simile a quello del modello completo canale_tuttecanale_tutte
Confronto tra modelli
Confrontando le curve, nel primo decile i modelli canale_tuttecanale_tutte e canale_soddisfcanale_soddisf hanno un potere di classificazione migliore rispetto agli altri due modelli.Dal quinto all’ottavo decile il modello canale_coopcanale_coop acquisisce un potere di classificazione superiore rispetto al modello canale_soddisfcanale_soddisf.
Confronto tra modelli
La funzione liftlift evidenzia che i modelli canale_tuttecanale_tutte e canale_soddisfcanale_soddisf consentono di ottenere un miglioramento rispetto ad una classificazione casuale delle unità (baselinebaseline).
Secondo livello di analisi
dataset NON IPERNON IPER variabile target SOCIOSOCIO
Segmentazione con tutte le variabili
Variabile target: SOCIOSOCIO modalità - SI
- NO
Variabili indipendenti:
- Variabili Socio-demografiche ed economiche- Punteggi di soddisfazione sul servizio di distribuzione e relative variazioni- Variabili “Coop”
la dimensione dell’albero che ottimizza il tasso di corretta la dimensione dell’albero che ottimizza il tasso di corretta classificazione è pari a classificazione è pari a 5 foglie5 foglie
NO SI Totale
NO 32931.36
%
14613.92
%
47545.28
%
SI 131.24%
56153.48
%
57454.72
%
Totale
34232.60
%
70767.40
%
1049100%Tassi di corretta classificazioneTassi di corretta classificazione
Matrice di confusione
Rappresentazione grafica dell’albero
-1-
-2- -3-
-4-
-5-
Variabile target: SOCIO SOCIO per canale di vendita NON IPERNON IPER
Variabili esplicative maggiormente influenti sulla variabile target
Variabile target: SOCIO SOCIO per canale di vendita NON IPERNON IPER
Descrizione nodi terminali
Variabile target: SOCIO SOCIO per canale di vendita NON IPERNON IPER
NODONODO DESCRIZIONEDESCRIZIONE % SOCI% SOCI % NON % NON SOCISOCI
Numerosità Numerosità NODONODO
1Unità di cui non si conosce il valore per la variabile insegna 7% 93% 276
2Unità che frequentano come primo PV Coop 81% 19% 1591
3Unità che non frequentano come primo PV Coop 11% 89% 100
4Unità che frequentano come primo PV altre insegne 0% 100% 395
5Unità che non frequentano come primo PV altre insegne 100% 0% 85
Segmentazione con Segmentazione con variabili socio-demografiche ed variabili socio-demografiche ed
economicheeconomiche
Variabile target: SOCIOSOCIO con modalità - SI
- NOVariabili indipendenti:- Sesso- Età - Professione- Titolo di studio- Stato civile - Area di acquisto - Numero componenti famiglia - Numero minorenni - Numero percettori reddito - Numero occupati - Numero auto possedute
l’albero si arresta a tre nodi terminalil’albero si arresta a tre nodi terminali
NO SI Totale
NO 22321.26
%
25224.02
%
47545.28
%
SI 18817.92
%
38636.80
%
57454.72
%
Totale
41139.18
%
63860.82
%
1049100%Tassi di corretta classificazioneTassi di corretta classificazione
Matrice di confusione
Rappresentazione grafica dell’albero
-1- -2- -3-
Variabile target: SOCIO SOCIO per canale di vendita NON IPER NON IPER e variabili indipendenti SOCIO-DEMOGRAFICHE ED SOCIO-DEMOGRAFICHE ED ECONOMICHEECONOMICHE
Descrizione dei nodi terminali
L’ unica variabile utilizzata nella costruzione dell’albero è L’ unica variabile utilizzata nella costruzione dell’albero è
ZONAZONA
NODONODO DESCRIZIONEDESCRIZIONE % SOCI% SOCI % NON % NON SOCISOCI
Numerosità Numerosità NODONODO
1Unità che frequentano PV in zona Bologna
49% 51% 959
2Unità che frequentano PV in zona Romagna-Marche
60% 40% 957
3Unità che frequentano PV in zona Veneto
66% 34% 531
Segmentazione con variabili relative Segmentazione con variabili relative alla soddisfazionealla soddisfazione
Variabile target: SOCIO SOCIO per canale di vendita NON IPER NON IPER e variabili indipendenti di SODDISFAZIONESODDISFAZIONE
Descrizione nodi terminali
NODONODO DESCRIZIONEDESCRIZIONE % SOCI% SOCI % NON % NON SOCISOCI
Numerosità Numerosità NODONODO
1Unità con alta soddisfazione per le promozioni ed una soddisfazione generale medio-alta 76% 24% 544
2Unità con medio-bassa soddisfazione per le promozioni ed una soddisfazione generale medio-alta 64% 36% 946
3Unità con soddisfazione per le promozioni non nota ed una soddisfazione generale medio-alta 40% 60% 30
4Unità per le quali la soddisfazione per pesce è migliorata e che presentano bassa soddisfazione generale ed una soddisfazione generica per carne
38% 62% 93
5Unità per le quali la soddisfazione per pesce è peggiorata e che presentano bassa soddisfazione generale ed una soddisfazione generica per carne
47% 53% 426
6
Unità per le quali la variazione di soddisfazione per pesce non è nota e che presentano bassa soddisfazione generale ed una soddisfazione generica per carne
62% 38% 165
7Unità di cui non è nota la soddisfazione per carne, con bassa soddisfazione generale 26% 74% 94
8 Unità con soddisfazione generale non nota 4% 96% 149
Segmentazione con variabili Segmentazione con variabili coopcoop
Variabile target: SOCIOSOCIO con modalità - SI
- NO
Variabili indipendenti:
- Canale di vendita- Insegna - Numero soci in famiglia - Preferenza su Coop - Area di acquisto
l’albero si arresta a cinque nodi l’albero si arresta a cinque nodi terminaliterminali
Tasso di corretta classificazione
NO SI Totale
NO 32931.36
%
14613.92
%
47545.28
%
SI 131.24%
56153.48
%
57454.72
%
Totale
34232.60
%
70767.40
%
1049100%Tassi di corretta classificazioneTassi di corretta classificazione
Matrice di confusione
Rappresentazione grafica dell’albero
-1-
-2- -3- -4- -5-
Variabile target: SOCIO SOCIO per canale di vendita NON IPER NON IPER e variabili indipendenti
COOPCOOP
Variabili esplicative maggiormente influenti sulla variabile target
Variable Nodes Importance
INSEGNA 1 1,0000
PRIMO_PV 2 0,6110
Variabile target: SOCIO SOCIO per canale di vendita NON IPER NON IPER e variabili indipendenti
COOPCOOP
Descrizione nodi terminali
Variabile target: SOCIO SOCIO per canale di vendita NON IPER NON IPER e variabili indipendenti
COOPCOOP
NODONODO DESCRIZIONEDESCRIZIONE % SOCI% SOCI % NON % NON SOCISOCI
NumerositNumerosità NODOà NODO
1 Unità di cui non è nota la preferenza per insegna 7% 93% 276
2 Unità il cui primo PV è Coop 81% 19% 1591
3 Unità il cui primo PV non è Coop 11% 89% 100
4Unità il cui primo PV è rappresentato da altre insegne
0% 100% 395
5Unità il cui primo PV non è rappresentato da altre insegne
100% 0% 85
Confronto tra modelli
name target
Target event
Root ASE
Valid: root ASE
SOCIO_COOP socio si 0.3356 0.3473
SOCIO_SODDIS socio si 0.4591 0.4582
SOCIO_DEMO socio si 0.4903 0.4925
SOCIO_TUTTE socio si 0.3356 0.3473
il modello socio_demogsocio_demog presenta un errore superiore agli altri modelli considerati
name target
Target event
Misclassification Rate
Valid: Misclassification Rate
SOCIO_COOP socio si 0.1381 0.1515
SOCIO_SODDIS socio si 0.3322 0.3098
SOCIO_DEMO socio si 0.4217 0.4194
SOCIO_TUTTE socio si 0.1381 0.1515
Confronto tra modelli
il modello socio_coop socio_coop presenta un tasso di errata classificazione corrispondente a quello del modello completo socio_tuttesocio_tutte, a conferma dei risultati ottenuti nella costruzione degli alberi
Confronto tra modelli
Confrontando le curve, i modelli socio_tuttesocio_tutte e socio_coop socio_coop hanno il medesimo potere di classificazione (le curve sono sovrapposte), superiore rispetto agli altri due modelli.
Confronto tra modelli
La funzione liftlift evidenzia che i modelli socio_tuttesocio_tutte e socio_coopsocio_coop (curve sovrapposte) consentono di ottenere un miglioramento rispetto ad una classificazione casuale delle unità (baselinebaseline).