1 CAMPIONAMENTO CAMPIONAMENTO LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Estratto dal Cap. 5 di: “Statistics for Marketing and Consumer Research”, M. Mazzocchi, ed. SAGE, 2008.
1
CAMPIONAMENTOCAMPIONAMENTO
LEZIONI IN LABORATORIOCorso di MARKETINGL. BaldiUniversità degli Studi di Milano
Estratto dal Cap. 5 di:“Statistics for Marketing and Consumer Research”, M. Mazzocchi, ed. SAGE, 2008.
2
Che cosa è un campione
Un sottoinsieme delle unità di una popolazione, che rappresentarappresenta la popolazione stessa
Misurando i dati di un campione: le informazioni sulla popolazione si possono
raccogliere ad un costo inferiore rispetto ai censimenti
deve essere necessariamente accettato un margine di errore
3
Campionamento probabilisticoprobabilistico e non probabilisticonon probabilistico
Campioni probabilistici: ad ogni unità estratta è associata a una certa probabilità di essere inclusa nel campione; ciò comporta che la probabilità di ogni campione potenziale è nota.
Campionamento non probabilistico: estrazione di unità del campione che non si basa su regole di probabilità.
4
Campione e popolazione: alcune terminologie
Popolazione target: l'insieme di unità oggetto della ricerca da cui viene estratto il campione.
Lista di campionamento: elenco completo delle unità di popolazione che può essere usato per estrarre il campione.
Dimensione del campione: numero di unità (n) del campione.Statistica campionaria: stima del parametro della popolazione
sulla base delle osservazioni del campione.Distribuzione campionaria: distribuzione di probabilità delle
statistiche campionarie.
5
Il Campione casuale semplice (CCS)
Nel CCS ogni elemento della popolazione ha la stessa probabilità di essere estratto. Questa probabilità è nota.
Ogni elemento è estratto indipendentemente dagli altri elementi.
La probabilità di estrarre un determinato campione di n elementi è calcolabile (nota).
6
Precisione delle stime e ampiezza campionaria
Campioni di dimensioni molto grandi nonnon sono necessariamente convenientinecessariamente convenienti, perché il guadagno in precisione è molto piccolo e l'aumento dei costi è molto grande
7
Errori, ampiezza campionaria e ampiezza della popolazione
Per popolazioni di dimensioni elevate non è necessario aumentare proporzionalmente la dimensione del campione
Una dimensione campionaria pari a 500 garantisce un errore inferiore al 5% per qualsiasi dimensione della popolazione
Invece di optare per campioni di dimensioni superiori a 500, è meglio prendere in considerazione la spesa per la riduzione degli errori non campionari
Sample size 100 1,000 2,000 5,000 100,000 1,000,000 100,000,000
30 11.75% 16.28% 16.53% 16.68% 16.77% 16.78% 16.78%
50 6.39% 12.14% 12.46% 12.65% 12.78% 12.78% 12.78%
100 0.00% 8.04% 8.48% 8.75% 8.92% 8.93% 8.93%
200 5.02% 5.65% 6.02% 6.26% 6.27% 6.27%
500 1.98% 2.97% 3.56% 3.93% 3.95% 3.95%
1000 0.00% 1.40% 2.23% 2.76% 2.79% 2.79%
2000 0.00% 1.18% 1.93% 1.97% 1.97%
Population size
8
Come si determina l’ampiezza campionaria
Fattori che influenzano la dimensione del campione (n):
Dimensione della popolazione (N) Variabilità della popolazione Livello di precisione desiderato Vincolo di bilancio
9
Le tecniche di campionamento
Campionamento probabilistico• Campionamento casuale semplice• Campionamento sistematico (step)• Campionamento stratificato• Campionamento cluster• Tecniche complesse di campionamento
Campionamento non probabilistico• Campionamento “di convenienza”• Campionamento “di giudizio”• Campionamento per quote• Campionamento Snowball (a valanga)
10
Campionamento non probabilistico
Non permette di associare valutazioni sulla precisione e accuratezza delle stime
Non necessariamente è distorto o poco informativo In alcuni casi - per esempio quando non vi è una
lista di campionamento definita - può rappresentare l'unica soluzione possibile
Limite fondamentale - in generale, le tecniche di inferenza statistica non possono essere utilizzate per generalizzare i risultati dal campione alla popolazione
Tabella-prontuario per stabilire l’ampiezza campionariaTabella-prontuario per stabilire l’ampiezza campionaria(per popolazioni infinite)(per popolazioni infinite)
Valida per livelli di confidenza pari al 95%
p= quota di popolazione che possiedeuna determinata caratteristica
1%,2%....= limiti di errore
Come costruire la numerosità di un campione stratificato
DATI ASSOLUTI RIPARTIZIONE PERCENTUALE RIPARTIZIONE CAMPIONE n=300
maschi femmine totale maschi femmine
totale maschi
femmine
totale
Età Età Età
0-9 anni 2845132 2685891 5531023 0-9 anni 4.8% 4.5% 9.3% 0-9 anni 14 14 28
10-19 anni 2919303 2745182 5664485 10-19 anni 4.9% 4.6% 9.5% 10-19 anni 15 14 29
20-29 anni 3197404 3130487 6327891 20-29 anni 5.4% 5.3% 10.6% 20-29 anni 16 16 32
30-39 anni 4155287 4190252 8345539 30-39 anni 7.0% 7.1% 14.0% 30-39 anni 21 21 42
40-49 anni 4734090 4833778 9567868 40-49 anni 8.0% 8.1% 16.1% 40-49 anni 24 24 48
50-59 anni 3834719 4037115 7871834 50-59 anni 6.5% 6.8% 13.2% 50-59 anni 19 20 40
60-69 anni 3286806 3573355 6860161 60-69 anni 5.5% 6.0% 11.5% 60-69 anni 17 18 35
70-79 anni 2510028 3118950 5628978 70-79 anni 4.2% 5.2% 9.5% 70-79 anni 13 16 28
80-89 anni 1130360 1987452 3117812 80-89 anni 1.9% 3.3% 5.2% 80-89 anni 6 10 16
90-99 anni 129918 373156 503074 90-99 anni 0.2% 0.6% 0.8% 90-99 anni 1 2 3
100 anni e più 2460 12619 15079 100 anni e più 0.0% 0.0% 0.0% 100 anni e più 0 0 0
totale 28745507 30688237 59433744 totale 48.4% 51.6% 100.0% totale 145 155 300
totale
Territorio I talia
Anno 2011
Cittadinanza totaleCittadinanza totale
Territorio I talia
Anno 2011
Cittadinanza
Territorio I talia
Tipo dato popolazione residente
Anno 2011