Campionamento
Campionamento
obiettivi della presentazionee
• Che cosa è il Campionamento?• Perchè utilizziamo i Campioni?• Concetto di rappresentatività• Metodi di Campionamento• Errore di Campionamento• Calcolo della dimensione del campione
Definizione di Campionamento
Procedura per le quali alcuni membri della popolazione sono selezionati come
rappresentativi della intera popolazione
perchè campioniamo le popolazioni?
Dare informazioni su grandi popolazioni Al minimo costo
A massima rapidità
Con maggiore accuratezza
Usando strumenti raffinati
Campionamento
PrecisioneCosto
Che cosa si richiede di conoscere
Concetti rappresentatività
Campionamento : metodi
Come scegliere il giusto metodo
Calcoli errore di Campionamento
effetto del Disegno
dimensione del campione
Definizioni e termini del Campionamento
Unità di Campionamento unità di base di Campionamento (bsu) intorno
alla quale il Campionamento è pianificato Frazione di Campionamento
Il rapporto tra la dimensione del campione e la dimensione della popolazione
Universo di Campionamento ogni lista di tutte le unità di Campionamento
della popolazione Schema di Campionamento
metodo di selezione delle unità di Campionamento dall’universo di Campionamento
Campionamento e rappresentatività
campione
Popolazione Bersaglio
Popolazione Campionaria
Popolazione Bersaglio popolazione Campionaria campione
Concetto di rappresentatività
Persone età Sesso altre caratteristiche demografiche Esposizione/suscettibilità
Luogo Urbana Rurale
Tempo Stagionalità Giorno della settimana Ora del Giorno
Tipo di Campioni
Campionamento Non-probabilistico Campioni di Convenienza
viziati scenario migliore o peggiore
Campioni soggettivi Basati sulla conoscenza Tempo/risorse e vincoli
Campionamento probabilistico Il solo metodo di Campionamento che consente
di estrarre valide conclusioni circa la popolazione
Campioni probabilistici
Campionamento casuale ogni soggetto ha una nota probabilità di
essere scelto Riduce la possibilità di vizio di selezione di
soggetti consente l’applicazione di teoria statistica ai
risultati
errore di CampionamentoNessun campione è una perfetta immagine speculare della popolazione
La grandezza di errore può essere misurato in Campioni probabilistici
Espressione dell’errore standard di media, di proporzione, di differenze, etc
Funzione della … dimensione del campione quantità di variabilità nella misura del fattore di
interesse
metodi usati in Campionamento probabilistico
Campionamento casuale semplice
Campionamento sistematico
Campionamento stratificato
Campionamento a Cluster
Campionamento Multistadio
Campionamento casuale semplice
Principio– Uguale opportunità per ogni unità statistica di essere
estratto
Procedura– numerare tutte le unità – Estrarre unità casuali
vantaggi– semplice– errore di Campionamento facilmente misurato
svantaggi– richiede la completa lista di unità– non sempre ottiene la migliore rappresentatività
Esempio: Campionamento casuale semplice
1 Alberto D.2 Riccardo D.3 Bella H.4 Raimondo L.5 Stéfania B.6 Alberto T.7 Giampaolo V.8 André D.9 Daniele C.10 Antonio Q.11 Giacomo B.12 Daniele G.13 Amanda L.14 Giovanna L.15 Filippa K.16 Eva F.17 Piera O.18 Tommaso G.19 Brian F.20 Elena H.21 Isabella R.22 Gianna T.23 Samanta D.24 BerIl L.
25 Monica Q.26 Régine D.27 Lucille L.28 Geremia W.29 Gilles D.30 Renaud S.31 Piero K.32 Michele R.33 Marie M.34 Gaétano Z.35 Fidèle D.36 Maria P.37 Anne-Marie G.38 Michele K.39 Gastone C.40 Aldo M.41 Olivier P.42 Ginevra M.43 BerIl D.44 Gianna P.45 Giacomo B.46 François P.47 Domenica M.48 Antonio C.
( R ): lista di numeri casuali
Random Samples and Permutations
Description: 'sample' takes a sample of Il specified size da Il elements of 'x' using either con or without replacement.
Usage: sample(x, size, replace = FALSE, prob = NULL)
Arguments: x: Either a (numeric, complex, character or logical) vector of più than one element da which to choose, or a positive integer.
size: non-negative integer giving Il number of items to choose. replace: Should sampling be con replacement? prob: A vector of probability weights per obtaining Il elements of Il vector essere sampled.
(R): lista numeri casuali
sample(c(0:3000), 100, replace = TRUE)
[1] 2310 2034 1455 688 2290 2809 2914 2014 2875 2165 501 65 1056 271 1858
[16] 1692 1946 509 72 497 2929 966 2190 1560 1384 790 482 2234 269 1322
[31] 333 42 90 1884 1907 699 1141 2677 2757 178 2558 1126 2745 240 738
[46] 2058 669 2171 2302 2659 1421 2416 1861 498 481 2222 1580 2378 2186 2379
[61] 1151 278 1785 63 1651 1140 1876 343 480 2066 2955 1444 2157 1107 1124
[76] 272 626 1768 1417 739 2260 75 1550 406 2085 197 642 191 2887 2506
[91] 2926 997 1383 502 973 2420 1201 1732 2865 1511
Campionamento sistematico
Principio unità estratte con una constante intervallo tra successive
unità Uguale opportunità per ogni unità di essere estratta
Procedura Calcolare l’intervallo di Campionamento (k = N/n) estrarre una lista di numeri casuali ( k) per starting estrarre ogni k unità dalla prima unità
Vantaggi Assicura rappresentatività attraverso la lista Facile da implementare Può migliorare la precisione
Svantaggi dannoso se la lista ha cicli
Esempio: Campionamento sistematicoExample: systematic sampling
Campionamento stratificato
Principio Classificare la popolazione in sottogruppi internamente
omogenei (strato) estrarre un campione da ogni strato Combinare risultati di tutte le strato
Vantaggi Più precise se variabile associated con strato Tutti sottogruppi rappresentati, allowing separate
conclusioni circa la ogni di essi
Svantaggi errore di Campionamento di difficile misurazione Perdita di precisione se tutti numeri campionati in un
singolo strato
Esempio: Campionamento stratificato
Determinare la copertura della vaccinazione in una regione
Un campione estratto in ogni regione
stima calcolata per ogni strato
ogni strato pesato per ottenere stima per regione (media)
Campionamento a Cluster
Principio campione casuale di gruppi (“clusters”) di
unità
In cluster selezionati, sono incluse tutte le unità o proporzioni di unità (campione)
Campionamento entro cluster può essere semplice casuale o sistematico
Esempio: Campionamento una Cluster
Sezione 4
Sezione 5
Sezione 3
Sezione 2Sezione 1
Campionamento a Cluster
vantaggi semplice poichè la lista di Campionamento
completa delle unità entro popolazione non è richiesta
meno richiesta di viaggi e risorse
svantaggi Imprecisa se i clusters non sono omogenei e
quindi la variazione tra campioni è maggiore della variazione nella popolazione (grande effetto del disegno)
Errore di Campionamento è difficile da misurare
effetto del disegno
varianza globale
p(1-p) Var ccs = ----------
n
varianza di Cluster
p= proporzione globalepi= proporzione in ogni stratumn= numeri di soggettik= numero di strati
Σ (pi-p)²Var clus = -------------
k(k-1)
effetto del Disegno = --------------- Var ccs
Var clust
( R ): Calcolo dell’effetto del disegno
Campionamento Multistadio
Principio molteplici Campioni concatenati molteplici unità statistiche
vantaggi Non esiste una completa lista di popolazione
richiesta Il più facile approccio per grandi popolazioni
svantaggi molteplici liste di Campionamento errore di Campionamento difficile da misurare
Esempio: Campionamento Multistadio
Determine una suscettibilità all’epatite tra bambini delle scuole di una regione campione di regioni estratte dalla nazione campione di città estratte da ogni regione
selezionata campione di scuole estratte in ogni città
selezionata campione bambini entro scuole selezionate
selezione una metodo di Campionamento
popolazione che deve essere studiata dimensione della distribuzione geografica eterogeneità della variabile
livello di precisione richiestarisorse disponibiliImportance di avere una precisa stima dell’errore di Campionamento
passi nella stima dimensione del campione
• Identificare una variabile maggiore dello studio • Determine tipo di stima (%, mean, ratio,...) • Indicare la frequenza attesa di fattore di interesse• Decidere la precisione di stima desiderata • Decidere il rischio accettabile che stima cada fuori
dal valore dela sua popolazione reale• Correggere per la stima d’effetto del disegno• Correggere per attesa proporzione di risposta• (Correggere per la dimensione della popolazione )
dimensione del campioneformula in descrittiva survey
z: rischio alfa espresso in z-score
p: attesa prevalence
q: 1 - p
d: absolute precisione
g: effetto del disegno
z² * p * q 1.96²*0.15*0.85n = -------------- = ---------------------- = 544
d² 0.03²
Campionamento a Cluster
z² * p * q 2*1.96²*0.15*0.85n = g* -------------- = ------------------------ = 1088
d² 0.03²
Campionamento casuale semplice / sistematico
EPITABLE: Calcolo dimensione del campione a cluster
Ruolo del Campionamento in indagine descrittiva
Definire obiettivoDefinire risorse disponibiliIdentificare study popolazioneIdentificare variabiles to studyDefinire precisione richiestaStabilire plan di analysis (questionenario)Creare Campionamento estrazioneSelect campionePilot data collezioneCollect dataAnalyse dataCommunicate risultatiUse risultati
Conclusioni
Campioni probabilistici sono I migliori Fate attenzione ai … Rifiuto di partecipazione Dati mancanti “tutto ciò che non si conosce”
Conclusioni
Se avete dei dubbi …
Consultate uno statistico