Campionamento. obiettivi della presentazionee Che cosa è il Campionamento? Perchè utilizziamo i Campioni? Concetto di rappresentatività Metodi di Campionamento.

Campionamento

obiettivi della presentazionee

• Che cosa è il Campionamento?• Perchè utilizziamo i Campioni?• Concetto di rappresentatività• Metodi di Campionamento• Errore di Campionamento• Calcolo della dimensione del campione

Definizione di Campionamento

Procedura per le quali alcuni membri della popolazione sono selezionati come

rappresentativi della intera popolazione

perchè campioniamo le popolazioni?

Dare informazioni su grandi popolazioni Al minimo costo

A massima rapidità

Con maggiore accuratezza

Usando strumenti raffinati

Campionamento

PrecisioneCosto

Che cosa si richiede di conoscere

Concetti rappresentatività

Campionamento : metodi

Come scegliere il giusto metodo

Calcoli errore di Campionamento

effetto del Disegno

dimensione del campione

Definizioni e termini del Campionamento

Unità di Campionamento unità di base di Campionamento (bsu) intorno

alla quale il Campionamento è pianificato Frazione di Campionamento

Il rapporto tra la dimensione del campione e la dimensione della popolazione

Universo di Campionamento ogni lista di tutte le unità di Campionamento

della popolazione Schema di Campionamento

metodo di selezione delle unità di Campionamento dall’universo di Campionamento

Campionamento e rappresentatività

campione

Popolazione Bersaglio

Popolazione Campionaria

Popolazione Bersaglio popolazione Campionaria campione

Concetto di rappresentatività

Persone età Sesso altre caratteristiche demografiche Esposizione/suscettibilità

Luogo Urbana Rurale

Tempo Stagionalità Giorno della settimana Ora del Giorno

Tipo di Campioni

Campionamento Non-probabilistico Campioni di Convenienza

viziati scenario migliore o peggiore

Campioni soggettivi Basati sulla conoscenza Tempo/risorse e vincoli

Campionamento probabilistico Il solo metodo di Campionamento che consente

di estrarre valide conclusioni circa la popolazione

Campioni probabilistici

Campionamento casuale ogni soggetto ha una nota probabilità di

essere scelto Riduce la possibilità di vizio di selezione di

soggetti consente l’applicazione di teoria statistica ai

risultati

errore di CampionamentoNessun campione è una perfetta immagine speculare della popolazione

La grandezza di errore può essere misurato in Campioni probabilistici

Espressione dell’errore standard di media, di proporzione, di differenze, etc

Funzione della … dimensione del campione quantità di variabilità nella misura del fattore di

interesse

metodi usati in Campionamento probabilistico

Campionamento casuale semplice

Campionamento sistematico

Campionamento stratificato

Campionamento a Cluster

Campionamento Multistadio

Campionamento casuale semplice

Principio– Uguale opportunità per ogni unità statistica di essere

estratto

Procedura– numerare tutte le unità – Estrarre unità casuali

vantaggi– semplice– errore di Campionamento facilmente misurato

svantaggi– richiede la completa lista di unità– non sempre ottiene la migliore rappresentatività

Esempio: Campionamento casuale semplice

1 Alberto D.2 Riccardo D.3 Bella H.4 Raimondo L.5 Stéfania B.6 Alberto T.7 Giampaolo V.8 André D.9 Daniele C.10 Antonio Q.11 Giacomo B.12 Daniele G.13 Amanda L.14 Giovanna L.15 Filippa K.16 Eva F.17 Piera O.18 Tommaso G.19 Brian F.20 Elena H.21 Isabella R.22 Gianna T.23 Samanta D.24 BerIl L.

25 Monica Q.26 Régine D.27 Lucille L.28 Geremia W.29 Gilles D.30 Renaud S.31 Piero K.32 Michele R.33 Marie M.34 Gaétano Z.35 Fidèle D.36 Maria P.37 Anne-Marie G.38 Michele K.39 Gastone C.40 Aldo M.41 Olivier P.42 Ginevra M.43 BerIl D.44 Gianna P.45 Giacomo B.46 François P.47 Domenica M.48 Antonio C.

( R ): lista di numeri casuali

Random Samples and Permutations

Description: 'sample' takes a sample of Il specified size da Il elements of 'x' using either con or without replacement.

Usage: sample(x, size, replace = FALSE, prob = NULL)

Arguments: x: Either a (numeric, complex, character or logical) vector of più than one element da which to choose, or a positive integer.

size: non-negative integer giving Il number of items to choose. replace: Should sampling be con replacement? prob: A vector of probability weights per obtaining Il elements of Il vector essere sampled.

(R): lista numeri casuali

sample(c(0:3000), 100, replace = TRUE)

[1] 2310 2034 1455 688 2290 2809 2914 2014 2875 2165 501 65 1056 271 1858

[16] 1692 1946 509 72 497 2929 966 2190 1560 1384 790 482 2234 269 1322

[31] 333 42 90 1884 1907 699 1141 2677 2757 178 2558 1126 2745 240 738

[46] 2058 669 2171 2302 2659 1421 2416 1861 498 481 2222 1580 2378 2186 2379

[61] 1151 278 1785 63 1651 1140 1876 343 480 2066 2955 1444 2157 1107 1124

[76] 272 626 1768 1417 739 2260 75 1550 406 2085 197 642 191 2887 2506

[91] 2926 997 1383 502 973 2420 1201 1732 2865 1511

Campionamento sistematico

Principio unità estratte con una constante intervallo tra successive

unità Uguale opportunità per ogni unità di essere estratta

Procedura Calcolare l’intervallo di Campionamento (k = N/n) estrarre una lista di numeri casuali ( k) per starting estrarre ogni k unità dalla prima unità

Vantaggi Assicura rappresentatività attraverso la lista Facile da implementare Può migliorare la precisione

Svantaggi dannoso se la lista ha cicli

Esempio: Campionamento sistematicoExample: systematic sampling

Campionamento stratificato

Principio Classificare la popolazione in sottogruppi internamente

omogenei (strato) estrarre un campione da ogni strato Combinare risultati di tutte le strato

Vantaggi Più precise se variabile associated con strato Tutti sottogruppi rappresentati, allowing separate

conclusioni circa la ogni di essi

Svantaggi errore di Campionamento di difficile misurazione Perdita di precisione se tutti numeri campionati in un

singolo strato

Esempio: Campionamento stratificato

Determinare la copertura della vaccinazione in una regione

Un campione estratto in ogni regione

stima calcolata per ogni strato

ogni strato pesato per ottenere stima per regione (media)


Principio campione casuale di gruppi (“clusters”) di

unità

In cluster selezionati, sono incluse tutte le unità o proporzioni di unità (campione)

Campionamento entro cluster può essere semplice casuale o sistematico

Esempio: Campionamento una Cluster

Sezione 4

Sezione 5

Sezione 3

Sezione 2Sezione 1


vantaggi semplice poichè la lista di Campionamento

completa delle unità entro popolazione non è richiesta

meno richiesta di viaggi e risorse

svantaggi Imprecisa se i clusters non sono omogenei e

quindi la variazione tra campioni è maggiore della variazione nella popolazione (grande effetto del disegno)

Errore di Campionamento è difficile da misurare

effetto del disegno

varianza globale

p(1-p) Var ccs = ----------

n

varianza di Cluster

p= proporzione globalepi= proporzione in ogni stratumn= numeri di soggettik= numero di strati

Σ (pi-p)²Var clus = -------------

k(k-1)

effetto del Disegno = --------------- Var ccs

Var clust

( R ): Calcolo dell’effetto del disegno

Campionamento Multistadio

Principio molteplici Campioni concatenati molteplici unità statistiche

vantaggi Non esiste una completa lista di popolazione

richiesta Il più facile approccio per grandi popolazioni

svantaggi molteplici liste di Campionamento errore di Campionamento difficile da misurare

Esempio: Campionamento Multistadio

Determine una suscettibilità all’epatite tra bambini delle scuole di una regione campione di regioni estratte dalla nazione campione di città estratte da ogni regione

selezionata campione di scuole estratte in ogni città

selezionata campione bambini entro scuole selezionate

selezione una metodo di Campionamento

popolazione che deve essere studiata dimensione della distribuzione geografica eterogeneità della variabile

livello di precisione richiestarisorse disponibiliImportance di avere una precisa stima dell’errore di Campionamento

passi nella stima dimensione del campione

• Identificare una variabile maggiore dello studio • Determine tipo di stima (%, mean, ratio,...) • Indicare la frequenza attesa di fattore di interesse• Decidere la precisione di stima desiderata • Decidere il rischio accettabile che stima cada fuori

dal valore dela sua popolazione reale• Correggere per la stima d’effetto del disegno• Correggere per attesa proporzione di risposta• (Correggere per la dimensione della popolazione )

dimensione del campioneformula in descrittiva survey

z: rischio alfa espresso in z-score

p: attesa prevalence

q: 1 - p

d: absolute precisione

g: effetto del disegno

z² * p * q 1.96²*0.15*0.85n = -------------- = ---------------------- = 544

d² 0.03²


z² * p * q 2*1.96²*0.15*0.85n = g* -------------- = ------------------------ = 1088

d² 0.03²

Campionamento casuale semplice / sistematico

EPITABLE: Calcolo dimensione del campione a cluster

Ruolo del Campionamento in indagine descrittiva

Definire obiettivoDefinire risorse disponibiliIdentificare study popolazioneIdentificare variabiles to studyDefinire precisione richiestaStabilire plan di analysis (questionenario)Creare Campionamento estrazioneSelect campionePilot data collezioneCollect dataAnalyse dataCommunicate risultatiUse risultati

Conclusioni

Campioni probabilistici sono I migliori Fate attenzione ai … Rifiuto di partecipazione Dati mancanti “tutto ciò che non si conosce”

Conclusioni

Se avete dei dubbi …

Consultate uno statistico

Campionamento. obiettivi della presentazionee Che cosa è il Campionamento? Perchè utilizziamo i Campioni? Concetto di rappresentatività Metodi di Campionamento.

Documents