-
1
STATISTICA DESCRITTIVA Si occupa di predisporre i metodi per
sintetizzare con opportune grandezze le caratteristiche salienti
dei fenomeni. La descrizione passa attraverso due fasi: - la
formazione dei dati statistici: si
raccolgono i dati di fatto riguardanti il fenomeno in esame
- il trattamento matematico dei dati: i dati vengono
sintetizzati in grandezze che colgono gli aspetti pi rilevanti del
fenomeno.
Come per qualunque disciplina, anche per accostarsi allo studio
della statistica necessario costruirsi una terminologia, un
vocabolario, tra le altre per le seguenti ragioni: - indicare gli
enti appartenenti alla stessa
classe con il medesimo nome - a volte gli enti sono complessi:
una volta
attribuito un nome, attraverso una definizione rigorosa, ad un
ente (o ad un insieme di enti) complesso quanto si voglia,
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
-
2
possibile comunicare in modo economico. Il nome trascina con s
in modo sintetico anche tutti i dettagli dellente in questione,
senza fatica per chi si appropriato della definizione.
Formazione dei dati statistici Per poter raccogliere i dati di
fatto necessario determinare la popolazione di riferimento e le
unit statistiche. Le unit statistiche sono le entit reali che
interessa esaminare. La popolazione statistica linsieme delle unit
reali che interessa esaminare. Non sempre agevole determinare le
unit statistiche. Se si volesse, ad esempio effettuare unindagine
sul grado distruzione, sullet e sullo stato civile dei disoccupati
residenti nel comune di Milano, sarebbe necessario avere un
criterio in base al quale stabilire se una persona disoccupata o
no. Tali criteri (definizioni) possono variare da indagine ad
indagine. Nel fare confronti fra dati statistici bene sempre
accertarsi che essi
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
-
3
facciano riferimento ad unit statistiche definite allo stesso
modo. La variet delle definizioni riferentisi a fenomeni o eventi
analoghi nuoce alla comparabilit dei dati ed al buon nome delle
indagini statistiche. Tramite organismi internazionali si cerca di
uniformare le definizioni relative ai fenomeni pi rilevanti in modo
da poter avere dati nazionali confrontabili a livello
internazionale. Individuate le unit statistiche, si possono formare
i dati statistici, procedimento che passa attraverso quattro fasi:
a) la formazione dei casi statistici b) la loro rilevazione c) lo
spoglio dei casi rilevati d) la preparazione dei dati e delle
tabelle
statistiche. Non sempre, per, nello svolgere una ricerca i dati
statistici vengono rilevati ad hoc. Talvolta i dati statistici sono
gi raccolti da altri ricercatori o da altre istituzioni ad
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
-
4
esempio lISTAT in occasione dei censimenti. In questi casi non
sempre i dati gi disponibili sono pienamente adeguati ai fini
dellindagine. a) formazione dei casi statistici Una volta
individuata e determinata la popolazione, si scelgono le
caratteristiche o caratteri che si ritengono rilevanti per gli
scopi dellindagine: le unit statistiche che si osservano sono
portatrici di svariati caratteri, alcuni dei quali sono utili ai
fini dellindagine, altri no. Prendere in considerazione una
caratteristica non rilevante appesantisce inutilmente lindagine e
spesso fonte di confusione. Omettere una caratteristica rilevante
potrebbe inficiare lindagine, in quanto quella caratteristica
potrebbe spiegare un certo aspetto del fenomeno in oggetto. Per
ogni carattere prescelto necessario prevedere le modalit con le
quali esso pu manifestarsi. Il ricercatore deve innanzi tutto
individuare, fra le infinite caratteristiche che
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
-
5
si possono rilevare, quelle che ritiene utili ai fini
dellindagine ed immaginare che le altre non esistano. Solo
astraendo dalle caratteristiche ritenute non interessanti possibile
raggruppare le unit della popolazione in classi (insiemi) omogenee,
relativamente ai caratteri e alle modalit considerate. Due unit
statistiche portatrici delle stesse modalit dei caratteri presi in
considerazione si considerano uguali, vale a dire che si possono
raggruppare in una stessa classe, anche se sono portatrici di
modalit differenti per quei caratteri non presi in considerazione.
I casi statistici non sidentificano con le unit statistiche reali
della popolazione (ad es. individui, nuclei famigliari, aziende,
etc) ma solo con i caratteri e le modalit dei quali sono
portatrici. Nelle indagini per questionario, per ciascuna domanda,
va effettuata la scelta fra domanda a risposta chiusa, domanda a
risposta aperta, domanda a risposta mista.
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
-
6
Nella domanda a risposta chiusa le risposte sono fissate in
anticipo, cosicch allintervistato non data n libert di espressione
n possibilit di scelta diversa da quella che offre il questionario.
I vantaggi di questa tipologia sono molteplici: ad ogni risposta si
pu far corrispondere un codice numerico, il che facilita
loperazione di spoglio; possibile classificare rapidamente lunit
intervistata in una precisa categoria di analisi; le domande a
risposta chiusa sono assai utili per la conoscenza degli
avvenimenti passati o presenti e hanno la possibilit di funzionare
da filtro. Esempio: se hai risposto S a questa domanda (filtro),
rispondi anche alla successiva. Le domande a risposta aperta non
prevedono risposte prefissate e lasciano, quindi, piena libert
allintervistato nella scelta del contenuto e della forma della
risposta. Esse permettono di affrontare la quasi totalit degli
argomenti (anche i problemi pi delicati), ma
-
7
possono essere causa di errori di interpretazione (della domanda
da parte dellintervistato e/o della risposta da parte del
ricercatore). Nelle domande a risposta mista non tutte le risposte
sono prefissate; rispetto alle domande a risposte chiuse, esse
permettono risposte pi complete e pi articolate col rischio,
talvolta, di gonfiare eccessivamente la risposta Altro. Queste
domande possono essere pre-codificate solo parzialmente (in quanto
alle risposte non prefissate pu essere data una codifica solo a
posteriori). Quanto alla forma con cui porgere le domande bene
prestare attenzione: - a non utilizzare parole a doppio senso o
ambigue, ma ricorrere a espressioni semplici e di preciso
significato
- a non porre sotto forma di domanda diretta loggetto
dellindagine
- a non dare per scontati fatti che potrebbero non
sussistere
-
8
- a non formulare domande troppo lunghe, per il fatto che,
quanto pi sono lunghe, tanto minore la validit delle relative
risposte
- a non mettere nel questionario troppe domande per non stancare
lintervistato, rischiando di ridurre la validit del
questionario
- a intercalare domande impegnative con domande pi semplici, al
fine di tener desta lattenzione dellintervistato
- a disporre con cura le domande del questionario, in quanto la
loro disposizione pu avere influenza sui risultati
dellindagine.
La lista delle modalit di un carattere deve soddisfare due
propriet: a) essere esaustiva b) essere esclusiva, ovvero tale che
le sue
modalit siano esclusive. I caratteri si suddividono in due
categorie: a) caratteri quantitativi b) caratteri qualitativi.
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
-
9
Si dice quantitativo un carattere le cui modalit esprimono
quantit o misure espresse numericamente. Esempi ne sono il numero
di figli per famiglia, il reddito familiare, il peso dei coscritti.
I caratteri quantitativi si dividono in discreti e continui. Sono
discreti i caratteri le cui modalit possono assumere solamente un
numero finito di valori. Si tratta per lo pi di caratteri che
vengono rilevati tramite conteggio: ad es. il numero di locali per
appartamento, il numero di errori tipografici di una pagina di
libro, ecc I caratteri quantitativi continui possono assumere bench
solo ipoteticamente - tutti i valori compresi in un intervallo: ad
es. laltezza dei coscritti, il peso dei neonati, ecc Si dice
qualitativo un carattere le cui modalit indicano categorie,
attributi, e sono espresse per lo pi da vocaboli, espressioni
verbali e simili. Sono qualitativi il sesso, lo stato civile,
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
-
10
il settore di attivit economica, il tipo di diploma. Un
ricercatore quando fissa le modalit di un carattere e indica i
criteri di appartenenza alle stesse costruisce una scala. La scala
usata per individuare le modalit di un carattere non parte del
carattere stesso. Essa infatti scaturisce meramente dalla sua
definizione operativa. Esempi: entit di un terremoto. In termini
generali e semplificati per un determinato aspetto di un fenomeno
un procedimento di misurazione consiste in un insieme di operazioni
che consente, data una manifestazione di un fenomeno, di associare
allaspetto di interesse una modalit o un valore su una prefissata
scala. Si hanno quattro tipologie di scale: 1) scala nominale: per
due generiche
modalit della scala, a e b, sussistono solo le relazioni
mutuamente esclusive di eguaglianza o di diversit: ( ) ( )baba
=
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
-
11
2) scala ordinale: le modalit costituiscono un insieme ordinato;
per due generiche modalit della scala, a e b, sussiste
necessariamente una delle relazioni mutuamente esclusive a maggiore
di b, ovvero eguaglia b, ovvero minore di b:( ) ( ) ( )bababa
3) scala ad intervalli: le modalit costituiscono un insieme
numerico ordinato di valori numerici definiti a meno di una
trasformazione lineare del tipo
0, >+= xy ; ne consegue che anche le differenze sono
intrinsecamente ordinate, nel senso che se a, b, c e d sono modalit
della scala in ogni caso sussiste un delle relazioni dcba
4) scala di rapporti: le modalit costituiscono un insieme
ordinato di valori positivi e sono definite a meno di una
trasformazione di proporzionalit del tipo
0, >= xy , corrispondente allarbitrariet della scelta
dellunit di misura; ne
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
-
12
consegue che lo zero univocamente definito, o come si suole
dire, oggettivo.
(Seguono esempi) I diversi tipi di scala formano una gerarchia.
Una scala ordinale possiede tutte le caratteristiche di una scala
nominale ed in pi ha la caratteristica di essere ordinale. Una
scala ad intervalli possiede tutte le caratteristiche delle scale
nominali e ordinali ed in pi possiede ununit di misura. Infine la
scala di rapporti oltre allunit di misura ha uno zero oggettivo.
Tale gerarchia permette, ad esempio, di estendere i metodi
specifici delle scale nominali anche alle scale ordinali ed alle
scale ad intervalli e di rapporti. Non possibile invece estenderli
alle scale nominali per limpossibilit di ordinare le modalit. Vale
la pena di osservare che, sebbene tali estensioni siano necessarie,
qualora non esistano metodi appropriati per il livello di scala in
esame, in questo modo non si utilizza totalmente linformazione
contenuta nei dati.
-
13
b) rilevazione dei casi statistici Dicesi rilevazione statistica
la constatazione, caso per caso, della presenza o dellassenza dei
vari caratteri con le rispettive modalit, e la sistematica
annotazione di ciascun reperto. Tale operazione in stretto
collegamento con le tecniche delle singole discipline e pu essere
effettuata o tramite osservazione dei fatti esistenti tali
osservazioni possono essere molto semplici o molto complicate e
possono richiedere luso di strumenti sofisticati, ad es. telescopi
in astronomia e microscopi in biologia oppure attraverso
losservazione dei fatti che vengono provocati sperimentalmente in
laboratorio. Nel contesto delle scienze sociali le rilevazioni si
possono classificare in complete, incomplete e pi che complete.
Sono complete le rilevazioni che permettono di raggiungere tutte le
unit statistiche della popolazione; incomplete quelle tramite le
quali non possibile raggiungere tutte le unit statistiche; pi che
complete quelle nelle quali
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
-
14
una unit statistica pu essere raggiunta pi duna volta. Esempio
di questultimo caso si ha quando sindaga sui nuclei familiari
intervistando i figli: se sintervistano due fratelli, il nucleo
familiare raggiunto due volte nellambito della medesima
rilevazione. Si pu distinguere fra indagini nelle quali possibile
riconoscere la parentela, da indagini nelle quali ci non possibile
(ad es. questionario anonimo). c) spoglio dei casi rilevati d)
preparazione dei dati e delle tabelle
statistiche Esempio: classificazione dei 232 intervistati
durante la lezione dell8.10.99 (DUET-DUSI) secondo il sesso e il
tipo di diploma. Non rispondenti: 3 SD LC LS LL RG ITIS GEO TUR AL
TOT M F
1 6
42 25
2 29
16 26
11 3
3 1
14 20
5 25
94 135
TOT 7 67 31 42 14 4 34 30 229
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
-
15
DISTRIBUZIONI DI FREQUENZE Dicesi distribuzione di frequenze
linsieme del numero di unit statistiche (frequenze) che si hanno in
corrispondenza delle modalit di un carattere. La distribuzione di
frequenza costituisce la pi completa descrizione dei fenomeni
oggetto di studio. Alcuni esempi. - Innanzi tutto le distribuzioni
marginali della
tabella precedente. - Distribuzione del carattere
(qualitativo)
Luogo di residenza degli intervistati durante la lezione
dell8.10.99 (DUET-DUSI) in possesso della maturit scientifica.
Non rispondenti: 1 Luogo di residenza Frequenze
Milano Provincia di Milano
Lombardia escluso Milano e provincia Nord Italia Lombardia
esclusa
Centro e Sud Italia
12 31 16 5 2
66
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
-
16
- Distribuzione del carattere (quantitativo discreto) Voto di
maturit (convertito in centesimi) degli intervistati durante la
lezione dell8.10.99 (DUET-DUSI) in possesso della maturit
scientifica. Non rispondenti:3
Voto di maturit Frequenze 60 61 62 63 64 65 66 67 68 70 71 72 74
75 77 78 83 89
15 2 8 3 2 5 2 4 3 7 3 3 2 1 1 1 1 1
64
- Per la popolazione precedente degli intervistati durante la
lezione dell8.10.99
jacoporovatiEvidenziato
-
17
(DUET-DUSI) in possesso della maturit scientifica,
riclassificazione in classi del carattere Voto di maturit.
Voto di maturit Frequenze 60
61-65 66-70 71-76 77-89
oltre 89
15 20 16 9 4 0
64
- Distribuzione del carattere (quantitativo continuo) reddito
annuo lordo dichiarato (in milioni di lire) dei capifamiglia di 200
nuclei famigliari di un condominio.
Reddito annuo lordo dichiarato
Frequenze
Meno di 10 10 20 20 25 25 35 35 55 55 75
Almeno 75
17 53 46 34 31 14 5
200
jacoporovatiEvidenziato
-
18
ALTRI TIPI DI DISTRIBUZIONI E bene prendere in considerazione
anche le cosiddette distribuzioni di quantit, essendo esse molto
impiegate nella pratica delle rilevazioni. Esempio: valore delle
importazioni italiane (in milioni di lire) secondo gruppi di merci
per lanno 1981.
Gruppi di merci Valore Prodotti (primari ed intermedi) destinati
allalimentazione Combustibili minerali e derivati Prodotti tessili
e dellabbigliamento Prodotti metallurgici Prodotti meccanici Mezzi
di trasporto Prodotti chimici Altri prodotti
11732 32590 3941 7358
12644 9537 8940
16933 Totale 103675
Sembra che lo scopo della tabella sia quello di mostrare la
ripartizione del totale importazioni secondo i gruppi merceologici.
A tale tipologia di tabelle si d il nome di distribuzioni di
quantit. Vale la pena di aggiungere che i metodi statistici per
trattare tali distribuzioni sono differenti da quelli impiegati per
le distribuzioni di frequenze.
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
-
19
Esempio: Fatturato e dipendenti delle dieci maggiori societ
italiane del 1970.
Societ Fatturato (milioni)
Dipendenti
Fiat Agip Esso Italsider Montecatini Edison Sip-It. Eserc.
Telef. Shell Italiana Magazzini Standa B.P. Italiana Pirelli
S.p.a.
1711845 963184 708469 677698 609489 516030 504716 325679 261490
261355
182522 6657 2377
42060 52279 50132 3661
21958 1303
27700 Totale 6539955 390679
Il fatturato e il numero di dipendenti sono caratteri rilevanti
negli studi di economia industriale. Per il fatturato interessante
conoscere come si distribuisce fra le societ, le quali sono in
questo caso le unit statistiche. Pertanto si tratta di una
distribuzione di quantit. Per quanto attiene ai dipendenti si pu
concentrare lattenzione sul singolo dipendente o sulle societ. Nel
primo caso i 390679 dipendenti (unit statistiche) sono
-
20
classificati secondo la societ di appartenenza. Nel secondo le
societ (unit statistiche) sono classificate in base al numero di
dipendenti (distribuzione di quantit). SERIE STORICHE E
TERRITORIALI Le serie temporali o storiche sono insiemi di quantit
(intensit) o di frequenze di un fenomeno che fanno riferimento alle
modalit del tempo. Gli istanti o gli intervalli di tempo
costituiscono le modalit (grandezze stock e grandezze flusso). Ne
sono esempio la popolazione italiana censita dal 1861 al 1991, il
numero di immatricolati alla Facolt di Economia dalla.a 1995-1996
alla.a. 1999-2000, il valore degli utili conseguiti da unazienda
per un certo numero di esercizi. Le serie territoriali sono insiemi
di quantit (intensit) o frequenze di un fenomeno che fanno
riferimento a divisioni territoriali. Ne sono esempio il consumo di
energia elettrica per usi domestici nelle regioni italiane, il
numero di aziende di un certo settore economico nelle provincie
lombarde.
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
-
21
Elaborazione dei dati statistici Si gi affermato che la
distribuzione di frequenza costituisce la pi completa descrizione
dei fenomeni oggetto di studio. Purtroppo le informazioni presenti
nelle distribuzioni si prestano poco ad essere ricordate e non
permettono confronti immediati. Pertanto si cerca di effettuare
processi di sintesi sulle distribuzioni, volti a determinare poche
grandezze, semplici da ricordare e utili nei confronti. I metodi
che permettono di descrivere le caratteristiche salienti di un solo
fenomeno danno luogo alla statistica descrittiva univariata. I
metodi che permettono di analizzare contemporaneamente due o pi
fenomeni danno luogo alla statistica descrittiva multivariata. Non
sempre i dati sono direttamente confrontabili vuoi perch troppo
complessi, vuoi perch eterogenei. I metodi che
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
-
22
permettono di effettuare confronti pertengono alla statistica
descrittiva. Al fine di effettuare correttamente i confronti bene
che siano sempre soddisfatti i seguenti due postulati. Postulato I
(Confronti fra grandezze omogenee) Due intensit o frequenze di un
medesimo fenomeno o carattere sono sempre comparabili fra loro, a
patto che siano collegate con la variazione sistematica di una sola
circostanza. Postulato II (Confronti fra grandezze eterogenee) Le
intensit o frequenze di fenomeni diversi ammettono confronti a
patto che essi siano riconducibili ad un unico genere, o si trovino
nel rapporto di genere a specie, e purch nessuna delle circostanze
concomitanti differisca sistematicamente. In forza del postulato I
sono confrontabili le produzioni del bene x in Italia registrate
nel 1996 e nel 1991 (varia solo il tempo), mentre
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
-
23
non sono confrontabili la produzione di x in Italia nel 1996 e
la produzione di x in Francia nel 1995 (variano il tempo e il
territorio). Per quanto attiene al postulato II: - sempre possibile
confrontare fra loro le
frequenze delle modalit dello stesso carattere, essendo le
modalit specie dello stesso genere (carattere)
- Sono confrontabili le produzioni di grano e mais, avute nello
stesso territorio e nello stesso anno e misurate nella stessa unit
di misura, in quanto intensit riferentesi a specie dello stesso
genere (cereali).
Entrambi i postulati raccomandano che nel confrontare due
frequenze o due intensit leventuale differenza si deve poter
attribuire ad una sola circostanza. Non sempre i dati, per loro
natura, permettono di operare confronti diretti. Nasce lesigenza di
rintracciare procedimenti tecnici che in alcune circostanze
permettono, con unopportuna trattazione dei dati, di effettuare
confronti fra dati statistici anche se
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
-
24
differiscono per lazione di pi duna circostanza. Possono essere
daiuto i rapporti statistici, che si ottengono facendo il quoziente
fra due quantit delle quali almeno una di natura statistica.
jacoporovatiEvidenziato
-
25
RAPPORTI STATISTICI Si dice rapporto statistico il quoziente fra
due dati, dei quali almeno uno di natura statistica. Vengono
utilizzati per eliminare linfluenza di alcune circostanze che,
altrimenti, non renderebbero confrontabili i dati. Un rapporto
statistico indica la quota del numeratore che idealmente
spetterebbe ad ununit del denominatore. I rapporti statistici pi
comunemente impiegati sono: - i rapporti indici (numeri indici) - i
rapporti di composizione - i rapporti di densit - i rapporti di
derivazione - i rapporti di coesistenza - i rapporti di durata - i
rapporti di ripetizione. Numeri indici Sono impiegati per valutare
le variazioni relative di un fenomeno nel tempo o nello spazio.
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
-
26
Si consideri il Numero degli Iscritti al primo anno Facolt di
Economia ad una certa data (a.a. 1997/98) agosto 97.
G. Mese
G. Sett.
CL DUEA DUSI DUCE DUET TOT. Dip.
TOT. Fac
4 6 8
12 18 19 20 21 22 25 26 27 28 29
L Me V
Ma L
Ma Me G V L
Ma Me G V
23 51 69 76 98 100 105 109 118 134 147 162 178 193
4 9 11 14 19 21 23 24 27 30 34 39 43 45
0 1 2 2 4 4 5 5 5 6 7 7 8
10
2 5
10 10 10 11 11 11 12 15 16 17 20 20
1 3 7 7
10 10 11 13 13 16 17 22 23 23
7 18 30 33 43 46 50 53 57 67 74 85 94 98
30 69 99 109 141 146 155 162 175 201 221 247 272 291
E difficile valutare dallinsieme delle cifre assolute lentit
delle variazioni dei fenomeni nel tempo. Si preferisce, a tal fine,
per ciascun fenomeno, istituire dei rapporti fra ciascun termine ed
un altro della successione stessa, che viene assunto come base.
Solitamente i rapporti cos calcolati vengono moltiplicati per
100.
-
27
Essendo i numeri indici dei numeri puri, cio privi di unit di
misura, spesso possibile istituire tramite essi confronti sulle
variazioni di fenomeni diversi. Si voglia, ad esempio confrontare
lentit delle iscrizioni per il Corso di Laurea e per il DUET
durante la settimana 22-29 agosto 1997, mediante i numeri indici a
base fissa Venerd 22 agosto = 100.
G. Mese
G. Sett.
CL DUET N.I. CL a base fissa 22/8=100
N.I. DUET a base fissa 22/8=100
22 25 26 27 28 29
V L
Ma Me G V
118 134 147 162 178 193
13 16 17 22 23 23
100 113,56 124,58 137,29 150,85 163,56
100 123,08 130,77 169,23 176,92 176,92
(Seguono commenti) E possibile considerare anche i numeri indici
a base mobile, definiti come quoziente fra una grandezza e la
precedente, usualmente moltiplicato per 100. Ci ha senso per serie
di dati ordinabili in base a qualche criterio: per serie temporali
s, per serie territoriali no.
jacoporovatiEvidenziato
-
28
Ecco le due serie di indici a base mobile: G.
Mese G.
Sett. CL DUET N.I. CL a base
mobile N.I. DUET a base
mobile 22 25 26 27 28 29
V L
Ma Me G V
118 134 147 162 178 193
13 16 17 22 23 23
-
113,56 109,70 110,20 109,88 108,43
-
123,08 126,25 129,41 104,55
100
(Seguono commenti) Rapporti di composizione I rapporti di
composizione, detti anche rapporti di parte al tutto, si ottengono
rapportando unintensit (o una frequenza) parziale a quella totale.
Nellesempio precedente non si possono calcolare rispetto ai totali
di colonna in quanto il numero di iscritti a una certa data conta
anche gli iscritti alla data precedente. Ha senso, invece,
considerare le composizioni degli iscritti relativamente a due (o
pi) date. Si confrontino le composizioni degli iscritti per corso
nei giorni 22 e 29 del mese di agosto.
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
-
29
G. Mese
G. Sett.
CL DUEA DUSI DUCE DUET TOT.
22 29
V V
67,43 66,32
15,43 15,46
2,86 3,44
6,86 6,87
7,42 7,91
100 100
(Seguono commenti) Tali rapporti permettono di fare confronti
temporali o spaziali. Le frequenze relative, che saranno prese in
considerazione nel seguito, sono rapporti di composizione. Rapporti
di densit Dicesi rapporto di densit il quoziente fra una
circostanza quantitativa, caratteristica di un fenomeno, e una
dimensione del campo di osservazione. Ad esempio, la densit di
popolazione il rapporto fra il numero di abitanti di un territorio
e la sua superficie (pi corretto sarebbe considerare la superficie
abitabile, in vece di quella ecumenica). Le frequenze specifiche,
che saranno definite in seguito per caratteri quantitativi
riclassificati (in classi) sono rapporti di densit.
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
-
30
Ad esempio, si vogliano confrontare le frequenze del carattere
(quantitativo continuo) reddito annuo lordo dichiarato (in milioni
di lire) dei capifamiglia di 200 nuclei famigliari di un
condominio.
Reddito annuo lordo dichiarato
Frequenze
Meno di 10 10 20 20 25 25 35 35 55 55 75
Almeno 75
17 53 46 34 31 14 5
200
Il particolare rapporto di densit chiamato frequenza specifica -
in questo caso assoluta il quoziente fra la frequenza di una classe
e lampiezza dellintervallo ad essa corrispondente. In questo
esempio si ipotizza che il reddito minimo sia pari a 3 milioni e il
reddito massimo pari a 100 milioni.
jacoporovatiEvidenziato
jacoporovatiEvidenziato
-
31
Reddito annuo lordo dichiarato
Frequenze Ampiezza intervalli
Frequenze specifiche
Meno di 10 10 20 20 25 25 35 35 55 55 75
Almeno 75
17 53 46 34 31 14 5
7 10 5
10 20 20 25
2,42 5,3 9,2 3,4
1,55 0,70 0,20
La frequenza (assoluta) specifica indica il numero di unit
statistiche presenti in un qualunque intervallo di ampiezza
unitaria della classe cui ci si riferisce. In tal modo sono
possibili confronti fra frequenze riferite a classi di ampiezza
differente. Si vogliano, ora, confrontare le frequenze del
carattere (quantitativo discreto) Voto di maturit (convertito in
centesimi) degli intervistati durante la lezione dell8.10.99
(DUET-DUSI) in possesso della maturit scientifica, ipotizzando di
avere riclassificato il carattere altrimenti, i confronti sarebbero
possibili direttamente. Per i caratteri discreti
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
-
32
la dimensione del fenomeno costituita dal numero di modalit
appartenenti a ciascuna classe.
Voto di maturit
Frequenze Numero modalit
Frequenze specifiche
60 61-65 66-70 71-76 77-89
oltre 89
15 20 16 9 4 0
1 65-61+1=5
5 6
13 11
15 4
3,2 1,5
0,31 0
(Seguono commenti) Rapporti di derivazione Dicesi rapporto di
derivazione il quoziente fra lintensit o la frequenza di un
fenomeno e lintensit o la frequenza di un altro fenomeno ritenuto
essere la causa od il presupposto del fenomeno di cui al
numeratore. Si vogliano, ad esempio, confrontare il numero di nati
vivi in due regioni italiane nel medesimo anno. Appare ragionevole
rapportare tali valori al numero di abitanti della rispettiva
regione.
jacoporovatiEvidenziato
jacoporovatiEvidenziato
-
33
Rapporto di derivazione anche il quoziente fra numero di voti
ottenuti da un partito politico e numero di aventi diritto al voto.
Rapporti di coesistenza Esistono fenomeni in qualche modo
antitetici, i quali coesistono; di interesse lo studio simultaneo
di questi fenomeni. Si consideri, ad esempio, la classificazione
dei 232 intervistati durante la lezione dell8.10.99 (DUET-DUSI)
secondo il sesso e il tipo di diploma. Non rispondenti: 3 SD LC LS
LL RG ITIS GEO TUR AL TOT M F
1 6
42 25
2 29
16 26
11 3
3 1
14 20
5 25
94 135
TOT 7 67 31 42 14 4 34 30 229
Pu essere interessante esaminare il rapporto fra il numero di
maschi e il numero di femmine, moltiplicato per 100.
LC LS LL RG ITIS GEO TUR AL TOT 16,7 168 6,9 61,5 366,7 300 70,0
20,0 69,6
Un rapporto di coesistenza il cosiddetto grado di copertura,
ottenuto come quoziente
jacoporovatiEvidenziato
jacoporovatiEvidenziato
-
34
fra il valore delle esportazioni e il valore delle importazioni,
moltiplicato per 100. I rapporti di durata e di ripetizione saranno
spiegati dopo aver introdotto i valori medi.
-
35
FREQUENZE ASSOLUTE, CUMULATE, RELATIVE, SPECIFICHE Le frequenze
relative (o percentuali) si possono calcolare per tutti i tipi di
caratteri considerati, indipendentemente cio dalla scala di
misurazione dei caratteri stessi. In particolare, la generica
frequenza relativa if data dal rapporto fra la frequenza assoluta
in , con cui si presenta li-esima delle r modalit (o classi), ed il
numero totale N delle osservazioni. In formula:
Nnf ii = , per ri ,...,2,1= .
Si verifica facilmente che 11
==
r
iif .
Infatti: 11
111===
===
r
ii
r
i
ir
ii nNN
nf , essendo Nnri
i ==1
.
Moltiplicando le if per 100 si ottengono le frequenze relative
percentuali. Le frequenze relative e le frequenze percentuali sono
utili per fare confronti fra gruppi, classificati secondo il
medesimo
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
-
36
carattere, ma di numerosit diversa. Esse, daltro canto fanno
perdere linformazione sul numero totale delle osservazioni e
risultano poco affidabili quando N molto piccolo. Risulta pertanto
consigliabile: - riportare sempre assieme alle frequenze
relative anche il numero delle osservazioni - avere molta
cautela nellinterpretare
frequenze relative calcolate su poche osservazioni.
Classificazione dei 232 intervistati durante la lezione
dell8.10.99 (DUET-DUSI) secondo il sesso e il tipo di diploma. Non
rispondenti: 3 SD LC LS LL RG ITIS GEO TUR AL TOT M F
1 6
42 25
2 29
16 26
11 3
3 1
14 20
5 25
94 135
TOT 7 67 31 42 14 4 34 30 229
Tipo di diploma Frequenze (assolute)
Frequenze relative
Frequenze percentuali
LC LS LL RG
7 67 31 42
0,0306 0,2925 0,1354 0,1834
3,06 29,25 13,54 18,34
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
-
37
ITIS GEO TUR AL
14 4
34 30
0,0611 0,0175 0,1485 0,1310
6,11 1,75
14,85 13,10
TOTALE 229 1,0000 100,00
Considerando i due gruppi costituiti rispettivamente da maschi e
femmine, si ottiene la seguente tabella:
Maschi Femmine Tipo di
Diploma Freq. (ass.)
Freq. Rel.
Freq. perc.
Freq. (ass.)
Freq. Rel.
Freq. perc.
LC LS LL RG ITIS GEO TUR AL
1 42 2
16 11 3
14 5
0,0106 0,4468 0,0213 0,1703 0,1170 0,0319 0,1489 0,0532
1,06 44,68 2,13
17,03 11,70 3,19
14,89 5,32
6 25 29 26 3 1
20 25
0,0444 0,1852 0,2148 0,1926 0,0222 0,0074 0,1482 0,1852
4,44 18,52 21,48 19,26 2,22 0,74
14,82 18,52
TOT. 94 1,0000 100,00 135 1,0000 100,00
Le frequenze cumulate jN e le frequenze retrocumulate jN possono
calcolarsi per caratteri rilevati su scala (almeno) ordinale non si
possono calcolare per caratteri rilevati su scala nominale.
jacoporovatiEvidenziato
-
38
Le frequenze cumulate sono cos definite:
==
j
iij nN
1 per rj ...,,2,1= .
Esse indicano, per rj ...,,2,1= , lammontare delle unit che
presentano modalit o valori al pi uguali (cio minori o uguali): -
alla j-esima modalit, nel caso di
distribuzioni per modalit - allestremo superiore della j-esima
classe,
nel caso di distribuzioni per classi. Le frequenze retrocumulate
sono cos definite: =
=
r
jiij nN per rj ...,,2,1= .
Esse indicano, per rj ...,,2,1= , lammontare delle unit che
presentano modalit o valori almeno uguali (cio maggiori o uguali):
- alla j-esima modalit, nel caso di
distribuzioni per modalit - allestremo inferiore della j-esima
classe,
nel caso di distribuzioni per classi.
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
-
39
Rapportando le frequenze cumulate o retrocumulate alla numerosit
totale N si ottengono rispettivamente: - le frequenze cumulate
relative, date da:
NN
F jj =
- le frequenze relative retrocumulate, date da:
NN
F jj = .
Ovviamente moltiplicando per 100 le frequenze relative cumulate
e retrocumulate si ottengono, rispettivamente le frequenze
percentuali cumulate e retrocumulate.
Voto di maturit
Frequenze Frequenze Cumulate
Frequenze retrocumulate
60 61-65 66-70 71-76 77-89
oltre 89
15 20 16 9 4 0
15 15+20=35
51 60 64 64
64 64-15=49
29 13 4 0
(Seguono commenti)
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
-
40
Reddito annuo lordo dichiarato
Frequenze Frequenze cumulate
Frequenze retrocumulate
Meno di 10 10 20 20 25 25 35 35 55 55 75
Almeno 75
17 53 46 34 31 14 5
17 70 116 150 181 195 200
200 200-17=183
130 84 50 19 5
Le frequenze specifiche si possono calcolare solo nel caso di
distribuzioni per classi, cio nel caso di caratteri con scala
(almeno) di intervalli. Pertanto la loro determinazione riguarda i
caratteri quantitativi: - discreti con dati raggruppati in classi -
continui. Esse sono utili a cogliere laddensamento delle frequenze
nelle singole classi. Data la loro natura, le frequenze specifiche
vengono anche chiamate densit di frequenza. Le frequenze assolute
(relative) specifiche sono date dal rapporto:
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
-
41
- fra le frequenze assolute (relative) e lampiezza
dellintervallo associato alla classe cui ci si riferisce, nel caso
di caratteri continui
- fra le frequenze assolute (relative) e il numero di modalit
della classe cui ci si riferisce, nel caso di caratteri
discreti.
In tutti i casi la definizione delle frequenze specifiche
presuppone che: - le frequenze assolute o relative siano
distribuite uniformemente allinterno di ciascuna classe;
- non vi siano classi aperte allinizio e/o alla fine della
distribuzione o, in caso contrario, se ne possa determinare il
limite, rispettivamente, inferiore e superiore.
Purtroppo, i precedenti presupposti non sempre trovano riscontro
nella realt. In particolare, la prima assunzione pu non valere,
specialmente quando le classi sono di ampiezza elevata. Quanto al
secondo presupposto, pu essere difficile, se non impossibile,
specificare con
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
-
42
precisione accettabile il limite inferiore e/o superiore
delleventuale classe aperta iniziale e/o finale. Nonostante questi
limiti, vale comunque la pena di calcolare le frequenze specifiche,
al fine di avere informazioni, anche approssimative, su come varia
laddensamento delle frequenze passando da una classe allaltra della
distribuzione (cio al variare delle modalit del carattere).
-
43
RAPPRESENTAZIONI GRAFICHE Le rappresentazioni grafiche
permettono di visualizzare alcune tipologie di frequenze.
Quantunque nella pratica delle indagini statistiche ci simbatta in
un gran numero di tipologie di grafici, in questa sede ci soccuper
solo dalcune di esse, ritenute pi significative. Innanzi tutto le
rappresentazioni grafiche che verranno prese in considerazione
riguarderanno esclusivamente caratteri quantitativi. Ad ogni
tipologia presentata verr premessa la forma analitica della
funzione (matematica) che d origine al grafico. Carattere discreto
Se il carattere non raggruppato in classi, la distribuzione delle
frequenze (assolute) pu essere cos sinteticamente descritta:
=
rj
rj
nnnn
xxxxX
LL
LL
21
21 (1)
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
-
44
La rappresentazione grafica delle frequenze assolute, relative e
percentuali consiste nel cosiddetto diagramma ad aste o a
bastoncini. Vengono riportati su un piano cartesiano gli r punti di
coordinate: - ( )jj nx , per quanto attiene alle frequenze
assolute - ( )jj fx , per quanto attiene alle frequenze
relative - ( )jj fx 100, per quanto attiene alle
frequenze percentuali. I bastoncini sono costituiti dai segmenti
verticali che congiungono lasse delle ascisse ai punti (le cui
ordinate sono le frequenze). La forma analitica delle frequenze
cumulate assolute la seguente:
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
jacoporovatiEvidenziato
-
45
( )
=
-
46
La forma analitica delle frequenze retrocumulate assolute la
seguente:
( )