-
?
INFERENZA STATISTICA Bruno Chiandotto
Dipartimento di Statistica, Informatica, Applicazioni “G.
Parenti”(DISIA)
Firenze, agosto 2017
It is easy to lie with statistics
It is hard to tell the truth without it Andrejs Dunkels
Queste Note didattiche sono state predisposte (in edizione
provvisoria) per facilitare la preparazione
dell'esame di Inferenza statistica previsto nel Corso di laurea
Magistrale in Statistica, Scienze attuariali
e finanziarie dell’Università degli Studi di Firenze. Lo
studente troverà nelle note soltanto alcuni degli
elementi di base del calcolo delle probabilità e dell’inferenza
statistica. Si tratta di un’ introduzione alla
conoscenza dei metodi moderni di analisi statistica dei fenomeni
collettivi da approfondire mediante la
lettura di altri testi.
.
http://www.safs.unifi.it/http://www.safs.unifi.it/
-
B. Chiandotto Versione 2017
INFERENZA STATISTICA
Indice
i
INDICE
0. Premessa
Introduzione 1
0.1 Inferenza statistica classica 3
0.2 Inferenza statistica bayesiana 7
0.3 Teoria statistica delle decisioni 8
0.4 Digressione: scale di misura 12
Conclusioni 15
1. Calcolo delle probabilità
Introduzione 17
1.1 Alcuni concetti di base 17
1.2 Algebra degli eventi 20
1.3 Probabilità 24
1.4 Formula di Bayes 33
1.5 Variabili casuali semplici 37
1.6 Valore atteso di funzioni di variabili casuali semplici
40
1.7 Variabili casuali discrete 50
1.7.1 Binomiale 50
1.7.2 Teorema di Markov 56
1.7.3 Ipergeometrica 60
1.7.4 di Poisson 66
1.7.5 Binomiale negativa 70
1.7.6 Geometrica (di Pascal) 75
1.7.7 Variabili casuali discrete: riepilogo 75
1.8 Variabili casuali continue 79
1.8.1 Normale (di Gauss-Laplace 79
1.8.2 Teorema del limite centrale 87
1.8.3 Log-normale 89
1.8.4 Cauchy 90
1.8.5 Gamma 91
1.8.6 Pareto (I° tipo) 92
1.8.7 Weibull 92
1.8.8 Esponenziale negativa 93
1.8.9 2
di Pizzetti-Pearson 95 1.8.10 Beta 97
1.8.11 Uniforme 101
1.8.12 t di Student 101
1.8.13 F di Fisher-Snedecor 102
1.8.14 Variabili casuali continue riepilogo 103
1.9 Variabili casuali multidimensionali 108
1.10 Valore atteso di funzioni di variabili casuali
multidimensionali 113
1.11 Variabili casuali discrete e continue a k dimensioni
119
1.11.1 Trinomiale (binomiale doppia) 119
1.11.2 Multinomiale e Ipergeometrica a k dimensioni 122
1.11.3 Normale doppia 123
1.11.4 Normale a k dimensioni 131
1.11.5 di Dirichlet 133
1.12 La famiglia esponenziale 133
-
B. Chiandotto Versione 2017
INFERENZA STATISTICA
Indice
ii
1.13 Distribuzioni multiple multivariate 136
1.14 Distribuzioni a priori coniugate 139
2. Campionamento e distribuzioni campionarie
Introduzione 143
2.1 Campioni casuali 143
2.2 Sufficienza 150
2.3 Distribuzioni campionarie 155
2.4 Campionamento da popolazioni normali 163
2.5 Campionamento da popolazioni non normali 166
2.6 Campionamento da due popolazioni indipendenti 172
3. Teoria della stima
Introduzione 175
3.1 Stima puntuale 175
3.1.1 Proprietà degli stimatori 177
3.1.2 Sufficienza 178
3.1.3 Concentrazione e prossimità 178
3.1.4 Efficienza 179
3.1.5 Proprietà asintotiche 184
3.2 Metodi di stima puntuale 185
3.2.1 Minimizzazione dell’errore quadratico medio 186
3.2.2 Massima verosimiglianza 188
3.2.3 Proprietà degli stimatori di massima verosimiglianza
197
3.2.4 Altri metodi di stima 198
3.3 Stima statistica di intervallo (intervalli di confidenza)
200
3.3.1 Intervallo di confidenza per la media di una v.c. normale
con varianza nota 203
3.3.2 Intervallo di confidenza per la media di una v.c. normale
con var. incognita 204
3.3.3 Intervallo di confidenza per la var. di una v.c. normale
con media incognita 206
3.3.4 Intervallo di confidenza per la media di una v.c. con
distribuz. arbitraria 206
3.3.5 Intervalli simultanei di conf. per la media e la varianza
di una v.c. normale 208
3.3.6 Intervallo di confidenza per la differenza tra medie e tra
proporzioni 210
3.3.7 Intervallo di confidenza per la differenza tra medie per
dati appaiati 212
3.3.8 Intervallo di confidenza per il rapporto tra varianze
213
3.4 Determinazione della numerosità campionaria 214
4. Teoria del test delle ipotesi
Introduzione 217
4.1 Verifica di ipotesi statistiche 217
4.1.1 Ipotesi semplici 221
4.1.2 Ipotesi composite 226
4.2 Test sulla media 227
4.2.1 p-value 234
4.2.2 Potenza del test 236
4.3 Test sulla varianza 246
4.4 Test sulla probabilità 249
4.5 Determinazione della dimensione campionaria 253
4.6 Confronto tra campioni 255
4.6.1 Confronto tra medie 256
4.6.2 Confronto tra proporzioni 262
4.6.3 Confronto tra varianze 265
4.6.4 Confronto per dati appaiati 268
-
B. Chiandotto Versione 2017
INFERENZA STATISTICA
Indice
iii
4.7 Determinazione della dimensione campionaria 271
5. Modello statistico lineare
Introduzione 275
5.1 Modello di regressione lineare semplice 277
5.1.1 Ipotesi di specificazione (caso A) 280
5.1.2 Stima dei minimi quadrati 281
5.1.3 Ipotesi di specificazione (caso B) 289
5.1.4 Stima di massima verosimiglianza 290
5.1.5 Stima di intervallo 291
5.1.6 Test delle ipotesi 295
5.1.7 Trasformazione di modelli non lineari 296
5.2 Coefficiente di correlazione lineare 296
5.3 Modello di regressione lineare multipla 300
5.3.1 Ipotesi di specificazione (caso A) 300
5.3.2 Stima dei minimi quadrati 301
5.3.3 Ipotesi di specificazione (caso B) 306
5.3.4 Stima di massima verosimiglianza 306
5.3.5 Stima di intervallo e test delle ipotesi 307
5.4 Modello di analisi della Varianza (ANOVA) 316
5.4.1 Analisi a un criterio di classificazione 317
5.4.2 Analisi a due criterio di classificazione 320
5.5 Analisi della Varianza e modello di regressione 326
5.6 Analisi della covarianza (ANCOVA) 330
6. Inferenza statistica bayesiana
Introduzione 333
6.1 Formula di Bayes 336
6.2 Distribuzioni a priori coniugate 342
6.3 Distribuzioni a priori non informative 355
6.4 Stima e teoria del test delle ipotesi in ottica bayesiana
359
6.5 Regressione bayesiana 365
6.5.1 Regressione bayesiana con distribuzioni a priori non
infor. e coniugate 367
7. Teoria statistica delle decisioni
Introduzione 373
7.1 Teoria delle decisioni 373
7.2 Decisioni basate sulle sole informazioni a priori 377
7.2.1 Assiomi di comportamento razionale (Ia parte) 378
7.2.2 Assiomi di comportamento razionale (2a parte) 379
7.2.3 Assiomi di comportamento razionale (3a parte) 382
7.3 Decisioni in situazioni di estrema incertezza 384
7.4 Struttura del processo decisionale 387
7.5 Decisioni basate sulle sole informazioni campionarie 392
7.6 Decisioni basate su informazioni a priori e informazioni
campionarie 399
7.7 Valore dell’informazione 408
7.8 Teoria causale delle decisioni 415
Riferimenti bibliografici 419
-
B. Chiandotto Versione 2017
INFERENZA STATISTICA
Premessa
1
PREMESSA
Introduzione
Nello studio dei fenomeni1 di qualunque natura essi siano
(economici, aziendali, fisici,
biologici, ecc.) e qualunque sia la finalità (puramente
conoscitiva o operativa) che
s’intende perseguire, sorge sovente la necessità di
rappresentare le manifestazioni dei
fenomeni stessi attraverso tabelle e grafici per recepire più
immediatamente particolari
caratteristiche del fenomeno oggetto di analisi; altre volte,
può interessare cogliere nella
multiforme variabilità o mutabilità2 delle loro manifestazioni
quello che in esse c'è di
tipico o di costante, o magari interessa fornire una qualche
misura della diversità stessa
e/o di voler evidenziare in qualche modo l’eventuale relazione
che lega fenomeni
diversi ma logicamente collegati; infine, si può avere interesse
a rappresentare il
fenomeno o la relazione tra fenomeni mediante specifici modelli
analitici che,
schematizzando e semplificando la realtà, ne rendono più facile
la comprensione.
L’interesse può riguardare quindi:
a. l’esecuzione di rappresentazioni tabellari e grafiche che
mettano in evidenza
certi aspetti generali del fenomeno o dei fenomeni oggetto di
analisi
(rappresentazioni tabellari e grafiche);
b. il calcolo di indici che mettano in evidenza quello che c'è
di tipico nelle
manifestazioni dei fenomeni (rappresentazioni sintetiche: valori
medi);
c. il calcolo di indici che mettano in evidenza quello che c'è
di mutabile e/o
variabile nelle manifestazioni di fenomeni (rappresentazioni
sintetiche: indici
di variabilità e/o mutabilità);
d. la misura della relazione tra fenomeni mediante appropriati
indici
(rappresentazioni sintetiche: indici di associazione);
e. l’introduzione di modelli che esprimano analiticamente
l'insieme delle
manifestazioni del fenomeno e/o la relazione tra fenomeni
(rappresentazioni
analitiche).
In seguito verranno distinti i modelli probabilistici dai
modelli statistici. I modelli
probabilistici, quali rappresentazioni, nella generalità dei
casi, approssimate della realtà,
1 In questa nota tutte le volte che si usa il termine fenomeno
si fa riferimento al così detto fenomeno collettivo, cioè
ad un fenomeno la cui misura e conoscenza richiede
l’osservazione di una pluralità di sue manifestazioni. 2 Si dice
variabile il fenomeno collettivo le cui manifestazioni si
diversificano per grandezze numeriche enumerabili o
misurabili (caratteri quantitativi), si dice mutabile il
fenomeno collettivo le cui manifestazioni si diversificano per
attributi non numerici (caratteri qualitativi) che possiedono, o
meno, un ordine naturale di successione (cfr.
Digressione sulle scale di misura in questo capitolo) . Come si
avrà modo di chiarire nelle pagine seguenti, la natura,
quantitativa o qualitativa, delle modalità classificatorie
condiziona interamente il processo di analisi statistica dei
dati:
dalla fase della loro raccolta a quella dell’elaborazione
finale.
-
B. Chiandotto Versione 2017
INFERENZA STATISTICA
Premessa
2
consentono una più immediata comprensione degli aspetti più
rilevanti relativi ai
fenomeni di interesse. Per contro, i modelli statistici, oltre
ad essere rappresentazioni
semplificata della realtà, facilitano anche la formulazione di
previsioni e consentono la
ricerca di nessi causali fornendo informazioni utilizzabili a
fini decisionali.
In particolare, se si è interessati alla conoscenza di un certo
fenomeno (carattere) F si
possono rappresentare le sue possibili manifestazioni (modalità
del carattere) come
punti di un insieme P (popolazione). Ovviamente non tutti i
punti hanno lo stesso peso,
e cioè può accadere che una determinata manifestazione
(specifica modalità del
carattere considerato) si realizzi più frequentemente di una
seconda e questa con
maggiore frequenza di una terza e così via, in tal caso, a
ciascun punto resta associato
un peso che, a seconda del contesto di riferimento, statistico o
probabilistico, assume la
denominazione di frequenza relativa o di probabilità.
All'insieme P può essere associato un secondo insieme R che può
essere chiamato
caratteristico, cioè l'insieme di tutti gli indici
caratteristici di compattazione dei dati
che possono essere derivati applicando le funzioni (da
intendersi in senso lato come
gruppo di operazioni logiche o algebriche di qualunque natura) 1
2, ,......, hg g g ,
all'insieme P in modo tale che ciascun elemento di R, che può
essere definito l'insieme
delle rappresentazioni statistiche, consenta una più facile ed
immediata comprensione
del fenomeno F.
Quella riportata nella Fig.0.1 è una schematizzazione
estremamente semplificata dei
problemi propri della cosiddetta statistica descrittiva cui si è
riferito ai punti a., b., c., d.
ed e., elencati in precedenza. La figura rettangolare contiene
la strumentazione (metodi
di compattazione) capace di trasformare i dati in
informazioni.
Statistica descrittiva
Fig. 0.1 - Rappresentazione schematica della struttura logica
del metodo statistico
F P R
h
i
1
g
g
g
-
B. Chiandotto Versione 2017
INFERENZA STATISTICA
Premessa
3
0.1 - Inferenza statistica classica
Nelle argomentazioni svolte, si è implicitamente ipotizzato di
avere a disposizione
tutte le manifestazioni del fenomeno o dei fenomeni oggetto di
analisi, e di voler in
qualche modo, attraverso tabelle, grafici o calcolo di indici
caratteristici, ecc.,
compattare i dati a disposizione, ovvero raccogliere molteplici
aspetti in un solo
aspetto, individuare il costante nel variabile, accentuare
quella particolarità del
fenomeno che più interessava oscurandone altre ecc.. Quella
prospettata non è,
usualmente, la realtà in cui si opera: nella generalità dei casi
si deve procedere
nell’analisi di un fenomeno, avendo a disposizione soltanto una
parte delle
manifestazioni dello stesso. In altri termini si dispone di un
sottoinsieme C (campione)
di manifestazioni del fenomeno F pur restando inalterato il
problema di comprensione
del fenomeno stesso attraverso l'utilizzo di tabelle, grafici e
appropriati indici di
compattazione.
Si supponga di essere interessati ad un particolare indice
caratteristico che
sintetizza specifici aspetti del fenomeno di interesse e che
questo possa essere
determinato applicando la funzione g a tutte le manifestazioni
del fenomeno di
interesse, ma che sia impossibile effettuare una tale operazione
potendo disporre
soltanto di un sottoinsieme di tali manifestazioni.
Il problema da risolvere è quello dell’individuazione di una
funzione t , non
necessariamente uguale a g , che applicata ai dati campionari
fornisca un punto ̂
che sia il più vicino possibile a (cfr. Fig. 0.2); interessano,
cioè, indici che siano
rappresentativi non di particolari aspetti del fenomeno, così
come risulta dall'insieme
parziale delle sue manifestazioni, ma come risulterebbe se si
disponesse dell'insieme di
tutte le sue manifestazioni.
Con un linguaggio più tecnico si dice che ̂ deve essere una
buona stima di ; in
realtà, come si avrà modo di chiarire successivamente, più che
di buona stima si parlerà
di buon stimatore, poiché non è possibile misurare la “distanza”
di una quantità nota ̂
ad una quantità incognita . Pertanto, è il procedimento che si
segue per ottenere la
quantità ̂ che può essere “buono” o “cattivo”, e la “bontà”
(proprietà augurabili)
dovrà valere qualunque sia il valore di , bontà che si misura
attraverso l'analisi del
suo comportamento nell'insieme di tutti i possibili campioni
estraibili dalla popolazione
(universo dei campioni).
La stima, è il primo dei due problemi che costituiscono
l'oggetto di studio
dell’inferenza statistica. Un tale problema consiste, come già
detto, nel cercare di
estendere le conclusioni relative alla misura di un certo indice
caratteristico, derivanti da
-
B. Chiandotto Versione 2017
INFERENZA STATISTICA
Premessa
4
un insieme parziale di manifestazioni di un determinato
fenomeno, all'insieme di tutte le
sue manifestazioni effettive o potenziali.
Se le conclusioni cui si vuol pervenire non riguardano
direttamente la misura di una
entità incognita ma la ragionevolezza di una specifica
assunzione relativa a tale entità si
ha a che fare con il secondo problema di cui si occupa la
statistica induttiva: “il test
delle ipotesi (statistiche)”.
Inferenza statistica classica
DEDUZIONE INDUZIONE
(Calcolo delle Probabilità) ( Inferenza statistica)
Fig. 0.2 - Rappresentazione grafica del processo di induzione
statistica (inferenza classica)
I problemi della stima e quello del test delle ipotesi sono
strettamente collegati ma
coinvolgono problematiche logicamente diverse e devono,
pertanto, essere tenuti
distinti. Facendo sempre riferimento all'indice , un test
statistico si risolve nella
formulazione di un'ipotesi sul presumile vero valore dell'indice
per poi decidere, sulla
scorta dell'evidenza campionaria, se accettare o meno l'ipotesi
formulata.
Come già sottolineato, la complessa natura dei fenomeni
economici, biologici, fisici,
ingegneristici, ecc. oltre a giustificare l'esistenza di metodi
statistici sempre più raffinati,
esige spesso l'introduzione di modelli analitici che,
semplificando e schematizzando la
realtà, ne rendono più facile la comprensione.
F
P
R
SPAZIO o UNIVERSO
dei Campioni
C
1
i
h
g
g
g
k
i
1
t
t
t
Rc
-
B. Chiandotto Versione 2017
INFERENZA STATISTICA
Premessa
5
Poiché una serie innumerevole di fenomeni nelle varie scienze è
governata da leggi
aventi natura aleatoria, ne consegue immediatamente che i
modelli probabilistici
risultano essere i più appropriati per descrivere le loro
manifestazioni (cfr. Fig. 0.3).
Deduzione
(Probabilità)
Induzione
(Inferenza statistica)
Fig. 0.3 - Relazioni tra probabilità, statistica induttiva,
evidenza empirica e modello.
Anche se fra i criteri logici od empirici che possono guidare
nella individuazione del
modello rappresentativo più opportuno alcuni hanno validità
generale, usualmente essi
sono strettamente connessi alla natura e al tipo del fenomeno
che si intende analizzare.
Al riguardo si deve sottolineare che quando si procede
all'introduzione di un modello
analitico per esprimere le manifestazioni di un fenomeno di
interesse, non ha più senso
parlare di popolazione in quanto la popolazione è rappresentata
dal modello stesso,
espressione del processo di generazione dei dati, e le
manifestazioni del fenomeno o dei
fenomeni d’interesse osservate hanno, necessariamente, sempre
natura di manifestazioni
campionarie essendo la popolazione rappresentata analiticamente
attraverso il modello
stesso (superpopolazione)3.
La rappresentazione analitica dei fenomeni si risolve, nel caso
in cui si considera, ad
esempio, un solo carattere quantitativo, nella introduzione di
un simbolo X al quale è
associata una funzione di massa di probabilità, nel caso
discreto, di densità di
probabilità, nel caso continuo, del tipo:
; f x per x S e Θ
dove: S rappresenta lo spazio campionario di definizione di x,
cioè lo spazio (supporto)
di tutti i valori assumibili dall'entità variabile x ; il
parametro o i parametri
3 Questa affermazione vale, ovviamente, anche quando
s’introducono modelli analitici per rappresentare le relazioni
(associazione) tra caratteri.
UNIVERSO
DEI
CAMPIONI
SITUAZIONE
REALE
EVIDENZA
EMPIRICA
(CAMPIONE)
MODELLO
-
B. Chiandotto Versione 2017
INFERENZA STATISTICA
Premessa
6
caratteristici del modello; Θ 4 lo spazio parametrico, cioè lo
spazio di tutti i valori
assumibili dal parametro/i, usualmente incognito/i, . Come si
avrà modo di verificare
successivamente, tra gli indici caratteristici (misure di
compattazione delle
manifestazioni dei fenomeni di interesse) ed i parametri
caratteristici, esiste una stretta
relazione analitica.
Quando si ritiene opportuna l'introduzione di un modello
analitico per rappresentare
le manifestazioni di un fenomeno di interesse, si possono
distinguere almeno due
situazioni di mancanza di conoscenza: la prima situazione è
quella caratterizzata da una
conoscenza parziale della funzione 1 2 ; , ,...., ; kf x f x nel
senso che si
conosce la forma analitica della funzione ma non si conosce il
valore di tutti o di alcuni
dei parametri che caratterizzano la funzione stessa, in questa
circostanza si parla di
inferenza statistica parametrica. La seconda situazione è quella
di mancata conoscenza
della forma analitica del modello, in questa circostanza si
parla di inferenza statistica
non parametrica. Una terza situazione, intermedia rispetto alle
due precedenti, è quella
in cui si specificano certe componenti del modello (ad esempio
si suppone che la v.c.
appartenga alla famiglia esponenziale ma non si specifica la
sottofamiglia: forma
funzionale della funzione di massa o di densità). Se si opera in
tale contesto si parla di
inferenza statistica semi-parametrica, nel senso che la forma
analitica del modello è
specificata solo parzialmente.
La dizione inferenza statistica non parametrica non è certamente
la più appropriata in
quanto interpretabile come se, in questo ambito, le procedure di
statistica induttiva non
riguardassero i parametri. Ovviamente, questa interpretazione è
fuorviante, infatti, con
la dizione “non parametrica” si vuole, molto semplicemente,
caratterizzare le situazioni
inferenziali nelle quali non si conosce la forma analitica e,
ovviamente, il valore dei
parametri caratteristici, elementi questi entrambi coinvolti
nelle procedure inferenziali.
La dizione corretta per caratterizzare tali situazioni è quella
di inferenza statistica libera
da distribuzione (distribution free).
Ai problemi di stima e di test delle ipotesi, che in questo
contesto possono riguardare
i soli parametri caratteristici od anche la forma analitica del
modello cui si ritiene
opportuno fare ricorso, si aggiunge la necessità di procedere ad
una misura e verifica
della capacità (bontà) rappresentativa (adattamento) del modello
stesso.
La stima e il test delle ipotesi sono, in un contesto lievemente
differente, gli stessi
due problemi di stima e di verifica delle ipotesi sopra
considerati.
Uno degli aspetti più importanti di cui la statistica si occupa,
è dunque quello
dell'estensione di conclusioni da un campione di osservazioni
alla popolazione o
superpopolazione, nel caso in cui si procede all’impiego di
modelli, dal quale il
campione è stato estratto. Se si fa riferimento ai modelli, tale
problema si risolverà
nell'utilizzo dei dati campionari per la scelta, la modifica e
la misura del grado di
4 In queste note il carattere in grassetto sta ad indicare che
il simbolo utilizzato fa riferimento ad un vettore e/o ad una
matrice e non a uno scalare; nel caso specifico i simboli e Θ
stanno ad indicare che si sta trattando di uno o più parametri.
-
B. Chiandotto Versione 2017
INFERENZA STATISTICA
Premessa
7
rappresentatività dei modelli, od anche, nella verifica di
ipotesi statistiche sulla forma
e/o sul valore dei parametri che caratterizzano i modelli
stessi.
0.2 - Inferenza statistica bayesiana
Le considerazioni fino ad ora svolte riguardano la cosiddetta
inferenza statistica
classica (frequentista): in questo contesto, per pervenire a
delle conclusioni sulla
popolazione, o sulla sua rappresentazione attraverso un modello,
si utilizzano i soli dati
campionari (insieme parziale di manifestazioni del fenomeno
d’interesse).
Un diverso modo per risolvere i problemi di induzione statistica
è quello usualmente
noto come approccio bayesiano all’inferenza statistica (cfr.
Fig. 0.4). L’elemento
caratterizzante di questo approccio è l’utilizzo esplicito e
formalizzato del bagaglio
conoscitivo pregresso (informazioni a priori) sul fenomeno
d’interesse. Si deve, però,
sottolineare che l’elemento distintivo del ragionamento
bayesiano non risiede tanto
nell’utilizzo delle informazioni a priori (queste infatti
vengono utilizzate, come si avrà
modo di chiarire in seguito, anche nell’approccio classico
all’inferenza statistica),
quanto nel diverso modo attraverso il quale le informazioni a
priori vengono utilizzate.
Inferenza statistica bayesiana
Fig.0.4 - Rappresentazione grafica del processo di induzione
statistica (inferenza bayesiana)
Se si prevede l’impiego di modelli rappresentativi della realtà
(del fenomeno e/o
delle relazioni tra fenomeni), la conoscenza a priori si risolve
nell’introduzione di una
F
P
R
Rc
C
1
i
h
g
g
g
1
i
k
s
s
s
Informazioni
a priori
-
B. Chiandotto Versione 2017
INFERENZA STATISTICA
Premessa
8
distribuzione di probabilità sul parametro o sui parametri
caratteristici del modello che
assumono, in tale ottica, la natura di variabili casuali e non
più, come accade nell’ottica
classica, quella di costanti incognite.
In precedenza, trattando dei modelli rappresentativi dei
fenomeni, in funzione del
patrimonio conoscitivo disponibile si è operata la distinzione
inferenza statistica
classica parametrica, non parametrica e semiparametrica;
analogamente, in funzione
del patrimonio conoscitivo disponibile, si parlerà di inferenza
statistica bayesiana
parametrica, inferenza statistica bayesiana non parametrica e
inferenza statistica
bayesiana semiparametrica.
In altri termini, nel contesto classico, dato il modello
; f x per x S e Θ
nel caso parametrico l’unica incognita è rappresentata dal
parametro (o
parametri) che lo caratterizzano e i dati campionari verranno
utilizzati per
trarre conclusioni su tale entità;
nel caso non parametrico sono incognite sia il parametro (o
parametri) che lo
caratterizzano, sia la forma analitica , f del modello e i dati
campionari
verranno utilizzati per trarre conclusioni sia sulla forma
analitiche sui parametri.
Nel contesto bayesiano, dati i modelli5
, f x per x S e Θ
per e Θ
dove , rappresenta la distribuzione a priori del parametro (o
parametri) ,
i parametri (detti iperparametri) che caratterizzano la
distribuzione a priori. la
dizione di inferenza bayesiana parametrica, non parametrica e
semiparametrica,
dipenderà dallo stato di conoscenza sulla forma analitica delle
funzioni , f x e
; .
0.3 - Teoria statistica delle decisioni
Per comprendere i fenomeni occorre procedere all’analisi delle
loro manifestazioni, se
ci si domanda poi per quale ragione si è interessati ad una tale
comprensione, la risposta
è che si può voler soddisfare una mera esigenza conoscitiva fine
a se stessa, o che la
conoscenza è finalizzata alla risoluzione di uno specifico
problema decisionale.
In un contesto decisionale, la scelta può riguardare gli aspetti
più diversificati che
vanno da quelli quotidiani più banali (dovendo raggiungere un
luogo di lavoro o di
studio distante dalla propria abitazione ci si può servire di un
mezzo pubblico di
5 Si richiama l’attenzione sulla simbologia utilizzata:
l’espressione con il punto e virgola come elemento separatore
delle due entità dell’argomento ; f x indica che la prima entità
è una variabile mentre la seconda è una
costante, per contro quando l’elemento separatore è una virgola
, f x entrambe le entità sono delle variabili.
-
B. Chiandotto Versione 2017
INFERENZA STATISTICA
Premessa
9
trasporto o utilizzare l’automobile personale o chiamare un
taxi; dovendo uscire di casa
con tempo incerto si deve decidere se prendere o meno
l’ombrello, ecc.), a quelli
relativamente più complessi riguardanti, ad esempio, il gestore
di una piccola attività
commerciale (procedere o meno alla ristrutturazione, e in che
modo, dei locali in cui si
svolge l’attività commerciale, effettuare, e in che forma e
tramite quale veicolo, o meno
attività promozionali, e fino a che punto, e in che modo,
ampliare la gamma di prodotti
offerti, ecc.) fino a quelli più complessi ed articolati quali,
ad esempio quelli propri
delle imprese di medie e grandi dimensioni (procedere alla
produzione di un nuovo
modello, e quale, di automobile, procedere - come, dove e con
quali dimensioni - o
meno all’impianto di un nuovo stabilimento, ecc.).
Qualunque problema decisionale da risolvere, dal più banale al
più complesso,
richiede la chiara definizione del problema stesso e
l’individuazione delle possibili
relazioni che connettono i vari elementi o aspetti che lo
caratterizzano.
Il quadro logico di riferimento e le informazioni sono gli
ingredienti basilari di ogni
processo decisionale, la teoria delle decisioni, la teoria
statistica ed i metodi e i modelli
sviluppati in questi ambiti disciplinari sono gli strumenti
essenziali (e necessari) per lo
svolgimento ottimale di ogni processo decisionale, decisioni
che, come già sottolineato
e come si avrà modo di verificare successivamente, devono essere
nella generalità dei
casi prese in situazioni di conoscenza parziale della realtà in
cui si opera6.
Si è già detto che la disciplina che si occupa della raccolta e
del trattamento
scientifico dei dati statistici (manifestazioni dei fenomeni
collettivi di interesse) è la
Statistica, se poi le informazioni stesse devono essere
utilizzate per risolvere uno
specifico problema decisionale, cioè un problema che si risolve
nella scelta ottimale di
una tra diverse alternative a disposizione, allora il contesto
di riferimento è la Teoria
delle decisioni. Nella fusione delle due discipline si sostanzia
un’altra disciplina
scientifica: “La Teoria statistica delle decisioni” o “Teoria
delle decisioni statistiche”
che per certi versi può essere intesa come generalizzazione ed
estensione della Statistica
che in questo modo risulta anche meglio caratterizzata nelle sue
diverse connotazioni e
meglio precisata nei contenuti. In altri termini si può anche
definire la statistica come il
fondamento logico e metodologico per la risoluzione dei problemi
decisionali.
La teoria delle decisioni fissa principi razionali di
comportamento che consentono la
derivazione di regole di scelta ottimale. Gli sviluppi più
recenti di tale teoria consentono
anche di valutare e correggere eventuali incoerenze e
contraddizioni nel comportamento
dei decisori.
E’ già stato sottolineato che nel contesto empirico l’elemento
fondamentale di
riferimento sono i dati statistici (disponibili e/o acquisibili)
e che la statistica può essere
identificata come la disciplina che tratta di metodi attraverso
i quali i dati statistici, cioè
6 Come già sottolineato, due sono i motivi principali che
determinano una conoscenza parziale della realtà:
l’impossibilità o la non convenienza di acquisire tutte le
informazioni relative agli aspetti che interessano pur
essendo, almeno teoricamente, possibile una tale acquisizione, o
la non disponibilità, neppure potenziale, delle
informazioni, ed è questo il caso in cui le manifestazioni del
fenomeno di interesse riguardano eventi futuri o sono
rappresentate attraverso un modello analitico.
-
B. Chiandotto Versione 2017
INFERENZA STATISTICA
Premessa
10
le manifestazioni dei fenomeni di interesse, dovrebbero o
potrebbero essere impiegati
per ottenere, in funzione delle specificità del problema
analizzato, una rappresentazione
semplificata della realtà (i dati vengono trasformati in
informazione) facendo emergere
le caratteristiche che interessano in dipendenza degli obiettivi
che s’intendono
perseguire (l’informazione diventa conoscenza utilizzabile a
fini decisionali).
In tale ottica, assumono rilevanza ulteriori elementi quali
l’esatta definizione della
qualità e quantità d’informazione che s’intende acquisire, la
decisione sui tempi e sui
modi di acquisizione e la valutazione dei costi connessi.
La statistica, che si occupa della raccolta e del trattamento
finalizzato dei dati, entra,
a pieno titolo, in ogni processo decisionale, finalizzato al
conseguimento di uno
specifico obiettivo, che prevede l’utilizzo di informazioni. Un
processo nel quale:
l’input (materia prima) è costituito da dati statistici riferiti
ad una specifica
realtà, della quale rappresentano qualitativamente e/o
quantitativamente uno o
più aspetti;
la trasformazione avviene attraverso l’impiego di procedure e
metodi analitici;
l’output (prodotto) è la conoscenza del fenomeno indagato la cui
natura e
interpretazione dipende dagli input utilizzati e dal meccanismo
logico e
metodologico di elaborazione e dalle finalità che s’intendono
perseguire.
Da quanto sopra detto, emergono almeno tre insiemi di elementi
caratteristici:
un insieme di elementi che vengono introdotti quali input nel
processo di
trasformazione;
un insieme di procedure di elaborazione;
un insieme di prodotti costituito da tutte le modalità
assumibili dai risultati
conseguenti l’applicazione delle procedure.
Si supponga ora che sia sempre possibile associare ad ogni
prodotto la descrizione
delle conseguenze che scaturiscono dalla scelta, le quali
assumeranno una fisionomia
particolare a seconda dell’oggetto del problema: se si tratta di
operare una
compattazione di dati osservati con l’obiettivo di mettere in
risalto una caratteristica
specifica del fenomeno, le conseguenze potranno essere descritte
dalla perdita (di
informazione) determinata dal processo, oppure, se il problema è
finalizzato alla scelta
di una modalità operativa, le conseguenze potranno essere
identificate in perdite
monetarie o di altra natura ed essere, eventualmente, collegate
ad errori commessi nel
processo di trasformazione.
Risulta, pertanto, definito un quarto insieme di elementi:
l’insieme delle conseguenze.
Il criterio guida nell’operare la trasformazione dei dati
consiste, per quanto possibile,
nell’evitare conseguenze negative. Ne deriva che l’informazione
circa le conseguenze
assume una rilevanza esclusiva ed un ruolo condizionante
rispetto ad ogni altra tipologia
(disponibile) per la quale si renderà, appunto, necessario un
confronto o, meglio,
un’integrazione con i dati di perdita già definiti.
-
B. Chiandotto Versione 2017
INFERENZA STATISTICA
Premessa
11
La traccia originale viene, quindi, specificata e organizzata
secondo lo schema
seguente: avendo definito l’insieme dei risultati possibili (le
informazioni finali) e
avendo individuato le perdite corrispondenti, l’elaborazione
deve essere effettuata
avendo come obiettivo la minimizzazione della perdita.
Considerando che, con l’impostazione sopra delineata, sulla base
di una funzione di
perdita viene selezionato l’elemento ottimo (quello cioè cui
corrisponde la perdita
minima), risulta naturale attribuire agli specifici elementi che
costituiscono l’insieme
dei prodotti l’identità di decisioni, nel senso che essi
rappresentano le alternative
possibili del risultato di un problema del quale è stato
specificato l’obiettivo. Si può,
pertanto, accantonare l’espressione processo di trasformazione
(compattazione) dei
dati e fare riferimento al problema decisionale quale
schematizzazione che prevede la
lista di tutti gli esiti possibili e la scelta di quello ottimo
secondo il criterio di
minimizzazione della perdita.
Assumendo come struttura di riferimento quella sopra introdotta
è possibile
formulare, senza perdere in generalità e senza condizionamenti,
ogni problema statistico
in termini decisionali.
A proposito dell’ultima affermazione fatta, sorge una
problematica di estrema
rilevanza riguardo ai vantaggi e alle difficoltà, se non
addirittura alla ragionevolezza,
propria di una impostazione quale è quella decisionale. Alcuni
autori ritengono
l’impostazione decisionale applicabile ai soli problemi con
finalità operative, altri
considerano (come l’autore di queste note) la logica decisionale
applicabile, secondo
modalità particolari, a tutte le problematiche descrittive e/o
inferenziali anche quando
queste sono caratterizzate da finalità esclusivamente
conoscitive, altri ancora ritengono
la logica decisionale semplicistica ed oltremodo riduttiva.
Gli elementi a sostegno dell’impostazione decisionale sono
innumerevoli e di varia
natura. Si può, innanzi tutto, osservare che la duplice
finalità, conoscitiva ed operativa,
assegnata alla statistica quale disciplina scientifica, con
conseguente attribuzione dei
problemi decisionali alla seconda finalità, si risolve,
semplicemente, nella
specificazione della duplice tipologia di prodotti che vanno a
costituire l’insieme delle
decisioni espresse come:
azioni da intraprendere e da realizzare concretamente;
affermazioni da formulare le quali, a loro volta, possono
configurarsi come
asserzioni che specificano la conformità dell’evidenza osservata
nei
confronti di una o più ipotesi assunte a priori;
asserzioni che specificano la stima di una quantità incognita
e/o
l’adattamento di un modello teorico ad una specifica realtà di
interesse,
ecc..
Il problema si risolve sempre in una decisione, che poi questa
sia orientata al cosa
dire o al cosa fare è solo una questione di specificità della
situazione in cui lo statistico
opera. Se si parla poi di atti o decisioni in termini più
generali, nel senso di scelte, la
suddivisione diventa addirittura artificiosa se si pensa che
ogni azione può essere
-
B. Chiandotto Versione 2017
INFERENZA STATISTICA
Premessa
12
considerata come l’effetto dell’affermazione: “ la decisione d ”
è la migliore possibile.
Ne scaturisce, allora, una differenza solo verbale,
terminologica e, quindi, non
sostenibile dal punto di vista concettuale.
Un altro rilevante aspetto che può consigliare la scelta
decisionale, risiede nella
logica interna propria della teoria statistica delle decisioni
che induce a formulare ed
interpretare correttamente un problema statistico. Si tratta di
una correttezza che può
essere ricondotta a due fatti essenziali: gli obiettivi che
s’intendono perseguire e i dati
utilizzabili. L’obiettivo della minimizzazione della perdita
evidenzia, infatti, la
parzialità e la particolarità del risultato che scaturisce
dall’elaborazione: problemi
analoghi affrontati con specificazioni diverse della funzione di
perdita possono
condurre, anzi generalmente conducono, a conclusioni diverse in
quanto collegate ad
elementi diversi dell’insieme delle decisioni possibili.
Quale soluzione è quella giusta è quale è quella sbagliata?
Nessuna delle due, oppure
entrambe se viste in ottiche diverse; il giudizio non deve
essere formulato in termini di
correttezza o errore, si può solo dire che, ritenendo valida
(accettabile, verosimile) una
struttura di perdita così come è rappresentata dalla funzione
prescelta, la decisione
migliore è quella che risulta dall’imposizione della condizione
di perdita minima.
L’ultima riflessione si ricollega alla necessità di attribuire
ai dati una specifica forma
per poter ottenere una rappresentazione (compattazione) degli
stessi significativa. La
realtà non è né descrivibile né rappresentabile senza ricorrere
a schemi concettuali di
riferimento e in corrispondenza di ognuno di essi si ottiene un
risultato, evidentemente
parziale e condizionato allo schema specificato. La logica
decisionale, i cui risultati
sono condizionati alla particolare funzione di perdita
specificata, fa emergere in modo
inequivocabile tale consapevolezza.
Non è infrequente imbattersi in situazioni operative nelle quali
la decisione si riflette
sulla situazione reale determinandone in qualche modo i
mutamenti, diventa allora
indispensabile procedere ad una ulteriore approfondimento
dell’analisi avendo come
obiettivo l’individuazione dei nessi causali presenti nel
contesto di interesse. Nessi
causali che, una volta definiti nelle loro specificità, devono
essere inseriti nella
procedura di analisi valutandone l’impatto sulle conseguenze
relative alle singole
azioni.
A conclusione di questa introduzione si sottolinea che, sempre
in funzione del
contesto in cui si opera, si distinguerà la teoria statistica
delle decisioni in classica e
bayesiana che potrà essere ulteriormente distinta in causale o
non causale7.
0.4 - Digressione: scale di misura
Come sottolineato più volte, uno dei compiti principali della
statistica è quello di
descrivere i fenomeni collettivi come primo passo verso la loro
spiegazione, cui si può
pervenire anche applicando i metodi induttivi della statistica
attraverso la verifica
7 Il lettore interessato ad un approfondimento dell’argomento
può utilmente consultare , tra gli altri, Chiandotto
(2012 e 2013). I due contributi sono riportati nella stessa
pagina web di queste note.
-
B. Chiandotto Versione 2017
INFERENZA STATISTICA
Premessa
13
empirica di ipotesi sviluppate sul piano teorico. Ma il
passaggio dal piano teorico a
quello empirico non è per niente immediato; per poter connettere
i concetti, sviluppati
nel contesto teorico ed in quello empirico, risulta
indispensabile operare delle scelte
preliminari. Una di queste ha carattere fondamentale e riguarda
il tipo di misura che si
intende adottare come espressione delle manifestazioni dei
fenomeni oggetto di
indagine. La scala di misura non può che avere carattere
convenzionale, e sarà tanto più
efficace quanto più riesce a facilitare la spiegazione dei
fenomeni.
La classificazione secondo una scala di misura convenzionalmente
scelta è
l'operazione che accompagna il processo di osservazione ogni
qual volta quest'ultimo si
trasforma da occasionale in volontario e finalistico
(osservazione scientifica). La
classificazione pertanto rappresenta il primo stadio di ogni
ricerca e consiste nel
raggruppare le manifestazioni dei fenomeni secondo una o più
caratteristiche di
interesse, decidendo quali manifestazioni devono considerarsi
uguali e quali diverse.
Per ciò che concerne l'operazione di classificazione secondo una
scala di misura si
distinguono, generalmente, quattro diversi livelli di
misurazione; in questo contesto si
parla di scale nominali, scale ordinali, scale di intervallo e
scale razionali o di rapporto.
La scala nominale costituisce il più semplice livello di
misurazione. Sotto il profilo
formale le scale nominali possiedono unicamente le proprietà di
simmetria e di
transitività; da ciò deriva che relativamente alle
manifestazioni di fenomeni classificate
secondo una scala nominale si potrà semplicemente affermare se
sono uguali o diverse.
Esempi di caratteri in scala nominale sono: il sesso, il tipo di
diploma di scuola media
superiore, il settore merceologico, ecc.
La scala ordinale consente un ordinamento delle manifestazioni
dei fenomeni in
funzione dell'entità posseduta di un certo carattere senza che
sia possibile, peraltro,
stabilire l'ammontare (intensità) del carattere posseduto; tale
fatto pone le scale ordinali
ad un livello inferiore rispetto alle scale di intervallo nelle
quali è invece possibile
misurare tale entità. Esempi di caratteri espressi in scala
ordinale sono: il titolo di
studio, il grado militare, la qualifica del personale, ecc.
La scala di rapporto rappresenta il più alto livello di
misurazione, ha uno zero
assoluto (non arbitrario) e possiede una unità di misura di tipo
fisico scelta come
elemento comune di riferimento.
La scala di intervallo, che possiede tutte le proprietà delle
scale nominali ed ordinali,
si differenzia dalla scala di rapporto in quanto, pur possedendo
una unità di misura di
tipo fisico, lo zero in essa contenuto ha natura arbitraria.
Sia le scale di rapporto che le scale di intervallo sono dunque
espresse con una unità
di misura fisica scelta come elemento di riferimento e in questo
caso si parla di
fenomeni misurabili, la diversità tra le due scale risiede nello
zero scelto, che è assoluto
nelle scale di rapporto (il numero di componenti di un nucleo
familiare, l’utile
conseguito da una azienda in un anno, ecc.), relativo nelle
scale di intervallo (l’intensità
dei terremoti espressa in scala Mercalli o Richter, la
temperatura di un corpo espressa in
gradi Celsius o Fahrenheit, ecc.). Sulle due scale è quindi
possibile applicare le usuali
-
B. Chiandotto Versione 2017
INFERENZA STATISTICA
Premessa
14
operazioni aritmetiche di addizione, sottrazione,
moltiplicazione e divisione, ma solo
per i fenomeni le cui manifestazioni sono espresse con una scala
di rapporto ha senso
istituire, appunto, un rapporto tra diverse intensità di
manifestazione; ad esempio, ha
senso concludere che il salario del dipendente A, che percepisce
3.000 € al mese, è il
doppio di quello del dipendente B, che ne percepisce 1.500,
mentre non ha senso
affermare che la temperatura del corpo A è il doppio di quella
del corpo B se le due
temperature sono, rispettivamente, pari a 10° e 5° gradi
Celsius, mentre è del tutto
sensato dire che la differenza di temperatura tra i due corpi è
di 5° gradi Celsius.
L'aver distinto i procedimenti di classificazione secondo una
scala di misura è
operazione tutt’altro che oziosa; infatti, è proprio la scala di
misura adottata a
condizionare la scelta dei metodi statistici (descrittivi,
induttivi o decisionali) d'analisi
più appropriati.
Con riferimento ai problemi di classificazione secondo la scala
di misura adottata, va
detto che gli statistici tendono usualmente ad operare una
classificazione dicotoma dei
fenomeni a seconda che le loro manifestazioni abbiano natura
qualitativa (scale
nominali ed ordinali) o quantitativa (scale di intervallo o di
rapporto). Un tale fatto porta
a distinguere, come già evidenziato nelle pagine precedenti, i
fenomeni in mutabili8 e
variabili a seconda che essi assumano, nelle loro
manifestazioni, modalità qualitative o
modalità quantitative.
Un fenomeno variabile, e cioè un fenomeno classificato secondo
le modalità
quantitative di un suo carattere, può avere natura discreta o
continua. Essendo il numero
associato a ciascuna modalità misurabile di un certo carattere
usualmente detto
variabile, in seguito si parlerà semplicemente di variabili
(discrete o continue) senza
stare a specificare ogni volta che si sta trattando di un
fenomeno classificato secondo le
modalità quantitative di un suo carattere (discreto o
continuo).
Una variabile discreta può assumere soltanto un insieme finito o
un’infinità
numerabile di valori, mentre una variabile continua potrà
assumere tutti i valori
all'interno di un certo intervallo dell’asse reale. Sono
variabili discrete il numero dei
soggetti affetti da cancro polmonare, il numero degli abitanti
di una certa regione, ecc.;
sono variabili continue la temperatura di un corpo, l'età di un
individuo, la velocità di
un'automobile, ecc. In linea generale tutte le grandezze
relative allo spazio (lunghezza,
superficie, ecc.), al tempo (età, durata in vita, ecc.) e alla
massa (peso, pressione
arteriosa, ecc.), sono delle variabili continue9.
Si parla di mutabili o variabili semplici, quando un fenomeno
risulta classificato
secondo le modalità (qualitative o quantitative) di un solo
carattere, si parla invece di
mutabili/variabili multiple o multivariate o multidimensionali
(vettori casuali),
8 Si segnala in proposito che la dizione mutabile statistica è
poco utilizzata. Quando il carattere di interesse ha natura
qualitativa usualmente si parla di variabili qualitative od
anche di dati categorici, espressi con scala nominale o
ordinale. 9 Nel trattare le variabili casuali, cioè entità
variabili che possono assumere un’infinità non numerabile di
valori
dell’asse reale si farà riferimento ai loro intervalli di
definizione (supporto) utilizzando la seguente notazione:
http://upload.wikimedia.org/wikipedia/commons/3/39/Latex_real_numbers.svg
-
B. Chiandotto Versione 2017
INFERENZA STATISTICA
Premessa
15
quando un fenomeno viene classificato secondo le modalità
(qualitative o quantitative)
di più caratteri; nel caso in cui si considerino, relativamente
ad un certo fenomeno,
caratteri aventi natura qualitativa e caratteri aventi natura
quantitativa, si parla di
variabili miste.
Relazioni e scale di misura
Scala di misura
Relazione Qualitativa Quantitativa
Nominale Ordinale Intervallo Rapporto
ci = cj * * * *
ci cj * * * *
ci cj * * *
ci - cj * *
ci : cj *
Conclusioni
La Statistica quale disciplina scientifica, qualunque sia la sua
connotazione di statistica
descrittiva, statistica induttiva (inferenza statistica) o
teoria statistica delle decisioni,
deve necessariamente avvalersi della matematica (essendo essa
stessa una disciplina
matematica).
Nel lettore di queste note didattiche si presuppone la
conoscenza dell’analisi
matematica nei connotati essenziali (calcolo differenziale ed
integrale in una e più
variabili)10
.
Non si presuppone, invece, la conoscenza di quella parte della
matematica che è nata
e si è sviluppata per il trattamento scientifico dei contesti
aleatori: “La Teoria delle
probabilità”.
Essendo l’aleatorietà la peculiarità intrinseca dell’oggetto di
studio dell’inferenza
statistica, il primo capitolo di queste note è dedicato alla
trattazione sintetica degli
aspetti essenziali della probabilità vista però nelle sue
caratterizzazioni strumentali
preferendo, di conseguenza, la dizione di Calcolo delle
probabilità a quella di Teoria
delle probabilità.
Nel primo capitolo, dedicato interamente alla probabilità, si
procede alla
introduzione delle variabili casuali (v.c.) e alla illustrazione
dei modelli probabilistici
(variabili casuali discrete e continue, semplici e multiple) di
uso più frequente. Il
secondo capitolo tratta del campionamento e delle distribuzioni
campionarie. La stima
statistica (puntuale e di intervallo) e il test delle ipotesi
sono oggetto, rispettivamente,
(a,b)=x a < x < b; [a,b]=x a x b; (a,b]=x a < x b;
[a,b)=x a x < b. 10 Per il lettore che ritiene di dover
“rinfrescare” le proprie conoscenze matematiche un utile
riferimento è Khuri
(2003).
http://upload.wikimedia.org/wikipedia/commons/3/39/Latex_real_numbers.svghttp://upload.wikimedia.org/wikipedia/commons/3/39/Latex_real_numbers.svghttp://upload.wikimedia.org/wikipedia/commons/3/39/Latex_real_numbers.svghttp://upload.wikimedia.org/wikipedia/commons/3/39/Latex_real_numbers.svg
-
B. Chiandotto Versione 2017
INFERENZA STATISTICA
Premessa
16
del terzo e del quarto capitolo. La trattazione rientra
nell’ambito della cosidetta
Inferenza statistica classica parametrica mentre l’Inferenza
statistica bayesiana
parametrica viene trattata molto sommariamente nel sesto
capitolo. Il quinto capitolo è
dedicato alla trattazione di uno dei temi classici e più
rilevanti dell’inferenza statistica:
il modello statistico lineare (rappresentazione analitica delle
relazioni tra caratteri). La
rappresentazione analitica implica l’introduzione di modelli
matematici che sono
logicamente giustificati soltanto se si ritiene che la realtà
d’interesse sia rappresentabile
attraverso il modello stesso; se si ritiene, cioè, che il
fenomeno o i fenomeni di
riferimento siano governati da leggi esprimibili analiticamente
ricordando che:
All models are wrong but some are useful (George E.P. Box,
1979)11
.
Il settimo e conclusivo capitolo è dedicato ad una sommaria
esposizione della Teoria
statistica delle decisioni12
.
11
Molti anni prima di Box, Pompilj (1951) in un contributo sulla
Logica della conformità, scrive: ”…..
Voglio invece osservare che non solo la conformità è
concettualmente diversa dalla plausibilità, ma che
addirittura nel nostro ordine di idee, un problema della
plausibilità o significatività non ha senso, perché
non è lecito domandarsi se un modello è vero o falso quando si
può sempre rispondere che, a stretto
rigore, ogni modello è falso, in quanto non coincide con la
realtà.
Questo, naturalmente, non vuol dire che una teoria della
significatività non abbia senso, ma solo che essa
non può servire per discutere se il modello è vero,….”. …..
mentre invece il suo uso, correttamente fatto
nell'ambito del modello, può diventare utilissimo, purché lo
schema teorico di per se stesso già affermi
che possono agire più cause e per di più fornisca tutti i dati
necessari per una corretta applicazione di
tali teorie, di modo che di volta in volta, e sempre
relativamente al modello che sta alla base delle nostre
indagini, si possa inferire, dall'esame dei risultati
sperimentali, sulle cause che hanno agito. Ma fuori di
questo modello, che deve essere considerato preesistente e
indiscutibile, ogni indagine in tal senso risulta
necessariamente vana!”
Riguardo alle affermazioni di Box e Pompilj, occorre precisare
che si tratta di riferimenti ad una
particolare interpretazione del termine modello; in realtà, come
si avrà modo di chiarire successivamente,
alcuni modelli (probabilistici) non costituiscono una
rappresentazione semplificata della realtà ma
derivano dalla traduzione in termini analitici del processo
generatore dei dati. 12
Gli argomenti illustrati in queste note sono trattati in forma
più estesa, tra gli altri, in Mood, Graybill,
Boes (1988); Piccolo (1998); Barnett (1999); Robert (2001);
Rohatgi e Salek (2001); Gelman e al
(1995); Casella, Berger (2002), Keener (2010) e Olive
(2014).