1 “Metodi per la Ricerca Sociale e Organizzativa” Corso di Laurea in Scienze dell’Organizzazione Facoltà di Sociologia Università degli Studi di Milano-Bicocca 2009 Simone Sarti
Jan 04, 2016
1
“Metodi per la Ricerca Sociale e Organizzativa”
Corso di Laurea in Scienze dell’OrganizzazioneFacoltà di Sociologia
Università degli Studi di Milano-Bicocca
2009Simone Sarti
2
LOGICA TRIVARIATA
3
Logica trivariata
Quando ad una relazione bivariata aggiungiamo una terza variabile operiamo un’analisi trivariata.
4
Perché considerare una terza variabile?
Quando consideriamo un’ipotesi causale tra due fenomeni ed empiricamente corroboriamo l’esistenza di una relazione, non possiamo tuttavia escludere che i due fenomeni non siano dovuti ad un terzo che non abbiamo preso in considerazione.
5
La causa di un fenomeno in senso generico può essere definita come la somma totale delle condizioni , la totalità delle contingenze alla cui realizzazione segue invariabilmente il conseguente. (Campelli 1999)
Tuttavia, “Nulla può meglio mostrare l’assenza di qualsiasi fondamento scientifico per la distinzione fra la causa d’un fenomeno e le sue condizioni della maniera capricciosa in cui scegliamo fra le condizioni quella che preferiamo chiamare causa “ (J.S.Mill)
6
1.Il numero di pompieri impegnati nello spegnere un incendio è correlato con la stima finale dei danni provocati dall’incendio stesso.
2.I bambini nelle cui case vi sono più finestre mostrano migliori rendimenti scolastici.
Cause ed effetti ?
7
1. Considerando le dimensioni dell’incendio, la relazione tra numero di vigili del fuoco e stima dei danni sparisce.
2.Considerando la ricchezza patrimoniale dei genitori, la relazione tra numero di finestre e rendimento scolastico sparisce.
Presenza di un effetto SPURIO, cioè di una terza variabile, antecedente alle due, che
è la “vera” causa della relazione!
8
Posizione delle variabili
Una volta ipotizzata una relazione tra due variabili X “indipendente” e Y “dipendente”, l’altra o le altre variabili considerate possono assumere quattro posizioni:
variabili antecedenti, variabili intervenienti,variabili susseguenti,variabili concomitanti.
9
Variabili antecedenti
Quelle variabili che nell’ordine causale precedono sia X che Y.
X Y
A
10
Variabili intervenienti
Quelle variabili che nell’ordine causale precedono Y ma seguono X.
X Y
I
11
Variabili susseguenti
Quelle variabili che nell’ordine causale seguono sia Y che X.
X Y
S
12
Variabili concomitantiQuelle variabili che nell’ordine causale
precedono Y ma sono correlate (senza direzione causale) ad X.
X Y
C
13
LOGICA degli effetti
EFFETTO SPURIO:
l’inserimento di una variabile di controllo Z, annulla la relazione tra X e Y.
X Y
Z
X Y
14
LOGICA degli effetti
EFFETTO SOPPRESSO:
l’inserimento di una variabile di controllo Z, rende palese la relazione tra X e Y.
X Y
Z
X Y
15
SCOMPOSIZIONE degli effetti
Variabili categoriali e
differenze di probabilità
16
ESEMPIO 1. tra variabili dicotomiche.
Incrocio tra titolo di studio e fiducia nel sistema giudiziario …
X Y
X Titolo di studio (L – H)
Y Fiducia nel sistema giudiziario (S – N)
Esempio 1
17
… controllato per la variabile antecedente Z
X Y
Z
Z Coorte di nascita (G – A)
Esempio 1
18
Effetto bivariato XY= Effetto causale netto + Effetto spurio
dyx = dyx.z + d(yx)z
Esempio 1
X Y
Z
X Y
dyx.z
dyx
d(yx)z
19
Fonte: EB 60.1 Italia (30 e più anni)
Tavola di contingenza educ * fidu
231 299 530
43.6% 56.4% 100.0%
90 65 155
58.1% 41.9% 100.0%
321 364 685
46.9% 53.1% 100.0%
Conteggio
% entro educ
Conteggio
% entro educ
Conteggio
% entro educ
1 Medio-bassa
2 Alta
educ
Totale
1 Si 2 No
fidu
Totale
Esempio 1
20
dyx Effetto bivariato: educaz. e fiducia giustizia
In un incrocio dicotomico l’effetto bivariato è misurabile attraverso una semplice differenza di probabilità.
dyx equivale alla differenza di probabilità sull’avere fiducia nella giustizia dato l’avere un titolo di studio alto piuttosto che basso.
Esempio 1
21
dyx Effetto bivariato: educaz. e fiducia giustizia
Pr (Y=1 | X=2) – Pr (Y=1 | X=1)
Equivale alla probabilità che la variabile Y assuma valore y, dato che la variabile X assume valore x: Pr (Y=y | X=x)
La categoria di riferimento è la “SI” (Y=1).
dyx = 0,581 - 0,436 = 0,145
Esempio 1
22
dyx = 0,581 - 0,436 = 0,145
La relazione tra possesso della laurea (piuttosto che un titolo di studio inferiore) e fiducia nella giustizia (“si” piuttosto che “no”) è positiva.
Esempio 1
23
Tavola di contingenza educ * fidua
119 161 280
42.5% 57.5% 100.0%
64 44 108
59.3% 40.7% 100.0%
183 205 388
47.2% 52.8% 100.0%
Conteggio
% entro educ
Conteggio
% entro educ
Conteggio
% entro educ
1 Medio-bassa
2 Alta
educ
Totale
1 Si 2 No
fidu
Totale
eta = 1 Giovania.
GIOVANI Z=1
Tavola di contingenza educ * fidua
112 138 250
44.8% 55.2% 100.0%
26 21 47
55.3% 44.7% 100.0%
138 159 297
46.5% 53.5% 100.0%
Conteggio
% entro educ
Conteggio
% entro educ
Conteggio
% entro educ
1 Medio-bassa
2 Alta
educ
Totale
1 Si 2 No
fidu
Totale
eta = 2 Anziania.
ANZIANI Z=2
Esempio 1
24
Effetti condizionati di Z
Considerando Z, troviamo diversi effetti di X su Y.
dyx|z=1 = 0,593 -0,425 = 0,168
dyx|z=2 = 0,553 -0,448 = 0,105
Esempio 1
25
Effetto condizionato complessivo di Z
Considerando che le numerosità in Z tra giovani ed anziani sono diverse, occorre ponderare gli effetti condizionati.
Giovani= 388/685 = 0,567 quota di giovani (qg)
Anziani= 297/685 = 0,433 quota di anziani (1 - qg)
dyx.z = (0,168*0,567) + (0,105*0,433) = 0,141
Esempio 1
26
Effetto bivariato = Effetto causale + Effetto spurio
dyx = dyx.z + d(yx)z
d(yx)z =dyx – dyx.z = 0,145 – (0,141) = 0,004
d(yx)z Effetto spurio
Esempio 1
27
L’effetto della variabile Z è sostanzialmente nullo, ossia la relazione tra titolo di studio e fiducia nella giustizia permane immutata anche a parità di fascia d’età. Non c’è effetto SPURIO.
X Y
Z
+
~ 0 ~ 0
Esempio 1
28
ESEMPIO 2. tra variabili dicotomiche.
Incrocio tra genere e fiducia nei sindacati …
X Y
X Genere (M - F)
Y Fiducia nei sindacati (S - N)
Esempio 2
29
… controllato per la variabile interveniente I condizione occupazionale
(occupato/non occupato)
X Y
I
Z Condizione occupazionale (O - D)
Esempio 2
30
Effetto bivariato XY = Effetto diretto + Effetto indiretto
dyx = c + a*b
X Y
I
a b
c
Esempio 2
31
SI NO
M 31,7 68,3
F 23,3 76,7
N=1000
Esempio 2
32
dyx Effetto bivariato: genere e fiducia nei sindacati
In un incrocio dicotomico l’effetto bivariato è misurabile attraverso una semplice differenza di probabilità.
dyx equivale alla differenza di probabilità sull’avere fiducia nei sindacati dato l’essere femmina piuttosto che maschio.
Esempio 2
33
dyx Effetto bivariato: genere e fiducia nei sindacati
Pr (Y=1 | X=2) – Pr (Y=1 | X=1)
Equivale alla probabilità che la variabile Y assuma valore y, dato che la variabile X assume valore x: Pr (Y=y | X=x)
La categoria di riferimento è la “SI” (Y=1).
dyx = 0,233 - 0,317 = -0,084
Esempio 2
34
dyx = 0,233 - 0,317 = -0,084
La relazione tra genere (essere femmina piuttosto che maschio) e fiducia nei sindacati (“si” piuttosto che “no”) è negativa.
Esempio 2
35
NON OCCUPATI I=2
OCCUPATI I=1
SI NO
M 33,9 66,1
F 30,8 69,2
SI NO
M 12,5 87,5
F 9,5 90,5
Ni=1=750
Ni=2=250
Esempio 2
36
Effetti condizionati di I
Considerando I, troviamo diversi effetti di X su Y.
dyx|i=1 = 0,308 - 0,339 = -0,031
dyx|i=2 = 0,095 -0,125 = -0,030
Esempio 2
37
Effetto diretto c a parità di I
Considerando che le numerosità in I nella condizione occupazionale sono diverse, occorre ponderare gli effetti condizionati.
Occupati= 750/1000 = 0,750 quota occupati (qo)
Non occupati= 250/1000 = 0,250 quota non occupati (1-qo)
dyx.i = (-0,031*0,750) + (-0,030*0,250) = -0,031
Esempio 2
Effetto bivariato XY = Effetto diretto + Effetto indiretto
dyx = c + a*b
Effetto indiretto = -0,084 - (-0,031) = -0,053
-0,084 = -0,031 + Effetto indiretto
Esempio 2
X Y
I
a b
c
39
L’effetto indiretto della variabile I (occupazione) è circa due terzi (-0,053 di -0,084) dell’effetto complessivo tra genere e fiducia nei sindacati. Ciò significa che la tendenza a mostrare sfiducia nei sindacati da parte delle femmine è dovuta in buona parte alla condizione occupazionale.
X Y
I
c = -0,031
X Y-0,084
a*b = -0,053
Esempio 2
40
SCOMPOSIZIONE degli effetti
Le correlazioni
41
Ipotizziamo che la variabile Z influenzi la relazione tra Y e X.
Come misurare l’effetto di X su Y al netto di Z ?
X Y
Z
X YZYXr .
YXr
42
XY
YXYX SS
Sr
Correlazioni tra le variabili:
X Y
ZX Z Y
X 1.453
.322
Z .453
1.596
Y .322
.596
1
Matrice di correlazione, r.. osservati
ZYXr .
XZ
XZXZ SS
Sr
YZ
YZYZ SS
Sr
43
22.11 YZXZ
YZXZYXZYX
RR
rrrr
E’ possibile calcolare il coefficiente di correlazione parziale tra X e Y “tenendo
costante” Z:
44
Coefficiente di correlazione parziale tra X e Y “tenendo costante” Z:
Correlazione lorda Correlazione di Z su X e Y
Residui di Z-X e Z-Y
22.11 YZXZ
YZXZYXZYX
RR
rrrr
Più la Z spiega X eY, più grande è il denominatore
Misura quanto Z spiega di X eY
45
X Y
Z
X Z Y
X 1.453
.322
Z .453
1.596
Y .322
.596
1
Matrice di correlazione, r.. osservati
E’ possibile calcolare il coefficiente di correlazione parziale tra X e Y “tenendo
costante” Z:
ZYXr .
073,011 22.
YZXZ
YZXZYXZYX
RR
rrrr
073,0. ZYXr322,0YXr
46
X Y
Z
ZYXr .
073,0. ZYXr322,0YXr
La correlazione tra X e Y tenendo sotto controllo Z diventa praticamente nulla.
47
Correlations
1 -.247** .168**
. .000 .000
1414 1414 1414
-.247** 1 .211**
.000 . .000
1414 1414 1414
.168** .211** 1
.000 .000 .
1414 1414 1414
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
eta
ascoli Anni di scolarità
reddito Redditomensile (euro)
etaascoli Annidi scolarità
reddito Redditomensile(euro)
Correlation is significant at the 0.01 level (2-tailed).**.
Correlazioni fra tre variabili
Calcolare la correlazione parziale tra anni di scolarità e reddito
48
SCOMPOSIZIONE degli effetti
Regressione e correlazione
49
Y
X1
Ipotizziamo un’antecedenza (lineare) causale:
X2
22110 XbXbbY
11 YXbb
22 YXbb
50
La regressione trivariataLa covariazione tra le variabili indipendenti X e la dipendente Y può essere ricostruita attraverso una figura complessa chiamata iperpiano.
La regressione stima i valori dei parametri a e b che minimizzano i valori osservati e quelli predetti che costituiscono l’iperpiano.
Più tecnicamente la regressione minimizza la somma degli errori di predizione al quadrato.
51
La regressione trivariataIl valore α esprime il valore predetto di Y, quando tutti i regressori Xk sono uguali a 0.
I valori bk rappresentano la variazione (gli effetti) apportati dalle rispettive variabili Xk al netto degli effetti delle altre variabili incluse nel modello.
O anche:
“a parità di ogni altra condizione considerata”.
52
Assunti per la regressione trivariata a partire dai coefficienti campionari
1.Relazione lineare tra variabili dipendenti ed indipendenti.
2. Gli errori sono: -distribuiti normalmente, -il valore atteso è zero, -hanno varianze costanti (omoschedasticità),-sono tra loro indipendenti,
53
Pesi di correlazione e causazione
Esistono legami bidirezionali, che si sostanziano in “coefficienti di correlazione” e legami unidirezionali (o causali) che si sostanziano in coefficienti di regressione.
54
Esempio di modello causale (regressione)
X1
X2
Y
X1 X2 Y
X1 1.453
.322
X2.453
1.596
Y .322
.596
1
Matrice di correlazione, r.. osservati
0.453
21 566.0065.0ˆ XXY eY
Stime effettuate con il metodo dei minimi quadrati
Coefficienti standardizzati
*1b
*2b
55
Coefficiente di determinazione multiplo
2121
*2
*1
2YXYXXXY rbrbR
Il coefficiente di determinazione multiplo della variabile Y, è dato dall’insieme degli effetti beta delle variabili X che agiscono direttamente su essa, pesate per la correlazione osservata tra le X e la Y.
In sostanza R2 è la somma degli effetti netti tra le X e la Y.
56
Esempio di modello causale (regressione)
X1 X2 Y
X1 1.453
.322
X2.453
1.596
Y .322
.596
1
Matrice di correlazione
2121
*2
*1
2. YXYXXXY rbrbR
801.01 2
. 21
XXYe RpY
21 566.0065.0ˆ XXY
596.0566.0322.0065.02. 21
XXYR
358.02. 21
XXYR
57
Analisi dei coefficienti di regressione std
Essendo std i beta possono essere confrontati direttamente. I due effetti sono positivi, ma l’effetto di X2 è molto più intenso.
Precisamente l’aumento di una unità di X2 corrisponde all’aumento di 0.566 deviazioni standard di Y.
Una unità di X produce solo lo 0,065 di aumento in Y.
21 566.0065.0ˆ XXY
X1
X2
Y0.453
065,0*1 b
566,0*2 b
58
X1
X2
Y
X1 X2 Y
X1 1.453
.322
X2.453
1.596
Y .322
.596
1
Matrice di correlazione r..
0.453
358.02121
*2
*1
2. YXYXXXY rbrbR
801.01 2. 21
XXYe RpY
21 566.0065.0ˆ XXY
065,0*1 b
566,0*2 b
59
Analisi dei residui
801.01 2. 21
XXYe RpY
Ciò significa che le variabili antecedenti del modello (X1 e X2 nel-l’esempio) contribuiscono a spiegare circa un terzo della varianza di Y.
358.02121
*2
*1
2. YXYXXXY rrR
Il peso causale del fattore residuale è 0,801.
La correlazione con “altre” cause pesa 0,801.
60
REGRESSIONE TRIVARIATA
UN’APPLICAZIONE
61
Y
X1
Ipotizziamo un’antecedenza (lineare) causale:
X2
22110 XbXbbY
11 YXbb Anni scolarità padre
Anni scolarità madre
Anni scolarità figlio
22 YXbb
62
Regressione trivariata
X1
X2
Y
Matrice di correlazione, r.. osservati
0.716
b1
b2
eY
Stime effettuate con il metodo dei minimi quadrati
Correlazioni
1 .716** .499**
.000 .000
1082 1082 1082
.716** 1 .461**
.000 .000
1082 1082 1082
.499** .461** 1
.000 .000
1082 1082 1082
Correlazione di Pearson
Sig. (2-code)
N
Correlazione di Pearson
Sig. (2-code)
N
Correlazione di Pearson
Sig. (2-code)
N
AS_pa
AS_ma
ascoli
AS_pa AS_ma ascoli
La correlazione è significativa al livello 0,01 (2-code).**.
21 251,0353,0567,7ˆ XXY
63
21 251,0353,0567,7ˆ XXY
Coefficientia
7.567 .213 35.503 .000
.353 .038 .347 9.320 .000
.251 .044 .212 5.707 .000
(Costante)
AS_pa
AS_ma
Modello1
B Errore std.
Coefficienti nonstandardizzati
Beta
Coefficientistandardizzati
t Sig.
Variabile dipendente: ascolia.
21 212,0347,0ˆzzZ XXY
64
Varianza spiegata dal modello
270.02121
*2
*1
2. YXYXXXY rbrbR
533.01 2. 21
XXYe RpY
Il peso causale del fattore residuale è 0,801.
La correlazione con cause terze pesa 0,801.
65
Riepilogo del modello
.521a .271 .270 3.464Modello1
R R-quadratoR-quadrato
correttoErrore std.della stima
Stimatori: (Costante), AS_ma, AS_paa.
66
L’effetto di interazione
67
L’effetto di interazione
Quando l’effetto causale esercitato dalla variabile indipendente X sulla variabile indipendente Y si manifesta in modi diversi a seconda del valore assunto dalla variabile di controllo Z.
X Y
Z
68
0 1
1 3
0 1
0 00 0
1 3
Z=0 Z=1
X=0
X=0 X=0
X=1
X=1 X=1
Y=0 Y=1
Y=0 Y=1 Y=0 Y=1
69
X
Y
X
Y
X
Y
Z=0 Z=1
Effetto di interazione di Z (dicotomica) su X e Y (cardinali)
β>0
βz=0>0 βz=1<0
70
Esempi di effetti di interazione (titolo*età)