-
Tipi di relazione tra 2 variabili quantitative Covarianza e
correlazione Un esempio completo Un esercizio
Corso di Psicometria Progredito5. La correlazione lineare
Gianmarco AltoèDipartimento di Pedagogia, Psicologia e
Filosofia
Università di Cagliari, Anno Accademico 2013 - 2014
-
Tipi di relazione tra 2 variabili quantitative Covarianza e
correlazione Un esempio completo Un esercizio
Sommario
1 Tipi di relazione tra 2 variabili quantitative
2 Covarianza e correlazione
3 Un esempio completo
4 Un esercizio
-
Tipi di relazione tra 2 variabili quantitative Covarianza e
correlazione Un esempio completo Un esercizio
Covariazione e causazione
Abbiamo una covariazione quando semplicementeosserviamo che due
variabili X e Y presentano variazioniconcomitanti: al variare di
una varia l’altra.
Si ha invece causazione quando ipotizziamo che unavariazione di
X produca una variazione di Y .
-
Tipi di relazione tra 2 variabili quantitative Covarianza e
correlazione Un esempio completo Un esercizio
Esempio di covariazione
-
Tipi di relazione tra 2 variabili quantitative Covarianza e
correlazione Un esempio completo Un esercizio
Covariazione
Attenzione ai termini:
covariazione: è il termine generale che indica il
fenomeno(sinonimo di associazione). Si riferisce quindi sia
allarelazione tra variabili quantitative che categoriali.
covarianza: misura assoluta della covariazione tra duevariabili
quantitative. (non ha un minimo e un massimo,dipende dall’unità di
misura delle variabili).
correlazione: misura standardizzata della covariazione tradue
variabili quantitative. (varia tra -1 e 1, è indipendentedall’unità
di misura delle variabili).
-
Tipi di relazione tra 2 variabili quantitative Covarianza e
correlazione Un esempio completo Un esercizio
Esempio di causazione
-
Tipi di relazione tra 2 variabili quantitative Covarianza e
correlazione Un esempio completo Un esercizio
Tipi di relazioni causali
Esistono vari tipi di relazioni causali:
relazione diretta
relazione reciproca
relazione spuria
relazione indiretta (mediazione)
relazione condizionata (moderazione o interazione)
-
Tipi di relazione tra 2 variabili quantitative Covarianza e
correlazione Un esempio completo Un esercizio
Relazione diretta
Si tratta della relazione causale di primo ed immediatointeresse
da parte del ricercatore.
Due variabili X e Y sono legate da una relazione causalediretta
quando un mutamento nella variabile causa (X)produce un mutamento
nella variabile effetto (Y ).
-
Tipi di relazione tra 2 variabili quantitative Covarianza e
correlazione Un esempio completo Un esercizio
Relazione reciproca
Quando viene meno la distinzione fra variabile causa eeffetto,
quando le variabili si influenzano reciprocamente,quando in
sostanza viene meno l’asimmetria del rapporto traX e Y si parla di
relazione causale reciproca.
Altri termini usati per indicare una relazione reciproca
sono:retroazione, simultaneità e mutua relazione.
-
Tipi di relazione tra 2 variabili quantitative Covarianza e
correlazione Un esempio completo Un esercizio
Relazione spuria
Il caso della relazione spuria è il caso classico di presenza
dicovariazione pur in assenza di causazione.
Nella ricerca, le relazioni spurie non sono sempre semplici
darilevare!!
-
Tipi di relazione tra 2 variabili quantitative Covarianza e
correlazione Un esempio completo Un esercizio
Relazione indiretta o mediazione
Abbiamo una relazione causale indiretta fra X e Y quando illoro
legame causale è mediato da una terza variabile Z (Zfunge da ponte
tra X e Y ).
Si parla di relazione indiretta totale quando tutto l’effetto
diX su Y è mediato da Z, mentre si parla di relazione
indirettaparziale quando X agisce su Y sia direttamente
cheattraverso Z.
-
Tipi di relazione tra 2 variabili quantitative Covarianza e
correlazione Un esempio completo Un esercizio
Relazione condizionata o moderazione
Si parla di relazione condizionata quando la relazione tra
duevariabili X e Y
cambia (è moderata) da una terza variabile Z. E’ il classicocaso
di interazione: l’effetto di X su Y dipende dai livelli di Z.
-
Tipi di relazione tra 2 variabili quantitative Covarianza e
correlazione Un esempio completo Un esercizio
Leggere BENE le avvertenze ... prima dell’uso!
Soprattutto nei fenomeni studiati in psicologia, le relazionitra
variabili sono molto complesse. Trarre conclusioni daanalisi
bivariate, per altro utilissime a livello esplorativo, puòportare a
errori di valutazione considerevoli. Quando èpossibile è certamente
preferibile utilizzare approccimultivariati.
Nel provare la causalità di una relazione è
determinantel’ipotesi teorica del ricercatore. Un modello
statistico dasolo, non può mai provare la causalità di una
relazione!
Al limite, un modello statistico può suggerire l’assenza di
unarelazione causale . . . ma mai provarne l’esistenza!
-
Tipi di relazione tra 2 variabili quantitative Covarianza e
correlazione Un esempio completo Un esercizio
La covarianza
Date due variabili quantitative X e Y si definisce covarianzatra
X e Y la seguente quantità:
σXY =
∑ni (Xi −X)(Yi − Y )
n
mentre la stima della covarianza della popolazione sulla basedei
dati campionari è:
sXY =
∑ni (Xi −X)(Yi − Y )
n − 1
-
Tipi di relazione tra 2 variabili quantitative Covarianza e
correlazione Un esempio completo Un esercizio
La covarianzaLa covarianza consente di valutare se tra due
variabili quantitative X eY esiste un legame lineare e di valutare
se tale legame è positivo onegativo o nullo:
covarianza > 0:prevalenza di unità statistiche per le quali
scartipositivi dei valori di X sono associati a scarti positivi dei
valori di Ye scarti negativi dei valori di X sono associati a
scarti negativi neivalori di Y. Covariazione positiva,
all’aumentare di una variabile èassociato un aumento
dell’altra.
covarianza < 0: prevalenza di unità statistiche per le quali
scartipositivi dei valori di X sono associati a scarti negativi dei
valori di Ye scarti negativi dei valori di X sono associati a
scarti positivi neivalori di Y. Covariazione negativa,
all’aumentare di una variabile èassociata una diminuzione
dell’altra.
covarianza = 0: non esiste associazione tra scarti sulla X e
scartisulla Y. Covariazione nulla, non esiste associazione
lineare.
... vediamolo graficamente :-) !
-
Tipi di relazione tra 2 variabili quantitative Covarianza e
correlazione Un esempio completo Un esercizio
Grafico a dispersione nel caso di covarianza positiva
-
Tipi di relazione tra 2 variabili quantitative Covarianza e
correlazione Un esempio completo Un esercizio
Grafico a dispersione nel caso di covarianza negativa
-
Tipi di relazione tra 2 variabili quantitative Covarianza e
correlazione Un esempio completo Un esercizio
Grafico a dispersione nel caso di covarianza nulla
-
Tipi di relazione tra 2 variabili quantitative Covarianza e
correlazione Un esempio completo Un esercizio
La correlazione
La covarianza è un indice che dipende dalla unità di misuradelle
variabili considerate.
E’ utile però poter disporre di un indice relativo
dicovariazione che sia indipendente dall’unità di misura
dellevariabili e che sia quindi maggiormente interpretabile.
-
Tipi di relazione tra 2 variabili quantitative Covarianza e
correlazione Un esempio completo Un esercizio
La correlazione
Dalla teoria sappiamo che:
−σXσY ≤ σXY ≤ σXσY
Possiamo quindi costruire un indice relativo, dettocoefficiente
di correlazione di Bravais-Pearson,semplicemente dividendo tutti i
membri della disequazioneper il reciproco del prodotto delle
deviazioni standard.
ρ =σXYσXσY
Tale indice naturalmente varierà tra -1 e 1.
-
Tipi di relazione tra 2 variabili quantitative Covarianza e
correlazione Un esempio completo Un esercizio
Il coefficiente di correlazione lineare diBravais-Pearson
Il coefficiente di correlazione lineare di Bravais Pearson
misura iltipo e l’intensità della relazione lineare tra due
variabili X e Y .
Esso si indica con:
con la lettera greca ρ se viene calcolato su tutta lapopolazione
oggetto dell’indagine;
con la lettera r se viene calcolato su un
campionerappresentativo della popolazione.
-
Tipi di relazione tra 2 variabili quantitative Covarianza e
correlazione Un esempio completo Un esercizio
Il coefficiente di correlazione lineare varia tra -1 e 1
Il segno di r (+ o -) da informazioni sul tipo di relazione:
il segno positivo indica che le due variabili aumentano
odiminuiscono assieme (relazione lineare positiva)
il segno negativo indica che all’aumentare di una
variabilel’altra diminuisce e viceversa (relazione lineare
negativa)
Il valore assoluto di r, che varia tra 0 e 1, da informazioni
sullaforza della relazione lineare:
è massimo (assume valore 1) quando esiste una perfettarelazione
lineare tra le due variabili.
tende a ridursi al diminuire dell’intensità della
relazionelineare e assume il valore 0 quando essa è nulla.
-
Tipi di relazione tra 2 variabili quantitative Covarianza e
correlazione Un esempio completo Un esercizio
Alcuni esempi
-
Tipi di relazione tra 2 variabili quantitative Covarianza e
correlazione Un esempio completo Un esercizio
Alcuni valori di riferimento nelle scienze sociali
r = ±.1⇒ effetto piccolor = ±.3⇒ effetto medior = ±.5⇒ effetto
grande
Statistical power analysis for behavioral science (2nd
ed).Cohen, J. (1988)
-
Tipi di relazione tra 2 variabili quantitative Covarianza e
correlazione Un esempio completo Un esercizio
I libri di casaUn insegnante di lingua e letteratura italiana
delle scuole superiori ha svoltouna piccola indagine sui suoi 9
studenti per esplorare la relazione tra il numerodi libri presenti
in casa e il profitto finale ottenuto in italiano. I dati
sonopresentati nella seguente tabella:
Codice studente Profitto Y Libri in casa X1 10 462 6 203 7 184 4
225 9 306 3 157 4 408 9 229 5 28
1 Rappresentare graficamente i dati e commentarli.2 Calcolare il
coefficiente di correlazione tra Profitto in Italiano e Numero
di Libri in casa e fornirne una breve interpretazione.3
Verificare per α = .05 la significatività della correlazione
osservata.4 Commentare i risultati ottenuti.
-
Tipi di relazione tra 2 variabili quantitative Covarianza e
correlazione Un esempio completo Un esercizio
1. Rappresentazione grafica dei dati
15 20 25 30 35 40 45
02
46
810
(X) Numero di libri in casa
(Y) P
rofit
to in
ital
iano
Osservando il diagramma a dispersione tra le variabili
osservatesembra emergere una relazione diretta e moderatamente
linearetra il numero di libri posseduti in casa e il profitto in
italiano.
-
Tipi di relazione tra 2 variabili quantitative Covarianza e
correlazione Un esempio completo Un esercizio
2.1 Il calcolo del coefficiente di correlazione
Il coefficiente di correlazione r è dato dalla seguente
formula:
r =sXYsXsY
dove:
sXY =
∑ni (Xi −X)(Yi − Y )
n − 1
Al numeratore quindi abbiamo la covarianza campionaria sXYe al
denominatore il prodotto delle deviazioni standardcampionarie
sXsY
-
Tipi di relazione tra 2 variabili quantitative Covarianza e
correlazione Un esempio completo Un esercizio
2.2 Il calcolo del coefficiente di correlzione
Calcoliamo, per prima cosa, medie e deviazioni
standardcampionarie delle 2 variabili, Numero di libri (X) e
Profitto(Y):
X = 26.78 sX = 10.39
Y = 6.33 sY = 2.55
Calcoliamo la covarianza campionaria:
sXY =(46− 26.78)(10− 6.33) + · · ·+ (28− 26.78)(5− 6.33)
9− 1 = 10.08
-
Tipi di relazione tra 2 variabili quantitative Covarianza e
correlazione Un esempio completo Un esercizio
2.3 Il calcolo del coefficiente di correlazione
Sostituendo opportunamente i valori calcolati otteniamo
ilcoefficiente di correlazione r :
r =10.08
10.39× 2.55 = .38
La correlazione calcolata, rispetto ai valori di
riferimentoproposti da Cohen (1988), può essere considerata di
mediadimensione.
-
Tipi di relazione tra 2 variabili quantitative Covarianza e
correlazione Un esempio completo Un esercizio
3-4. Confronto tra valore osservato e valore critico
econclusioni
Consultando le tavole statistiche si osserva che i valori
criticidel coefficiente di correlazione per 7 (n − 2) gradi di
libertà eun livello critico del 5% sono ±.67
Essendo il valore osservato rOSS = .38 compreso tra i
valoricritici ±.67, l’ipotesi nulla, che prevede l’assenza
dicorrelazione tra profitto e numero di libri, non può
essererifiutata
Da un punto di vista descrittivo emerge una correlazione
dieffetto medio e positiva tra il numero di libri posseduti e
ilprofitto in italiano. Tendenzialmente quindi all’aumentare
delnumero di libri presenti in casa sembra essere associato
unaumento del profitto in italiano. Tale correlazione tuttavianon
risulta statisticamente significativa per un livello criticodel
5%
-
Tipi di relazione tra 2 variabili quantitative Covarianza e
correlazione Un esempio completo Un esercizio
Empatia e bullismoNella seguente tabella sono riportati i
punteggi ottenuti a duetest, uno sull’empatia (X) e uno sul
bullismo (Y ), da 8 ragazzimaschi di età compresa tra i 12 e i 14
anni. In entrambi i test unpunteggio elevato indica un livello
elevato del costrutto misurato.
Codice soggetto Empatia X Bullismo Y1 8 22 7 53 10 44 2 75 3 66
5 57 6 48 8 3
1 Rappresentare graficamente i dati e commentarli.2 Calcolare il
coefficiente di correlazione tra Empatia e Bullismo e fornirne
una breve interpretazione.3 Verificare per α = .05 la
significatività della correlazione osservata.4 Commentare i
risultati ottenuti.
-
Tipi di relazione tra 2 variabili quantitative Covarianza e
correlazione Un esempio completo Un esercizio
Riferimenti bibliografici
Corbetta, P. (1992). Metodi di analisi multivariata per le
scienzesociali. Bologna: Il Mulino.
Tipi di relazione tra 2 variabili quantitativeCovarianza e
correlazioneUn esempio completoUn esercizio