Elementi di Psicometria (con laboratorio software 1)02-Tendenza centrale e variabilità
(v. 1.1d, 29 aprile 2020)
Germano Rossi1
1Dipartimento di Psicologia, Università di Milano-Bicocca
a.a. 2019-20
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 1 / 61
Introduzione
Nel capitolo precedente abbiamo visto delle tecniche grafiche perriassumere i dati che abbiamo a disposizione.
In questo capitolo vediamo degli indici numerici che rappresentano leprincipali statistiche descrittive.
Indici della tendenza centrale (slide 3)
Indici di variabilità (slide 25)
Indici di posizione (slide 38)
Rappresentazione grafica specifica per variabile I/R (slide 46)
Indici per la distribuzione normale (slide 55)
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 2 / 61
Tendenza centrale
La “tendenza centrale” è un’indicazione generica di come sta andandola distribuzione della variabile
L’idea base è che sia possibile trovare un valore che rappresenti almeglio la “tendenza” generale dei dati
Ci sono diversi indici che “misurano” la tendenza centrale, alcuni pocoinformativi, altri molto informativi
Questi indici dipendono dalla scala di misura
Livello nominale: Moda (pochissimo informativa)
Livello ordinale: Mediana (poco informativa)
Livello intervallo/rapporto: Media (molto informativa)
Ricordiamo che ogni livello di misura “eredita” le proprietà (e lestatistiche) dai livelli precedenti
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 3 / 61
Livello intervallo: Media
Se 4 amici escono a mangiarela pizza e poi pagano in partiuguali... stanno usando lamedia
Ovvero:(18+ 16.5+ 22+ 17.5)/4
Ovvero: 18.5 * 4Qualcuno paga di più equalcuno di meno, ma, allafine, il “di più” si annulla con il“di meno”
pizza, bibita e dessert
Marco 18.0Clara 16.5Daniela 22.0Andrea 17.5Totale 74.0a testa 18.5
Marco 18.0− 18.5 = 0.5Clara 16.5− 18.5 = 2.0Daniela 22.0− 18.5 = −3.5Andrea 17.5− 18.5 = 1.0Totale 74.0− 74.0 = 0
Proprietà della media: Gli scarti dalla media sommano a 0
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 4 / 61
Media
Logica: La media aritmetica (X , M) è la somma (∑︁
) di tutti i valori diuna distribuzione, divisa per la numerosità (N)
Formalizzazione:
X = M =
∑︀Ni=1 Xi
N
SE i vale xi vale
Marco 1 18.0Clara 2 16.5Daniela 3 22.0Andrea 4 17.5
18+ 16.5+ 22+ 17.54
=744
= 18.5
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 5 / 61
Media
Logica: La media aritmetica (X , M) è la somma (∑︁
) di tutti i valori diuna distribuzione, divisa per la numerosità (N)
Formalizzazione:
X = M =
∑︀Ni=1 Xi
N
SE i vale xi vale
Marco 1 18.0Clara 2 16.5Daniela 3 22.0Andrea 4 17.5
18+ 16.5+ 22+ 17.54
=744
= 18.5
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 5 / 61
Media
Logica: La media aritmetica (X , M) è la somma (∑︁
) di tutti i valori diuna distribuzione, divisa per la numerosità (N)
Formalizzazione:
X = M =
∑︀Ni=1 Xi
N
SE i vale xi vale
Marco 1 18.0Clara 2 16.5Daniela 3 22.0Andrea 4 17.5
18+ 16.5+ 22+ 17.54
=744
= 18.5
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 5 / 61
Media
Logica: La media aritmetica (X , M) è la somma (∑︁
) di tutti i valori diuna distribuzione, divisa per la numerosità (N)
Formalizzazione:
X = M =
∑︀Ni=1 Xi
N
SE i vale xi vale
Marco 1 18.0Clara 2 16.5Daniela 3 22.0Andrea 4 17.5
18+ 16.5+ 22+ 17.54
=744
= 18.5
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 5 / 61
Media [aritmetica]
La media aritmetica (X̄ , Md, M) è la somma (∑︁
) di tutti i valori di unadistribuzione, divisa per la numerosità (N)
M =
∑︀Ni=1 Xi
N=
∑︀X
N
Esempio
M(10, 15, 16, 18, 20, 24, 32, 35, 38, 40) = 24.8
10+ 15+ 16+ 18+ 20+ 24+ 32+ 35+ 38+ 4010
=24810
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 6 / 61
Uso della distribuzione di frequenza
Quando si utilizzano delledistribuzioni di frequenza, si hanno idati in un formato leggermentediverso. Anziché:1 1 1 2 2 2 2 2 2 3 3 (M = 1.9)Possiamo usare una forma tabellaredove per ogni valore (x) indichiamo afianco la frequenza (f) con cuicompare.La formula cambia in:
Esempio
x f fx1 3 32 6 123 2 6∑︁
11 21
M =
∑︀ki=1 fiXi∑︀ki=1 fi
=
∑︀fX
N
M =2111
= 1.9
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 7 / 61
Media [aritmetica]: verifica e proprietà
Esercizio
1 M(1,2,3,4,5)
2 M(3,4,5,6,7)
3 M(2,4,6,8,10)
Soluzione
1 (1+2+3+4+5)/5=15/5=3
2 (3+4+5+6+7)/5=25/5=5
3 (2+4+6+8+10)/5=30/5=6
1 i numeri da 1 a 5
2 i numeri della prima serie sommati a 2
3 i numeri della prima serie moltiplicati per 2
Proprietà della media: Aggiungendo, sottraendo, moltiplicando o dividendouna costante a tutti i dati della distribuzione, anche la media subisce lastessa trasformazione
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 8 / 61
Media [aritmetica]: verifica e proprietà
Esercizio
1 M(1,2,3,4,5)
2 M(3,4,5,6,7)
3 M(2,4,6,8,10)
Soluzione
1 (1+2+3+4+5)/5=15/5=3
2 (3+4+5+6+7)/5=25/5=5
3 (2+4+6+8+10)/5=30/5=6
1 i numeri da 1 a 5
2 i numeri della prima serie sommati a 2
3 i numeri della prima serie moltiplicati per 2
Proprietà della media: Aggiungendo, sottraendo, moltiplicando o dividendouna costante a tutti i dati della distribuzione, anche la media subisce lastessa trasformazione
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 8 / 61
Media [aritmetica]: verifica e proprietà
Esercizio
1 M(1,2,3,4,5)
2 M(3,4,5,6,7)
3 M(2,4,6,8,10)
Soluzione
1 (1+2+3+4+5)/5=15/5=3
2 (3+4+5+6+7)/5=25/5=5
3 (2+4+6+8+10)/5=30/5=6
1 i numeri da 1 a 5
2 i numeri della prima serie sommati a 2
3 i numeri della prima serie moltiplicati per 2
Proprietà della media: Aggiungendo, sottraendo, moltiplicando o dividendouna costante a tutti i dati della distribuzione, anche la media subisce lastessa trasformazione
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 8 / 61
Media [aritmetica]: verifica e proprietà
Esercizio
1 M(1,2,3,4,5)
2 M(3,4,5,6,7)
3 M(2,4,6,8,10)
Soluzione
1 (1+2+3+4+5)/5=15/5=3
2 (3+4+5+6+7)/5=25/5=5
3 (2+4+6+8+10)/5=30/5=6
1 i numeri da 1 a 5
2 i numeri della prima serie sommati a 2
3 i numeri della prima serie moltiplicati per 2
Proprietà della media: Aggiungendo, sottraendo, moltiplicando o dividendouna costante a tutti i dati della distribuzione, anche la media subisce lastessa trasformazione
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 8 / 61
Media [aritmetica]: verifica e proprietà
Esercizio
1 M(1,2,3,4,5)
2 M(3,4,5,6,7)
3 M(2,4,6,8,10)
Soluzione
1 (1+2+3+4+5)/5=15/5=3
2 (3+4+5+6+7)/5=25/5=5
3 (2+4+6+8+10)/5=30/5=6
1 i numeri da 1 a 5
2 i numeri della prima serie sommati a 2
3 i numeri della prima serie moltiplicati per 2
Proprietà della media: Aggiungendo, sottraendo, moltiplicando o dividendouna costante a tutti i dati della distribuzione, anche la media subisce lastessa trasformazione
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 8 / 61
Media [aritmetica]: verifica e proprietà
Esercizio
1 M(1,2,3,4,5)
2 M(3,4,5,6,7)
3 M(2,4,6,8,10)
Soluzione
1 (1+2+3+4+5)/5=15/5=3
2 (3+4+5+6+7)/5=25/5=5
3 (2+4+6+8+10)/5=30/5=6
1 i numeri da 1 a 5
2 i numeri della prima serie sommati a 2
3 i numeri della prima serie moltiplicati per 2
Proprietà della media: Aggiungendo, sottraendo, moltiplicando o dividendouna costante a tutti i dati della distribuzione, anche la media subisce lastessa trasformazione
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 8 / 61
Media [aritmetica]: verifica e proprietà
Esercizio
1 M(1,2,3,4,5)
2 M(3,4,5,6,7)
3 M(2,4,6,8,10)
Soluzione
1 (1+2+3+4+5)/5=15/5=3
2 (3+4+5+6+7)/5=25/5=5
3 (2+4+6+8+10)/5=30/5=6
1 i numeri da 1 a 5
2 i numeri della prima serie sommati a 2
3 i numeri della prima serie moltiplicati per 2
Proprietà della media: Aggiungendo, sottraendo, moltiplicando o dividendouna costante a tutti i dati della distribuzione, anche la media subisce lastessa trasformazione
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 8 / 61
Media [aritmetica]: verifica e proprietà
Esercizio
1 M(1,2,3,4,5)
2 M(3,4,5,6,7)
3 M(2,4,6,8,10)
Soluzione
1 (1+2+3+4+5)/5=15/5=3
2 (3+4+5+6+7)/5=25/5=5
3 (2+4+6+8+10)/5=30/5=6
1 i numeri da 1 a 5
2 i numeri della prima serie sommati a 2
3 i numeri della prima serie moltiplicati per 2
Proprietà della media: Aggiungendo, sottraendo, moltiplicando o dividendouna costante a tutti i dati della distribuzione, anche la media subisce lastessa trasformazione
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 8 / 61
Media [aritmetica]: verifica
Esercizio
1 M(2,4,6,8,10)
2 M(1,4,6,8,16)
3 M(1,4,6,8,46)
Soluzione
1 (2+4+6+8+10)/5=30/5=6
2 (1+4+6+8+16)/5=35/5=7
3 (1+4+6+8+46)/5=65/5=13
Proprietà della media: La media è sensibile ai valori estremi
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 9 / 61
Media [aritmetica]: verifica
Esercizio
1 M(2,4,6,8,10)
2 M(1,4,6,8,16)
3 M(1,4,6,8,46)
Soluzione
1 (2+4+6+8+10)/5=30/5=6
2 (1+4+6+8+16)/5=35/5=7
3 (1+4+6+8+46)/5=65/5=13
Proprietà della media: La media è sensibile ai valori estremi
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 9 / 61
Media [aritmetica]: verifica
Esercizio
1 M(2,4,6,8,10)
2 M(1,4,6,8,16)
3 M(1,4,6,8,46)
Soluzione
1 (2+4+6+8+10)/5=30/5=6
2 (1+4+6+8+16)/5=35/5=7
3 (1+4+6+8+46)/5=65/5=13
Proprietà della media: La media è sensibile ai valori estremi
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 9 / 61
Media [aritmetica]: verifica
Esercizio
1 M(2,4,6,8,10)
2 M(1,4,6,8,16)
3 M(1,4,6,8,46)
Soluzione
1 (2+4+6+8+10)/5=30/5=6
2 (1+4+6+8+16)/5=35/5=7
3 (1+4+6+8+46)/5=65/5=13
Proprietà della media: La media è sensibile ai valori estremi
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 9 / 61
Media [aritmetica]: verifica
Esercizio
1 M(2,4,6,8,10)
2 M(1,4,6,8,16)
3 M(1,4,6,8,46)
Soluzione
1 (2+4+6+8+10)/5=30/5=6
2 (1+4+6+8+16)/5=35/5=7
3 (1+4+6+8+46)/5=65/5=13
Proprietà della media: La media è sensibile ai valori estremi
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 9 / 61
SPSS: Media
La media viene visualizzata da Spss in quasi tutte le procedure comeinformazione aggiuntiva. Quelle specifiche per esplorare le variabili, sono:
Analizza | Statistiche descrittive | Frequenze...
(fra le varie statistiche che è possibile stampare vi è anche la media)
Analizza | Statistiche descrittive | Descrittive...
(è la procedura specifica per le statistiche descrittive)
Analizza | Statistiche descrittive | Esplora...
(stampa la media come una delle diverse statistiche per capirel’andamento e la distribuzione di una variabile)
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 10 / 61
SPSS: Media con Frequenze...
Dopo aver scelto le variabili,
click-are su Statistiche... eselezionare Media
Quindi, click-are su Continua
Con variabili quantitative convienede-selezionare anche
oppure in Formato...
Poi OK
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 11 / 61
SPSS: Media con Frequenze...
Usando set15.sav
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 12 / 61
SPSS: Media con Descrittive...
Dopo aver scelto le variabili,
click-are su Opzioni...
Normalmente Media è giàselezionato
Potete ordinare i risultati in varimodi
Poi OK
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 13 / 61
Media con dati dicotomici
Se una variabile è dicotomica (D) ed è stata categorizzata con 0 e 1,la media di D equivale alla proporzione della categoria 1.
Infatti, possiamo pensare a D come la somma di tutti gli 0 e la sommadi tutti gli 1.
D =
∑︀di
N=
0 · f0 + 1 · f1N
=f1N
Ma la somma degli 0 è 0 e la somma degli 1 è uguale alla frequenzadegli 1.
Quindi la media di una variabile dicotomica è D =f1N
(cioè la
proporzione degli 1)
L’equivalenza non vale se categorizziamo con numeri diversi da 0 e 1.
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 14 / 61
Media con dati dicotomici
Usando set15.sav
La media di una variabiledicotomica (0/1) è laproporzione della categoria 1
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 15 / 61
Livello nominale: Moda
La moda è la misura della tendenza centrale a livello nominale
La Moda (Mo) è la frequenza più elevata di una distribuzione
La logica è che il valore più frequente, a questo livello, rappresenta latendenza generale meglio degli altri valori
può essere calcolata a tutti i livelli di misura
a livello intervallo/rapporto è pochissimo usata
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 16 / 61
Moda
Se c’è una sola moda, la distribuzione si dice Unimodale
Se sono 2, Bimodale
Se sono più di 2, Multimodale (ma non si utilizza)
Esempio
Maschio=17, Femmina=13 ⇒ Maschio perché ha frequenza 17
Se ci sono molte categorie, oppure poche categorie tutte con frequenzesimili, la moda non ha molto senso.
Esempio
Mo(1 1 1 2 2 2 2 3 3 3) Mo=2 (ma non ha molto senso)Mo(1 1 1 1 2 2 2 3 3 3 3) Bimodale (ma non ha molto senso)
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 17 / 61
Livello ordinale: Mediana
La mediana (Mdn) divide la distribuzione a metà
La logica è che, nei dati ordinati, il valore “centrale” è anche latendenza
Se N è dispari, la Mdn è il valore in posizione centrale,corrispondente a (N + 1)/2
Esempio
1 2 3 4 5 6 7 8 9 10 11
Dati grezzi 5 2 1 3 5 1 4 4 3 1 5
Ordinati 1 1 1 2 3 3 4 4 5 5 5⇑
(11+ 1)/2 = 6 ⇒ Mdn = 3
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 18 / 61
Mediana
La mediana si può calcolare sia su scala ordinale sia su scalaintervallo/rapporto, perciò, (con N pari)
Se N è pari, la Mdn è il valore fra le 2 posizioni centrali (se esiste)cioè fra N/2 e (N/2) + 1
Se i due valori sono uguali, quello è il valore della mediana
Esempio
Dati grezzi 5 2 1 3 5 1 4 4 3 1Ordinati 1 1 1 2 3 3 4 4 5 5
⇑ ⇑
N/2 = 10/2 = 5 e (N/2) + 1 = 5+ 1 = 6 ⇒ Mdn = 3
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 19 / 61
Mediana
Se i due valori sono diversi
se la scala è ordinale: entrambi costituiscono la medianase è quantitativa: si fa la media fra i due valori
Esempio
Dati grezzi 5 2 1 4 5 1 4 4 3 1Ordinati 1 1 1 2 3 4 4 4 5 5
⇑ ⇑N/2 = 10/2 = 5 e
(N/2) + 1 = 5+ 1 = 6 ⇒ Mdn=3;4 (ORD) ⇒ 3,5 (I/R)
Attenzione
Spss (e la maggior parte dei software statistici) fanno sempre una stimadel valore esatto basata sulla logica degli intervalli di classe
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 20 / 61
Mediana: Verifica
Esercizio
1 Mdn (3,5,7,9,11)
2 Mdn (2,3,5,7,9,11,12)
3 Mdn (3,4,5,5,6,7)
4 Mdn (3,4,5,6,7,8)
5 Mdn (4,5,7,9,13)
6 Mdn (1,5,7,9,25)
Soluzione
1 N=5; pos=3; Mdn=7
2 N=7; pos=4; Mdn=7
3 N=6; pos=3 e 4; Mdn=5
4 N=6; pos=3 e 4; Mdn=5;6 (5,5)
5 N=5; pos=3; Mdn=7
6 N=5; pos=3; Mdn=7
Se aggiungiamo lo stesso numero di valori all’inizio e alla fine di unadistribuzione (quindi “ordinata”), la Mdn non cambia
Se cambiano i valori estremi della distribuzione, la Mdn non cambia
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 21 / 61
Mediana: Verifica
Esercizio
1 Mdn (3,5,7,9,11)
2 Mdn (2,3,5,7,9,11,12)
3 Mdn (3,4,5,5,6,7)
4 Mdn (3,4,5,6,7,8)
5 Mdn (4,5,7,9,13)
6 Mdn (1,5,7,9,25)
Soluzione
1 N=5; pos=3; Mdn=7
2 N=7; pos=4; Mdn=7
3 N=6; pos=3 e 4; Mdn=5
4 N=6; pos=3 e 4; Mdn=5;6 (5,5)
5 N=5; pos=3; Mdn=7
6 N=5; pos=3; Mdn=7
Se aggiungiamo lo stesso numero di valori all’inizio e alla fine di unadistribuzione (quindi “ordinata”), la Mdn non cambia
Se cambiano i valori estremi della distribuzione, la Mdn non cambia
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 21 / 61
Mediana: Verifica
Esercizio
1 Mdn (3,5,7,9,11)
2 Mdn (2,3,5,7,9,11,12)
3 Mdn (3,4,5,5,6,7)
4 Mdn (3,4,5,6,7,8)
5 Mdn (4,5,7,9,13)
6 Mdn (1,5,7,9,25)
Soluzione
1 N=5; pos=3; Mdn=7
2 N=7; pos=4; Mdn=7
3 N=6; pos=3 e 4; Mdn=5
4 N=6; pos=3 e 4; Mdn=5;6 (5,5)
5 N=5; pos=3; Mdn=7
6 N=5; pos=3; Mdn=7
Se aggiungiamo lo stesso numero di valori all’inizio e alla fine di unadistribuzione (quindi “ordinata”), la Mdn non cambia
Se cambiano i valori estremi della distribuzione, la Mdn non cambia
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 21 / 61
Mediana: Verifica
Esercizio
1 Mdn (3,5,7,9,11)
2 Mdn (2,3,5,7,9,11,12)
3 Mdn (3,4,5,5,6,7)
4 Mdn (3,4,5,6,7,8)
5 Mdn (4,5,7,9,13)
6 Mdn (1,5,7,9,25)
Soluzione
1 N=5; pos=3; Mdn=7
2 N=7; pos=4; Mdn=7
3 N=6; pos=3 e 4; Mdn=5
4 N=6; pos=3 e 4; Mdn=5;6 (5,5)
5 N=5; pos=3; Mdn=7
6 N=5; pos=3; Mdn=7
Se aggiungiamo lo stesso numero di valori all’inizio e alla fine di unadistribuzione (quindi “ordinata”), la Mdn non cambia
Se cambiano i valori estremi della distribuzione, la Mdn non cambia
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 21 / 61
Mediana: Verifica
Esercizio
1 Mdn (3,5,7,9,11)
2 Mdn (2,3,5,7,9,11,12)
3 Mdn (3,4,5,5,6,7)
4 Mdn (3,4,5,6,7,8)
5 Mdn (4,5,7,9,13)
6 Mdn (1,5,7,9,25)
Soluzione
1 N=5; pos=3; Mdn=7
2 N=7; pos=4; Mdn=7
3 N=6; pos=3 e 4; Mdn=5
4 N=6; pos=3 e 4; Mdn=5;6 (5,5)
5 N=5; pos=3; Mdn=7
6 N=5; pos=3; Mdn=7
Se aggiungiamo lo stesso numero di valori all’inizio e alla fine di unadistribuzione (quindi “ordinata”), la Mdn non cambia
Se cambiano i valori estremi della distribuzione, la Mdn non cambia
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 21 / 61
Mediana: Verifica
Esercizio
1 Mdn (3,5,7,9,11)
2 Mdn (2,3,5,7,9,11,12)
3 Mdn (3,4,5,5,6,7)
4 Mdn (3,4,5,6,7,8)
5 Mdn (4,5,7,9,13)
6 Mdn (1,5,7,9,25)
Soluzione
1 N=5; pos=3; Mdn=7
2 N=7; pos=4; Mdn=7
3 N=6; pos=3 e 4; Mdn=5
4 N=6; pos=3 e 4; Mdn=5;6 (5,5)
5 N=5; pos=3; Mdn=7
6 N=5; pos=3; Mdn=7
Se aggiungiamo lo stesso numero di valori all’inizio e alla fine di unadistribuzione (quindi “ordinata”), la Mdn non cambia
Se cambiano i valori estremi della distribuzione, la Mdn non cambia
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 21 / 61
Mediana: Verifica
Esercizio
1 Mdn (3,5,7,9,11)
2 Mdn (2,3,5,7,9,11,12)
3 Mdn (3,4,5,5,6,7)
4 Mdn (3,4,5,6,7,8)
5 Mdn (4,5,7,9,13)
6 Mdn (1,5,7,9,25)
Soluzione
1 N=5; pos=3; Mdn=7
2 N=7; pos=4; Mdn=7
3 N=6; pos=3 e 4; Mdn=5
4 N=6; pos=3 e 4; Mdn=5;6 (5,5)
5 N=5; pos=3; Mdn=7
6 N=5; pos=3; Mdn=7
Se aggiungiamo lo stesso numero di valori all’inizio e alla fine di unadistribuzione (quindi “ordinata”), la Mdn non cambia
Se cambiano i valori estremi della distribuzione, la Mdn non cambia
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 21 / 61
SPSS: Moda e Mediana
Moda e Mediana vengono visualizzate da Spss solo in queste procedure:
Analizza | Statistiche descrittive | Frequenze...
(fra le varie statistiche che è possibile stampare vi sono anche la modae mediana)
Analizza | Statistiche descrittive | Esplora...
(stampa la mediana come una delle diverse statistiche per capirel’andamento e la distribuzione di una variabile)
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 22 / 61
Spss-Frequenze: moda e mediana
Usando set15.sav
TramiteAnalizza |
Statistiche
descrittive |
Frequenze...
pulsanteStatistiche ,possiamo farcalcolare dellestatistiche, tracui la moda e lamediana.
poi Continua eOK
“Modalità” è un terminealternativo a “Moda”
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 23 / 61
Spss-Esplora: mediana
Usando set15.sav
Tramite Analizza |
Statistiche descrittive
| Esplora... pulsanteStatistiche , possiamo farcalcolare la mediana.
poi Continua e OK
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 24 / 61
Concetto di variabilità
Gli indici di variabilità ci dicono quanto i valori sono dispersi attorno allatendenza centrale.
Esempio
valori∑︁
X/N = M
7 7 6 5 4 4 4 3 40/8=510 10 9 7 5 4 3 2 0 0 50/10=5
Due distribuzioni con Muguale, ma dispersione diversa
A livello di scala intervallo/rapporto ci sono diversi indici di variabilità:
Campo di variazione o gamma (di oscillazione) o range
Differenza interquartilica (DI o IQR) *
Deviazione media o scostamento semplice medio
Varianza e deviazione standard*la vedremo più avanti
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 25 / 61
Misure di variabilità: campo di variazione
Il campo di variazione o gamma (di oscillazione) o range o intervallo(per SPSS) è la differenza fra il valore massimo e quello minimo
gamma = max −min
per variabili a intervallo/rapporto
Esempio
valori campo var.
7 7 6 5 4 4 4 3 7-3=410 10 9 7 5 4 3 2 0 0 10-0=10
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 26 / 61
Varianza
Sempre a livello intervallo/rapporto
Gli scarti dalla media potrebbero essere una misura di variabilità,senonché...
la somma degli scarti dalla media è sempre pari a 0 (zero)
la soluzione è
Varianza (Var, s2): elevare gli scarti a quadrato e fare la loro media
var = s2 = DS2 =
∑︀Ni=1(Xi −M)2
N=
SS
N
dove: Xi sono i punteggi delle singole unità statisticheM è la media della variabiliN è la numerositàSS è la Somma degli scarti
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 27 / 61
Varianza: formula alternativa
Calcolare gli scarti dalla media, nella maggior parte dei casi, produce valoridecimali che possono generare imprecisioni nei calcoli. Esiste quindi unaformula alternativa da usare con i dati grezzi:
X X −M (X −M)2 X 2
2 -0,8 0,64 42 -0,8 0,64 43 0,2 0,04 93 0,2 0,04 94 1,2 1,44 16
Somma 14 0 2,8 42Media 2,8 0,56 8,4
Var =
∑︀X 2
N− M2
=425
− 2.82
= 8.4 − 7.84 =
= 0.56
La varianza è quindi uguale a... la media dei quadrati meno il
quadrato della media
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 28 / 61
Deviazione standard
La varianza minimizza le piccole differenze e massimizza le grandidifferenze
Però la varianza è un quadrato (un’area) e quindi si introduce ancheuna versione lineare (che è una distanza), lo scarto quadratico medio
Lo scarto quadratico medio (sqm) o deviazione standard (DS , s) è laradice quadrata della varianza
DS = s =√s2 =
√var =
√︂∑︀(Xi −M)2
N
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 29 / 61
Varianza: esempi
Esempio
DS2(1,2,3,4,5) =
[(1− 3)2 + (2− 3)2 + (3− 3)2 + (4− 3)2 + (5− 3)2]5
=
[(−2)2 + (−1)2 + (0)2 + (1)2 + (2)2]5
=4+ 1+ 0+ 1+ 4
5=
105
= 2
DS(1,2,3,4,5)=√2 = 1.41
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 30 / 61
Misure di variabilità
la varianza finora vista è stata calcolata su una piccola quantità didati, che però vengono considerati come una popolazione
DS2 =
∑︀Ni=1(Xi −M)2
NDS =
√︂∑︀(Xi −M)2
N
quando si calcola su un campione si effettua una correzione che tieneconto dell’ampiezza del campione stesso, in tal caso la formula diventa:
DS2 =
∑︀Ni=1(Xi −M)2
N − 1DS =
√︃∑︀(Xi −M)2
N − 1
dividere per N − 1 produce valori più grandi
con campioni grandi la divisione per N o per N − 1 non è moltodiversa; per campioni piccoli, si.
Riprenderemo il discorso al cap. 7
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 31 / 61
Misure di variabilità: formula alternativa
Con N − 1 la formula alternativa non è così semplice, ma bisogna“aggiustarla”
s2 =N
N − 1
(︂∑︀X 2
N−M2
)︂
s =
√︃N
N − 1
(︂∑︀X 2
N−M2
)︂
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 32 / 61
Proprietà della varianza (e dev. st)
Esercizio
1 var(1,2,3,4,5)
2 var(3,4,5,6,7)
3 var(2,4,6,8,10)
Soluzione
1 5/4 * (55/5− 32) = 2.5, s = 1.58
2 5/4 * (135/5− 52) = 2.5, s = 1.58
3 5/4 * (220/5− 62) = 10, s = 3.16
1 i numeri da 1 a 5
2 i numeri della prima serie sommati a 2
3 i numeri della prima serie moltiplicati per 2
Proprietà della var 1: Aggiungendo, sottraendo, una costante a tutti i datidella distribuzione, la varianza non subisce trasformazioniProprietà della var 2: Moltiplicando o dividendo per una costante, lavarianza cambia ma la dev. st. subisce la stessa trasformazione
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 33 / 61
Proprietà della varianza (e dev. st)
Esercizio
1 var(1,2,3,4,5)
2 var(3,4,5,6,7)
3 var(2,4,6,8,10)
Soluzione
1 5/4 * (55/5− 32) = 2.5, s = 1.58
2 5/4 * (135/5− 52) = 2.5, s = 1.58
3 5/4 * (220/5− 62) = 10, s = 3.16
1 i numeri da 1 a 5
2 i numeri della prima serie sommati a 2
3 i numeri della prima serie moltiplicati per 2
Proprietà della var 1: Aggiungendo, sottraendo, una costante a tutti i datidella distribuzione, la varianza non subisce trasformazioniProprietà della var 2: Moltiplicando o dividendo per una costante, lavarianza cambia ma la dev. st. subisce la stessa trasformazione
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 33 / 61
Spss: Variabilità
Anche varianza e dev. st. sono visualizzate da Spss (sempre N-1) in molteprocedure. Quelle specifiche sono:
Analizza | Statistiche descrittive | Frequenze...
(fra le varie statistiche vi è anche quelle di variabilità)
Analizza | Statistiche descrittive | Descrittive...
(è la procedura specifica per le statistiche descrittive)
Analizza | Statistiche descrittive | Esplora...
(stampa le misure di variabilità come parte delle diverse statistiche percapire l’andamento e la distribuzione di una variabile)
Tutti gli esempi usando set15.sav
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 34 / 61
Spss: Variabilità con Frequenze...
Dopo aver scelto le variabili,
click-are su Statistiche... eselezionare quelle che servono
Quindi, click-are su Continua
Con variabili quantitative convienede-selezionare anche
oppure in Formato...
attivare
Infine OK
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 35 / 61
Spss: Variabilità con Descrittive...
Dopo aver scelto le variabili, click-are suOpzioni... Selezionare Varianza,
Deviazione stand. eIntervallo
Poi Continua e OK
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 36 / 61
Spss: Variabilità con Esplora...
Dopo aver scelto le variabili,
click-are su Statistiche...
e selezionate Descrittive
Fra le varie statistichestampate, ci sono anchevarianza, deviazione standarde intervallo
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 37 / 61
Indici di posizione - Quantili N
Dopo aver ordinato i valori di una distribuzione, possiamo suddividerel’intera distribuzione di frequenza in n parti uguali.
Se divisa in 100 parti, Centili (C1, C2. . . , C99) o Percentili (P1, P2. . . )
se divisa in 10 parti, Decili (D1, D2. . . , D9)
se divisa in 4 parti, Quartili (Q1, Q2, Q3)
se divisa in 3 parti, TerziliNotate che
D1 = P10, e così viaQ1 = P25,Q2 = P50 = D5 è anche chiamato “Mediana”,Q3 = P75
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 38 / 61
Quartili N
I quartili suddividono la distribuzione in 4 parti ugualiQ1 Q2 Q3
Si usano solitamente il primo e il terzo quartile (Q1 e Q3)
Q1 ha sotto di sé il 25% dei dati25% 75%
Q2 ha sotto di sé il 50% dei dati50% 50%
Q3 ha sotto di sé il 75% dei dati75% 25%
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 39 / 61
Quartili: formule N
La posizione in cui cadono i quartili si trova con:
Q1 =14(N + 1) =
(N + 1)4
Q2 =24(N + 1) =
2(N + 1)4
=N + 12
Q3 =34(N + 1) =
3(N + 1)4
Se la posizione trovata non è un intero, si tronca (ovvero si usal’intero inferiore)
Una volta trovata la posizione si identifica il valore del quartile (ilvalore che corrisponde alla posizione)
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 40 / 61
Quartili N
Esempio
2 4 6 8 10 12 14 16 18 21 22 24 26 28 30
Q1 = (1/4)*(15+1)=16/4=4 ⇒ Q1=8
Q2 = (15+1)/2 = 8 ⇒ Q2=16
Q3 = (3/4)*(15+1)=48/4=12 ⇒ Q3=24
Esercizio
2 4 5 9 10 12
1 Q1 = ?
2 Q2 = ?
3 Q3 = ?
Soluzione
2 4 5 9 10 12
1 N=6; pos=1.75; Q1=2
2 N=6; pos=3.5; Q2=5
3 N=6; pos=5.25; Q3=10
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 41 / 61
Quartili N
Esempio
2 4 6 8 10 12 14 16 18 21 22 24 26 28 30
Q1 = (1/4)*(15+1)=16/4=4 ⇒ Q1=8
Q2 = (15+1)/2 = 8 ⇒ Q2=16
Q3 = (3/4)*(15+1)=48/4=12 ⇒ Q3=24
Esercizio
2 4 5 9 10 12
1 Q1 = ?
2 Q2 = ?
3 Q3 = ?
Soluzione
2 4 5 9 10 12
1 N=6; pos=1.75; Q1=2
2 N=6; pos=3.5; Q2=5
3 N=6; pos=5.25; Q3=10
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 41 / 61
Quantili (utilizzo) N
A livello ordinale, con molte categorie, Q1 e Q3 possono essere usaticome un indice di variabilità (poco informativo) sopra e sotto lamediana (Q2)
i terzili possono essere usati per studiare un campione che presentipunteggi bassi (≤ T1), medi (tra T1 e T2) o alti (>T2) in altrevariabili quantitative
i quintili potrebbero essere usati per escludere il 20% centrale (0-40%e 6o-100%) di un’altra variabile, usando il 2o e 3o quintile
i percentili sono usati nei test psicologici standardizzati come punteggidi riferimento in base a variabili come il genere e/o le fasce di età.
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 42 / 61
Spss: n-tili (Frequenze) N
In Statistiche...
Quartili calcola i quartili
Punti di divisione divide in n
parti uguali
Percentili: scrivete il percentileche volete e aggiungete
Qui abbiamo chiesto: i quartili, iterzili e il 45esimo percentile
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 43 / 61
Spss: Esplora... N
Dopo aver scelto le variabili, metterle in Variabili dipendenti
poi
click-are suStatistiche... escegliere Percentili
Quindi, click-are suContinua
Poi OK
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 44 / 61
Spss: Esplora... N
Esplora non permette di scegliere, ma fornisce alcuni n-tili notevoli
I tre quartili e i valori corrispondenti al 5o e 10o percentile su entrambi i lati.Questi valori hanno particolarmente senso con variabili “normali” (capiremopiù avanti) e sono usati in molti test psicologici (in particolare nei manualidi riferimento).
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 45 / 61
Diagramma a scatola e baffi N
Le rappresentazioni grafiche (in senso lato) di solito utilizzano informazionitratte da indici statistici.
Le tabelle di frequenza, usano frequenze, percentuali e percentualicumulate
Grafico a barre e istogramma usano rispettivamente le frequenze e ipunteggi
Il grafico a torta le frequenze o le percentuali
I diagrammi ramo foglia i singoli valori quantitativi*
Usando altri indici statistici possiamo fare altri tipi di rappresentazionigraficheUsando la differenza interquartilica si possono fare dei diagramma a scatola
e baffi
* Non li abbiamo affrontati
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 46 / 61
Misure di variabilità: differenza interquartilica [I/R] N
La differenza interquartilica (DI, IQR) è la differenza fra il terzo e ilprimo quartile
IQR = Q3 − Q1
e corrisponde al 50% centrale dei valori della distribuzione
Esempio
valori Q3-Q1 IQR
7 7 6 5 4 4 4 3 6-4 210 10 9 7 5 4 3 2 0 0 9-0 9
La semi-differenza interquartilica è la metà dell’IQR e corrispondeal 25% dei valori sopra o sotto la mediana
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 47 / 61
Diagramma a scatola e baffi N
Il diagramma a scatola e baffi(box-and-whiskers) è statoideato da Tukey nell’ambito dellaEDA (Exploratory data analysis).È spesso chiamato “box-plot”
La scatola è formata dai valoricorrispondenti al primo e alterzo quartile
2530
3540
4550
55
Tukey's Boxplot
min
Q1
Mdn
Q3
max
La linea spessa dentro la scatola corrisponde alla mediana
I baffi rappresentano cose diverse in base ai software: come primoapproccio useremo i valori minimo e massimo
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 48 / 61
Grafico a scatola [Box-plot] (I/R) N25
3035
4045
5055
Tukey's Boxplot
min
Q1
Mdn
Q3
max
variabile A ordinata: 2222 24 24 24 24 24 27 2727 27 30 30 31 31 32 3333 33 33 34 35 35 36 3636 37 39 39 41 42 42 4244 45 45 45 46 46 54 54
N=41; min=22;Q1(10)=27;Mdn(21)=34;Q3(31)=42; max=54
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 49 / 61
Grafico a scatola (I/R) N
In realtà i box-plot di SPSS ed R non visualizzano i valori minimo emassimo
Al loro posto viene usata la differenza interquartilica moltiplicata per1,5; in una distribuzione normale, questo valore è quasi sempre oltre ilmassimo e oltre il minimo (quindi si visualizzano max e min)
inoltre visualizzano i singoli valori anomali (i valori oltre i baffi),evidenziando quindi le code asimmetriche
L’utilità dei box-plot è più evidente se si incrociano con una variabilecategoriale, perché si possono fare confronti sulle distribuzioni deisotto-campioni
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 50 / 61
Grafico a scatola (I/R) N
Variabile asimmetrica
●
●
●●
●
200
300
400
500
600
Ven
dita
big
lietti
cin
ema
variabile Gross ordinata: 172173 173 174 175 176 176 177177 178 180 180 181 181 181181 183 183 183 184 184 184185 188 190 191 192 194 197199 199 202 202 205 206 207211 213 215 216 217 218 219226 228 229 233 234 235 239241 242 242 246 250 251 256257 260 260 262 268 286 290294 306 309 311 313 318 329330 339 357 404 431 435 461601IQR: (260− 184) * 1.5 = 114baffi: 70 e 374
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 51 / 61
Grafico a scatola (I/R) suddiviso (N/O) N
●
●●
●
●
●
●
CrNPr CrPr NCrNPr NCrPr
5010
015
0
Credente
Fon
dam
enta
lism
o
Per ogni valore dellavariabile diraggruppamento, vieneprodotto un box-plot
In questo modo sipossono vedere ledifferenze di distribuzione
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 52 / 61
Spss: Box-plot (Esplora) N
Spss produce i box-plot tramiteAnalizza | Statistiche
descrittive | Esplora... e
dal pulsante Grafici...
assicuratevi di aver attivato unadelle prime due opzioni di Grafici ascatola
Se avete selezionato più variabili,“Un grafico ogni dipendente”produce grafici separati
”Dipendenti insieme” produce ununico grafico
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 53 / 61
Spss: Box-plot suddiviso N
Esempio di box-plot di Spss
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 54 / 61
Misure di variabilità: curtosi e asimmetria N
Curtosi: è il grado dipiattezza della curva delladensità delle frequenzerispetto ad una curvaparticolare che è lanormale (valore diriferimento = 0);
Asimmetria: è il grado diasimmetria della curvadella densità dellefrequenze rispetto ad unacurva particolare che è lanormale (valore diriferimento = 0);
−4 −2 0 2 4
0.0
0.1
0.2
0.3
0.4
0.5
0.6
x
Pro
babi
lità
Curva normale con M=0 (sd=1)
Li vedremo meglio più avanti.
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 55 / 61
Riepilogo
Frequenza: numero di comparsa di un valore
Proporzione, percentuale: rapporto fra frequenza e totale(eventualmente moltiplicato per 100)
cumulate: frequenze o percentuali del valore considerato sommati atutti i precedenti
Tabelle di frequenza: tabella che riporta le frequenze, le percentuali ole percentuali cumulate dei valori di una variabile
Quantili: valori che corrispondono ad una particolare posizione
Quartili: i valori che corrispondono alle posizioni 25%, 50% e 75%
Percentili: valori che corrispondono alle posizioni da 1% a 99%
Ranghi percentili: la percentuali di valori minori o uguali ad un valoredato
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 56 / 61
Riepilogo tendenza centrale
Moda (Nominale): la frequenza più elevata (è il peggior indice)
Mediana (Ordinale): il valore in posizione centrale (non è per nullasensibile ai valori estremi)Media (Intervallo/Rapporto): valore di equilibrio di tutti i valori
è il miglior indice di tendenza centralema è molto sensibile ai valori estremi della distribuzione
In una distribuzione simmetrica normale, media, mediana e moda
coincidono
Se la media è minore della mediana la distribuzione è asimmetrica asinistra
Se la media è maggiore della mediana, la distribuzione è asimmetrica adestra
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 57 / 61
Riepilogo variabilità
Campo di variazione, Gamma di oscillazione, Intervallo(Intervallo/Rapporto): è l’indice più grossolano
Differenza interquartilica (Intervallo/Rapporto): poco usato inpsicologia
Semi-differenza interquartilica (Intervallo/Rapporto): pochissimousato in psicologia
Varianza (Intervallo/Rapporto): media degli scarti (dalla media) alquadrato
Deviazione standard (Intervallo/Rapporto): radice quadrata dellavarianza
Curtosi (Intervallo/Rapporto): per verificare la piattezza delladistribuzione rispetto alla normale
Asimmetria (Intervallo/Rapporto): per verificare se la distribuzione èsimmetrica
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 58 / 61
Come si riportano le informazioni statistiche
Ci sono molti modi di riportare queste statistiche all’interno delcontesto dell’articolo (o della tesi)
La grafica dev’essere selezionata con cura per rappresentareaccuratamente e fedelmente le informazioni
In genere, quindi, nei report di ricerca (o nelle tesi) si possono trovareistogrammi a più entrare e box-plot; negli articoli, rappresentazionigrafiche più complesse di quelle studiate finora
le rappresentazioni grafiche più semplici (torte, poligoni di frequenza esimili) non vengono usate.
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 59 / 61
Come si riportano queste statistiche
Di solito si riportano numerosità, media e deviazione standard(preferibilmente con 2 decimali, arrotondando se necessario)
1) in una tabella riassuntiva delle varie variabili
2) all’interno del testo per una o più variabili specifiche
Esempio
N M DS
Fondamentalismo 100 76,97 31,98Autoritarismo 100 33,95 11,32Intrinseco 100 23,57 6,40
“La variabileFondamentalismo (N=100)ha media 76,97 (DS=31,98)”
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 60 / 61
Come si riportano queste statistiche
Ovviamente la tabella si può adattare al contesto
Se la numerosità è uguale per tutte le variabili
si può riportarla una volta sola
il testo può essere sintetizzato in un altro modo
Esempio
N=100 M DS
Fondamentalismo 76,97 31,98Autoritarismo 33,95 11,32Intrinseco 23,57 6,40
“Le variabili Fondamentalismo eAutoritarismo (N=100) hannorispettivamente media di 76,97±31,98 e 33,95± 11,32.”
G. Rossi (Dip. Psicologia) ElemPsico a.a. 2019-20 61 / 61