Ikke-parametriske tests
Feb 24, 2016
Ikke-parametriske tests
2
Dagens menu
t – testen… Hvordan var det nu lige det var?
WilcoxsonMann – Whitney U Kruskall WallisFriedman
Kendalls og Spearmans correlation
3
t-testen
Patient Drug Placebo difference1,00 19,00 22,00 -3,002,00 11,00 18,00 -7,003,00 14,00 17,00 -3,004,00 17,00 19,00 -2,005,00 23,00 22,00 1,006,00 11,00 12,00 -1,007,00 15,00 14,00 1,008,00 19,00 11,00 8,009,00 11,00 19,00 -8,0010,00 8,00 7,00 1,00
4
t-testen
Men er data normal fordelte? Vi spørger SPSS! – Table 4-1 Armitage
5
t-testen. Er data normalfordelte?
Tests of Normality
Kolmogorov-Smirnova Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
drug ,191 10 ,200* ,954 10 ,715
placebo ,172 10 ,200* ,936 10 ,509
a. Lilliefors Significance Correction
*. This is a lower bound of the true significance.
6
t-testens begrænsninger
• Hvis vi tvivler på normalfordeling• Hvis vores outcome (dependent variable) er ordinal (ordnet
kategorisk)fx ’--’, ’-’, ’0’, ’+’, ’++’
• Hvis vi kan nøjes med en simpel metode
7
The sign test
• Den non-parametriske version af one-sample t-test• H0 for One-sample t-test: Middelværdien er 0• H0 for sign testen: Fordelingen er symmetrisk omkring 0
8
The sign test
Patient Drug Placebo difference Sign1,00 19,00 22,00 -3,00 -2,00 11,00 18,00 -7,00 -3,00 14,00 17,00 -3,00 -4,00 17,00 19,00 -2,00 -5,00 23,00 22,00 1,00 +6,00 11,00 12,00 -1,00 -7,00 15,00 14,00 1,00 +8,00 19,00 11,00 8,00 +9,00 11,00 19,00 -8,00 -10,00 8,00 7,00 1,00 +
• Er der lige mange plusser og minusser?
• Der er 4 plusser og 6 minusser.
• Binomial fordelingen fortæller om sandsynligheden for at få 4 plusser ud af 10 mulige.
• (One sided!)
9
The sign test in SPSS
10
The sign test in SPSS – the fancy dialog
11
The sign test
Binomial Test
Category N
Observed
Prop. Test Prop.
Exact Sig. (2-
tailed)
difference Group 1 <= 0 6 ,60 ,50 ,754
Group 2 > 0 4 ,40
Total 10 1,00
• Det er altså ikke særligt usandsynligt at observere 4 eller mindre minusser ud af 10 mulige
12
Men fortegnet beskriver jo ikke hele forskellen…
Patient Drug Placebo difference1,00 19,00 22,00 -3,002,00 11,00 18,00 -7,003,00 14,00 17,00 -3,004,00 17,00 19,00 -2,005,00 23,00 22,00 1,006,00 11,00 12,00 -1,007,00 15,00 14,00 1,008,00 19,00 11,00 8,009,00 11,00 19,00 -8,0010,00 8,00 7,00 1,00
• Hvis fx de negative værdier er større end de positive
• Wilcoxon’s signed rank sum test Tager højde for det
13
Wilcoxon’s signed rank sum test
difference-3,00-7,00-3,00-2,001,00-1,001,008,00-8,001,00
• Opstil tallene efter størrelse uden at tage hensyn til fortegnet, men noter det blot
• Hvis flere tal har samme rank, bruges den gennemsnitlige rank
• Plussernes hhv. minussernes rank summeres
• T+ = 2,5+2,5+2,5+9,5 = 17• T- = 2,5+5+6,5+6,5+8+9,5 = 38
1 2 3 4 5 6 7 8 9 10Rank 2.5 5 6.5 8 9.5
Numerical value 1 1 1 1 2 3 3 7 8 8sign + - + + - - - - + -
14
Wilcoxon’s signed rank sum test
Der slås op i tabel for at se om ranken af den mindste er lille.
15
Wilcoxon’s signed rank sum test
16
Wilcoxon’s signed rank sum test –the fancy version
17
Wilcoxon’s signed rank sum test
Ranks
N Mean Rank Sum of Ranks
placebo - drug Negative Ranks 4a 4,25 17,00
Positive Ranks 6b 6,33 38,00
Ties 0c
Total 10
a. placebo < drug
b. placebo > drug
c. placebo = drug
Test Statisticsb
placebo - drug
Z -1,079a
Asymp. Sig. (2-tailed) ,281
a. Based on negative ranks.
b. Wilcoxon Signed Ranks Test
18
• Use Wilcoxon’s signed rank sum test to test if there is a statistical difference between the number of attacks in the placebo and the Pronethaol groups
Pause Opgave
Patient number
# attack on placebo Pronethaol
1 71 29 2 323 348 3 8 1 4 14 7 5 23 16 6 34 25 7 79 65 8 60 41 9 2 0 10 3 0 11 17 15 12 7 2
19
Sammenligning mellem to uafhængige grupper
Mann Whitney U testEller Wilcoxon’s rank sum testEller Kendall’s S test
t-testen for ikke-parametrisk data
20
Mann Whitney U (Wilcoxon’s metode) test
H0: Fordelingerne som de to grupper stammer fra er identiske
Sådan gør man: ovnen tændes på 200C1. Opstil tallene fra begge grupper i rækkefølge (Ranking)2. Beregn summen af rank’ene for hver gruppe3. Tæl antallet af tal i hver gruppe4. Se om den mindste rank sum er mindre end den der er opgivet i
tabel A8
21
Mann Whitney U test (Wilcoxon’s metode) - I hånden
High Protein
Low Protein
134,00 70,00146,00 118,00104,00 101,00119,00 85,00124,00 107,00161,00 132,00107,00 94,0083,00
113,00129,0097,00
123,00
22
Mann Whitney U test (Wilcoxon’s metode) - I hånden
23
Mann Whitney U test (Wilcoxon’s metode) - I SPSS
Tabel 4-2 ArmitageBemærk opsætningen af data!
24
Mann Whitney U test (Wilcoxon’s metode) - I SPSS
Bemærk at man skal definere gruppe inddelingen!
25
Mann Whitney U test - I SPSS
26
Mann Whitney U test - I SPSS
Ranks
group N Mean Rank Sum of Ranks
Weight low 7 7,07 49,50
high 12 11,71 140,50
Total 19
Test Statisticsb
Weight
Mann-Whitney U 21,500
Wilcoxon W 49,500
Z -1,733
Asymp. Sig. (2-tailed) ,083
Exact Sig. [2*(1-tailed Sig.)] ,083a
a. Not corrected for ties.
b. Grouping Variable: group
28
Sammenligning af flere usammenhængende grupper
Kruskal-Wallis test
H0: Fordelingerne som gruppere stammer fra er identiske
En-vejs ANOVA for parametrisk data
29
Kruskal-Wallis test
Et par definitioner:k er antallet af grupperni antallet af observationer i den i’te gruppeN er det samlede antal observationerRi summen af ranks i den i’te gruppe
Sådan gør man:Rank alle observationerBeregn rank summen for hver gruppeBeregn H (Det der i bogen kaldes T)Dette H er en chi-kvadrat fordeling med k-1 frihedsgræderSlå p-værdien op i en tabel
131
122
NNN
H iin
T
30
Kruskal-Wallis test – Et eksampel fra Armitage
31
Kruskal-Wallis test – Et eksampel
De rå data rankes
32
Kruskal-Wallis test – Et eksampel
De rå data rankesH beregnes
2,6632,692132120242212
120312020
57936534212
2222
H
131
122
NNN
H iin
T
33
Kruskal-Wallis test – Et eksampel
De rå data rankesH = 6,2 Antallet af frihedsgrader = k-1 = 3
34
Kruskal-Wallis test – i SPSS
35
Kruskal-Wallis test – i SPSS
36
Kruskal-Wallis test – i SPSS
37
Kruskal-Wallis test – i SPSS
Ranks
group N Mean Rank
count 1,00 5 8,40
2,00 5 10,60
3,00 5 7,20
4,00 5 15,80
Total 20
Test Statisticsa,b
count
Chi-Square 6,205
df 3
Asymp. Sig. ,102
a. Kruskal Wallis Test
b. Grouping Variable:
group
38
Sammenligning af flere sammenhængende grupper
Friedman’s test
Repeated ANOVA for parametrisk data
39
Friedman’s test Table 8.3 from Armitage
40
Friedman’s test
Ranks
Mean Rank
T1 1,38
T2 2,00
T3 2,94
T4 3,69
Test Statisticsa
N 8
Chi-Square 15,152
df 3
Asymp. Sig. ,002
a. Friedman Test
41
Friedman’s test
42
Pause opgave?
• Er der forskel på grisebassernes vægt i de forskellige fodergrupper?
43
Ranked Correlation
Kendall’s Spearman’s rs
Korrelation koefficienten er mellem -1 og 1. Hvor -1 er perfekt omvendt korrelation, 0 betyder ingen korrelation,
og 1 betyder perfekt korrelation.
Pearson is the correlation method for normal dataRemember the assumptions:1. Dependent variable must be metric continuous2. Independent must be continuous or ordinal3. Linear relationship between dependent and all independent
variables4. Residuals must have a constant spread.5. Residuals are normal distributed
44
Kendall’s - Et eksempel
45
Kendall’s - Et eksempel
121
nnS QPS
46
Spearman – det samme eksempel
d2 1 4 9 1 1 1 9 9 1 16
0.684810105261
61 33
2
nnd
rs
47
Korrelation i SPSS
48
Korrelation i SPSS
Correlations
a b
a Pearson
Correlation
1 ,685*
Sig. (2-tailed) ,029
N 10 10
b Pearson
Correlation
,685* 1
Sig. (2-tailed) ,029
N 10 10
*. Correlation is significant at the 0.05 level (2-tailed).
Correlations
a b
Kendall's tau_b a Correlation
Coefficient
1,000 ,511*
Sig. (2-tailed) . ,040
N 10 10
b Correlation
Coefficient
,511* 1,000
Sig. (2-tailed) ,040 .
N 10 10
Spearman's rho a Correlation
Coefficient
1,000 ,685*
Sig. (2-tailed) . ,029
N 10 10
b Correlation
Coefficient
,685* 1,000
Sig. (2-tailed) ,029 .
N 10 10
*. Correlation is significant at the 0.05 level (2-tailed).