Estatística Não Paramétrica
ANOVA de Kruskal-Wallis
Ivan Balducci FOSJC / Unesp
Os métodos não-paramétricos
são usados para situações que violam
as suposições dos procedimentos
paramétricos
Introdução: estatística não-paramétrica
Procedimentos não-paramétricos usam sinais
(indicadores de se um nº é positivo, negativo,
ou zero),
contagens, e postos (ranks) e
não usam médias e desvios padrão
Introdução: estatística não-paramétrica
• Quando os dados não seguem a normal ou são
assimétricos
Quando usamos a estatística não paramétrica?
Negativa Normal Positiva
Assimetria Distribuição Assimetria
* dados na escala ordinal
* quando não há igualdade de variância (dp)
Suposição de Normalidade para os Testes Paramétricos
• Os testes não-paramétricos exigem poucas
suposições, por exemplo, não exigem distribuição
normal dos dados
Distribuição de QI
Teste de Kruskal-Wallis
• Uma alternativa não-paramétrica à ANOVA 1 fator
• Pode ser usada para analisar dados ordinais
• Não assume determinada forma da população
• Assume que os C grupos são independentes
• Assume seleção aleatória de amostras individuais
Exemplo: Nº de Pacientes por Dia, por Médico, em Três Categorias Organizacionais
G1
G2 G3
13 24 2615 16 2220 19 3118 22 2723 25 28
14 3317
Ho: As três populacões são idênticasHa: Pelo menos uma das três populações é diferente
Teste de Kruskal-Wallis
Alternativa ao teste one-way ANOVA
Ho: As k populações têm idêntica distribuições de probabilidade
Ha: pelo menos duas das populações diferem em localização
KW = ∑ - 3(n + 1)12
n(n + 1)
TTii22
nnii
kk
i = 1i = 1
Rejeita Ho se KW é “grande”
KW (ou K ou H) é a estatística do teste
1- = df with ,
group ain items ofnumber =
group ain ranks of total
items ofnumber total=
groups ofnumber = :
131
12
2
j
j
1
2
T
CχK
n
n
Cwhere
nnn
KC
j j
j
nT
G1 G2 G313 24 2615 16 2220 19 3118 22 2723 25 28
14 3317
Ho: As três populacões são idênticas
Ha: Pelo menos uma das três populações é diferente
0 05
1 3 1 2
5 991
599105 2
2
.
.
. ,. ,
df C
KIf reject H .o
Exemplo: Nº de Pacientes por Dia por Médico em Três Categorias Organizacionais
Dados: Pacientes por Dia
Cálculos Preliminares
n = n1 + n2 + n3 = 5 + 7 + 6 = 18
Two
Partners
Three or
More
Partners HMO
Patients Rank Patients Rank Patients Rank
13 1 24 12 26 14
15 3 16 4 22 9.5
20 8 19 7 31 17
18 6 22 9.5 27 15
23 11 25 13 28 16
14 2 33 18
17 5
T1 = 29 T2 = 52.5 T3 = 89.5
n1 = 5 n2 = 7 n3 = 6
Kn n
nj
jj
C Tn
12
13 1
12
18 18 1 5 7 63 18 1
12
18 18 11897 3 18 1
9 56
2
1
2 2 229 525 895. .
,
.
.Hreject ,991.556.9
991.5
o
2
2,05.
K
Dados: Pacientes por Dia Cálculos Preliminares
Exemplo do com dados
(ranks = postos) iguais
(empates)
Cálculo da estatística H do teste de
Kruskal-Wallis na presença de empates
ANOVA de Kruskal-Wallis
Teste de Kruskal-Wallis com tied ranks• Example 10.11 (Zar, 1999) – comparison of pH among 4 ponds
Pond 1 Pond 2 Pond 3 Pond 4pH pH pH pH
7.68 7.71 7.74 7.717.69 7.73 7.75 7.717.70 7.74 7.77 7.747.70 7.74 7.78 7.797.72 7.78 7.80 7.817.73 7.78 7.81 7.857.73 7.80 7.84 7.877.76 7.81 7.91
Ho: As quatro populacões são idênticasHa: Pelo menos uma das quatro populações é diferente
Teste de Kruskal-Wallis com tied ranks
Pond 1 Pond 2 Pond 3 Pond 4pH Rank pH Rank pH Rank pH Rank
7.68 1 7.71 6 7.74 13.5 7.71 67.69 2 7.73 10 7.75 16 7.71 67.70 3.5 7.74 13.5 7.77 18 7.74 13.57.70 3.5 7.74 13.5 7.78 20 7.79 227.72 8 7.78 20 7.80 23.5 7.81 267.73 10 7.78 20 7.81 26 7.85 297.73 10 7.80 23.5 7.84 28 7.87 307.76 17 7.81 26 7.91 31
Totaln 8 8 7 8 31
Sum R 55 132.5 145 163.5 496R^2/n 378.1 2194.5 3003.6 3341.5 8917.8
Ho: As quatro populacões são idênticasHa: Pelo menos uma das quatro populações é diferente
Teste de Kruskal-Wallis com tied ranks
N = 8 + 8 + 7 + 8 = 31
H = {12/[N(N + 1)]} (Ri2/ni) - 3(N + 1)
H = {12/[31(31 + 1)]} (8917.8) - 3(31 + 1) = 11.876
Número de grupos de tied ranks = m = 7
Pond 1 Pond 2 Pond 3 Pond 4pH Rank pH Rank pH Rank pH Rank
7.68 1 7.71 6 7.74 13.5 7.71 67.69 2 7.73 10 7.75 16 7.71 67.70 3.5 7.74 13.5 7.77 18 7.74 13.57.70 3.5 7.74 13.5 7.78 20 7.79 227.72 8 7.78 20 7.80 23.5 7.81 267.73 10 7.78 20 7.81 26 7.85 297.73 10 7.80 23.5 7.84 28 7.87 307.76 17 7.81 26 7.91 31
Totaln 8 8 7 8 31
Sum R 55 132.5 145 163.5 496R^2/n 378.1 2194.5 3003.6 3341.5 8917.8
Teste de Kruskal-Wallis com tied ranks
Number of groups of tied ranks = m = 7
T = (ti3 - ti) = (23 - 2) + (33 - 3) + (33 - 3) + (43 - 4) + (33 - 3) + (23 - 2)
+ (33 - 3) = 168
T = (ti3 - ti) = 168
C = 1 - T / (N3 - N) = 1 - (168/ (313 - 31)) = 0.9944
Hc = H / C = 11.876 / 0.9944 = 11.943
Fator de Correção = C = 1 - T / (N3 - N)
H corrigido = H calculado / C
Teste de Kruskal-Wallis com tied ranks
Number of groups of tied ranks = m = 7
T = (ti3 - ti) = (23 - 2) + (33 - 3) + (33 - 3) + (43 - 4) + (33 - 3) + (23 - 2)
+ (33 - 3) = 168
C = 1 - T / (N3 - N) = 1 - (168/ (313 - 31)) =0.9944
Hc = H/C = 11.876/ 0.9944 = 11.943
= k - 1 = 4 -1 = 3
2 0.05, 3 = 7.815 < 11.943 = 0.01
rejeita Ho (Tabela Qui-quadrado)
Fator de Correção = C = 1 - T / (N3 - N)
H corrigido = H calculado / C
Não preocupemo-nos com os empates.
Porque os programas de computador (Minitab, por exemplo) já calculam
E, também, porque há equivalência com o teste ANOVA paramétrica efetuada com os dados
transformados
Calculamos ANOVA on rank data daí obtemos o valor de F que designamos por Fr
H corrigido = Fr(N-1) / [Fr + (N-K) / (K – 1) ]
K = número de grupos ; N = tamanho total da amostra
Não preocupemo-nos com os empates
Há equivalência com o teste ANOVA paramétrica efetuada com os dados transformados
Calculamos ANOVA on rank data daí obtemos o valor de F que designamos por Fr
Fr = [H calculado / (K-1) ] / [(N – 1 – H) / (N – K)]
Ao obtermos Fr, se aplicarmos a fórmula acima, então, obtemos H corrigido
Há equivalência entre KRUSKAL-WALLIS com o teste ANOVA paramétrica efetuada com os
dados transformados
Calculamos ANOVA on rank data daí obtemos o valor de F que designamos por Fr
Fr = [H calculado / (K-1) ] / [(N – 1 – H) / (N – K)]
H corrigido = Fr(N-1) / [Fr + (N-K) / (K – 1) ]
ou
Vale a pena ler:
W.J. CONOVER and R. L. IMAN –
Rank Transformations as a Bridge Between Parametric
and
Nonparametric Statistics
The American Statistician. vol. 35, nº 3, p.124-129, 1981.
Conclusão: são equivalentes os testes:
de Kruskal-Wallis e o ANOVA on rank data
Paramétrico
ANOVA on rankEquivalência entre
os testes
Termos que devem ser familiares
Não Paramétrico
Kruskal-Walliscorreção devido a empates