4. Testes não Paramétricos

Dep. Matemática Escola Superior de Tecnologia de Viseu

TESTES DE HIPÓTESES NÃO PARAMÉTRICOS

Carla Henriques e Manuel Reis Tratamento Estatístico de Dados

1

Testes Não Paramétricos

Nos testes abordados até agora, ditos testes paramétricos, as hipóteses

envolvem apenas parâmetros populacionais, como a média, a variância, uma

proporção, etc. Além disso, em geral, estes testes comportam uma diversidade

de suposições fortes a que o seu emprego deve subordinar-se de que são

exemplo:

as observações devem ser extraídas de populações com distribuição

especificada;

as variáveis em estudo devem ser medidas em escala intervalar ou de

rácios, de modo a que seja possível utilizar operações aritméticas sobre os

valores obtidos das amostras (adição, multiplicação, ...),

etc.


TESTES DE HIPÓTESES NÃO PARAMÉTRICOS


2

Vamos agora abordar um conjunto de testes que nos permitem testar outro tipo

de hipóteses que não apenas sobre parâmetros populacionais (e.g., se a

distribuição populacional em estudo pode ser considerada Normal). Estes são

chamados testes não paramétricos.

Estes testes são, em geral, fáceis de aplicar, pois podem ser usados quando

as hipóteses exigidas por outras técnicas não são satisfeitas. Apesar de haver

certas suposições básicas associadas à maioria das provas não paramétricas,

essas suposições são em menor número e mais fracas do que as associadas às

provas paramétricas. A maior parte das provas não paramétricas servem para

pequenas amostras e, além disso, aplicam-se a dados medidos em escala

ordinal, e alguns mesmo a dados em escala nominal.


TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Testes de Ajustamento


3

Testes de Ajustamento (testes da bondade do ajustamento)

Os testes de ajustamento servem para testar a hipótese de que uma

determinada amostra aleatória tenha sido extraída de uma população com

distribuição especificada.

Hipóteses a testar:

H0: a amostra provém de uma população com distribuição especificada H1: a população de onde provém a amostra não segue a distrib. especificada




4

Exemplo: Pretende-se construir um modelo de simulação das operações de um determinado terminal de um porto situado na Europa.

Uma das variáveis a considerar no modelo é a diferença entre a data de chegada dos navios provenientes dos EUA e a respectiva data planeada. Há razões para supor que tal diferença é uma variável aleatória com distribuição Normal de média 0.1 e desvio padrão 7.2.

Uma amostra de 30 navios revelou os resultados que se apresentam na tabela seguinte.

-6.6 -2 5 2.4 -1.8 -0.3 15 -7.6 -0.6 2.6 -7.4 12.4 -6 -5.8 15.2 -2.4 -8.9 -5.6 -3.7 2.2 8.2 -9 13.2 7.6 -2.8 -1.8 1.8 4.4 2.2 4

Diferença entre a data de chegada e a data planeada para 30 navios.

Será mesmo de admitir que tais dados foram extraídos de uma pop. N(0.1, 7.2)?




5

Neste exemplo, estamos perante um problema de ajustamento de dados a uma

determinada distribuição.

Existem vários testes de ajustamento que nos permitem fazer uma análise de

problemas deste tipo, entre os quais: o Teste de Ajustamento do Qui-quadrado

sugerido por Karl Pearson, o teste de Kolmogorov ou Kolmogorov-Smirnov e o

teste de normalidade de Lilliefors, que apresentamos a seguir.




6

Teste do Qui-quadrado

Considere-se uma amostra aleatória de n elementos, extraída de uma

população com distribuição desconhecida, sobre os quais se observa uma

característica (qualitativa ou quantitativa).

Os valores possíveis da característica em estudo são, num primeiro passo,

repartidas por m classes mutuamente exclusivas, A1, A2, ... , Am (serão intervalos

da recta real se a característica é quantitativa e contínua).




7

Denote-se por:

- Oi o nº de observações ou frequência absoluta observada da classe Ai;

- pi a probabilidade desconhecida de obter uma observação na classe Ai;

- p0i a probabilidade de obter uma observação na classe Ai , assumindo que

a observação foi extraída de uma população com a distribuição especificada

em H0.


H0: pi=p0i , i=1,...,m

H1: pi≠p0i para algum i




8

Assim, a frequência esperada da classe Ai, quando H0 é verdadeira, é dada por

ei = n×p0i.

A estatística de teste, do teste de ajustamento do Qui-quadrado, é dada por

( )∑=

−=

m

i i

iie

eOQ1

2

que, sendo verdadeira a hipótese nula, tem distribuição assimptótica do Qui-

quadrado com m-k-1 graus de liberdade (χ2m-k-1), onde k é o número de

parâmetros desconhecidos da distribuição proposta em H0, estimados a partir da

amostra.




9

Se a hipótese nula for verdadeira, a diferença entre cada valor observado e o

respectivo valor esperado, Oi–ei, não deve ser muito grande e,

consequentemente, a estatística de teste terá um valor observado, Qobs, também

não muito grande.

De modo intuitivo, quanto maior for o valor observado de Q, menos plausível é

a hipótese nula, isto é, mais nos encaminhamos de concluir que as frequências

observadas não foram provenientes da população em que se baseou a hipótese

nula, levando à rejeição desta.

Trata-se portanto de um teste unilateral à direita.




10

Na aplicação deste teste deve-se ter particular atenção às frequências

esperadas, ei’s, pois se estas forem muito pequenas a aproximação ao

Qui-quadrado não é a mais apropriada. São referidas na literatura várias regras

práticas de aplicação do teste, das quais avançamos a seguinte. Se tivermos:

- mais de 20% das classes com ei inferior a 5 ou,

- alguma classe com ei inferior a 1

devemos proceder à agregação de algumas classes contíguas, e iniciar

novamente o teste, agora com menos classes.




11

Retomemos o exemplo exposto atrás.

Exemplo: Denotando por X a diferença entre a data de chegada dos navios e a

data planeada, as hipóteses a testar são

H0: X ~ N(0.1, 7.22)

H1: X ~/ N(0.1, 7.22)

Neste caso a distribuição proposta em H0 é contínua e, deste modo, as classes

Ai, i=1,...m, são intervalos da forma

A1=]-∞, a1[, A2=[ a1, a2[ A3=[ a2, a3[ ... Am=[ am-1, +∞[.




12

Para a determinação das classes é sugerida a regra de Mann e Wald:

Número de classes = m, com m tal que n/m>5.

Os limites dos intervalos são tais que as probabilidades decorrentes da

hipótese nula sejam iguais a 1/m para todas as classes.

Assim, as frequências esperadas são todas iguais a n/m>5.

Para o exemplo escolheu-se m=4 classes (ei=30/4=7.5>5), donde

p0i = P(Ai\H0) = 1/4, para i=1,2,3,4.




13

Cálculo dos limites dos intervalos de classe:

a3: p03 = 0.25 ⇔ a3=4.96 (EXCEL: INV.NORM(0.75;0.1;7.2));

Da simetria da distribuição normal:

a2=0.1 e a1=0.1-(4.924-0.1)= -4.724 (EXCEL: INV.NORM(0.25;0.1;7.2))

a1 a2 =0.1 a3

1/4 1/4 1/4

1/4




14

-6.6 -2 5 2.4 -1.8 -0.3 15 -7.6 -0.6 2.6-7.4 12.4 -6 -5.8 15.2 -2.4 -8.9 -5.6 -3.7 2.28.2 -9 13.2 7.6 -2.8 -1.8 1.8 4.4 2.2 4

Classes Frequências

observadas p0i Frequências

esperadas A1=]-∞, -4.76[ 8 0.25 7.5 A2=[-4.76,0.1[ 8 0.25 7.5 A3=[0.1, 4.96[ 7 0.25 7.5 A4=[4.96, +∞ [ 7 0.25 7.5

O valor observado da estatística de teste é

Qobs= 5.7

)5.78( 2− + 5.7

)5.78( 2− +5.7

)5.77( 2− +5.7

)5.77( 2− = 0.13




15

A estatística teste, sob o pressuposto de H0 ser verdadeira, tem

aproximadamente distribuição Qui-quadrado com m-1=4-1=3 graus de liberdade.

Para α=0.05: R.C.=[7.81, +∞[ . (EXCEL: 7.81=INV.CHI(0,05;3))

Como Qobs ∉R.C., somos levados a não rejeitar a hipótese de que a diferença

entre os tempos de chegada e os tempos planeados tem distribuição N(0.1, 7.22).




16

Teste de Kolmogorov-Smirnov (K-S)

O teste de Kolmogorov-Smirnov (K-S) ao contrário do teste do Qui-quadrado,

não se aplica a dados qualitativos nem a variáveis discretas, pois a tabela

disponível para este teste só é exacta caso a distribuição em teste seja contínua.

No entanto, tem a vantagem de não estar dependente de classificações dos dados, que além de serem sempre algo arbitrárias envolvem perdas de

informação. De facto, no ajustamento de uma distribuição contínua a uma

amostra usando o teste do Qui-quadrado, temos de proceder à agregação dos

dados em classes, sendo por isso mais adequado utilizar o teste K-S.




17

Por outro lado, o teste K-S só pode ser aplicado quando a distribuição indicada

na hipótese nula está completamente especificada (o que não sucede com o

teste do Qui-quadrado). No caso de pretendermos, por exemplo, efectuar um

ajustamento de uma distribuição normal, sem especificar µ e σ, podemos recorrer

a outro teste, neste caso o teste desenvolvido por Lilliefors (teste de normalidade

de Lilliefors) que será abordado mais tarde.

Além disso, o teste do Qui-Quadrado está orientado essencialmente para

grandes amostras, enquanto que o teste K-S é aplicável a pequenas amostras.




18

Seja F a função de distribuição da população em estudo e F0 a função de

distribuição proposta, contínua e completamente especificada.


H0: F(x)=F0(x), para qualquer x H1: F(x)≠F0(x), para algum x

No teste de Kolmogorov-Smirnov comparam-se as frequências relativas

acumuladas registadas na amostra com as que se esperariam se a distribuição

populacional fosse a especificada na hipótese nula.




19

A Estatística do teste de K-S considera a maior das diferenças, em valor absoluto, entre a

proporção de observações inferiores ou iguais a x, S(x), e a probabilidade de se observar

um valor inferior ou igual a x se a distribuição populacional for a especificada em H0, F0(x):

)()(sup 0 xFxSDx

n −=+∞<<∞−

F0(x)

)(xS




20

Uma vez que F0 é uma função (contínua) não decrescente e S é uma função

em escada, o supremo ocorre num ponto onde se verifica um salto de S :

{ } )()( , )()( max 100,...,1, −

=−−= iiiiniobsn xSxFxSxFD .

Assim, se H0 for verdadeira, a distância vertical máxima entre as imagens das

duas distribuições não deve de ser muito grande, e logo espera-se que Dn,obs

tome um valor pequeno.

Então, para um nível de significância α, rejeita-se H0, se o valor observado for

superior ou igual ao ponto crítico Dn,α (os valores críticos Dn,α podem ser consultados

numa tabela).




21

Exemplo: Acredita-se que o tempo despendido na execução de uma

determinada tarefa é uma variável aleatória com distribuição normal de média

290 minutos e desvio padrão 56 minutos. Foram registados os tempos

despendidos em 10 tarefas seleccionadas ao acaso, tendo-se registado o

seguinte:

198 254 262 272 275 278 285 287 287 292

Ao nível de significância de 5%, há evidência para rejeitar a hipótese de

normalidade da referida variável?




22

Denote-se por X o tempo despendido na execução de uma tarefa.

As hipóteses a testar são, neste caso,

H0: X∼N(290, 562)

H1: X ~/ N(290, 562).

O ponto crítico da estatística de teste D10 é, para α=0.05, D10,0.05= 0.409

(consulte a tabela).

Para calcular o valor observado da estatística de teste, começa-se por ordenar

os valores da amostra por ordem crescente. Os cálculos estão efectuados na

tabela seguinte.




23

EXCEL: DIST.NORM(198;290;56;VERDADEIRO)

xi S(xi) S(xi-1) F0(xi) |F0(xi)- S(xi) | |F0(xi)- S(xi-1)|

198 0,1 0 0,0502 0,05 0,0502 254 0,2 0,1 0,2602 0,06 0,1602 262 0,3 0,2 0,3085 0,009 0,1085 272 0,4 0,3 0,3739 0,026 0,0739 275 0,5 0,4 0,3944 0,106 0,0056 278 0,6 0,5 0,4152 0,185 0,0848 285 0,7 0,6 0,4644 0,236 0,1356 287 0,9 0,7 0,4786 0,421 0,2214 292 1 0,9 0,5142 0,486 0,3858

Como D10,obs =0.486>0.409, ao nível de significância de 5%, rejeitamos a

hipótese de o tempo despendido na execução de uma tarefa seguir distribuição

N(290, 562).




24

Teste de Normalidade Lilliefors

Pretende-se testar se uma dada variável aleatória X tem distribuição N(µ, σ2)

sem especificar µ e σ, isto é, para algum µ e algum σ.

Hipóteses a testar

H0: X ~ N(µ, σ2)

H1: X ~/ N(µ, σ2)

Este teste processa-se como o teste de K-S, usando estimativas de µ e σ,

respectivamente, x e s.

Os pontos críticos são consultados na tabela elaborada por Lilliefors.




25

Exemplo: Um distribuidor pretende estimar o tempo médio de entrega dos

seus produtos a um cliente bastante importante. Foi recolhida uma amostra

aleatória de cinco tempos: 29, 33, 35, 36 e 36.

O senhor quer estimar o tempo médio pretendido através de um intervalo de

confiança, mas nada sabe acerca da distribuição do tempo de entrega X, e além

disso, a dimensão da amostra é muito pequena (n=5). Poderá fazê-lo?

Sabemos que caso a distribuição subjacente aos dados seja normal, o

intervalo pode ser calculado usando a fórmula:

nStX m , onde t: P(-t<T<t) =λ, T ~ tn-1




26

Assim, interessa testar, em primeiro lugar, as hipóteses

H0: X ~ N(µ, σ2) H1: X ~/ N(µ, σ2)

Uma vez que nada sabemos acerca de µ e σ, podemos utilizar o teste de

Lilliefors, recorrendo às estimativas x =33.8 s=2.95 .

O valor crítico da estatística teste, ao nível de significância de 0.05 é *

05.0,5D =0.337 (consulte a tabela).




27

EXCEL: DIST.NORM(29;33.8;2.95;VERDADEIRO) Cálculo do valor observado da estatística de Teste:

xi S(xi) S(xi-1) F0(xi)

|F0(xi)- S(xi) | |F0(xi)- S(xi-1)|

29 0,2 0 0,0519 0,1481 0,0519 33 0,4 0,2 0,3931 0,0069 0,1931 35 0,6 0,4 0,6579 0,0579 0,2579 36 1 0,6 0,772 0,2279 0,1721

Como *,5 obsD =0.2579<0.337, então, ao nível se significância de 5%, não

rejeitamos a hipótese de a população em estudo ter distribuição normal.


TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Tabelas de Contingência


28

Tabelas de Contingência

Teste do Qui-quadrado de Independência

Suponha que numa amostra aleatória de tamanho n de uma dada população

são observados dois atributos ou características A e B (qualitativas ou

quantitativas), uma com r e outra com s modalidades ou categorias,

respectivamente A1, A2,..., Ar e B1, B2,..., Bs.




29

Cada indivíduo da amostra é classificado numa e numa só categoria (ou

classe) de A e numa e numa só categoria (ou classe) de B.

A classificação dos elementos da amostra dá origem a uma tabela de dupla

entrada, designada por tabela de contingência r×s, com o seguinte aspecto:

B1 B2 ... Bs

A1 O11 O12 ... O1s

A2 O21 O22 ... O2s

M M M O M

Ar Or1 Or2 ... Ors

Oij (i=1,...,r e j=1,...,s) número de elementos classificados simultaneamente

nas categorias Ai de A e Bj de B, numa amostra de tamanho n.




30

Sejam:

• Oi⋅ ∑=

=s

1jijO (i=1,...,r) nº de elementos na amostra com modalidade Ai;

• O⋅j ∑=

=r

1iijO (j=1,...,s) nº de elementos na amostra com modalidade Bj.

Tem-se,

∑∑∑∑=

•=

•= =

===s

1jj

r

1ii

r

1i

s

1jij OOOn

onde n é a dimensão da amostra.




31

O objectivo a que nos propomos é o de tentar inferir sobre a existência ou não

de qualquer relação ou associação entre os atributos (variáveis) A e B, mais

concretamente, inferir se A e B são ou não independentes.


H0: A e B são independentes

H1: A e B não são independentes




32

Denote-se por: • pij=P(Ai∩Bj) (i=1,..,r e j=1,...,s) a probabilidade (desconhecida) de um

indivíduo da população ser classificado simultaneamente nas categorias Ai de

A e Bj de B;

• pi⋅=P(Ai) (i=1,...,r) a probabilidade (desconhecida) de um indivíduo da população ser classificado na categoria Ai de A;

• p⋅j=P(Bj) (j=1,...,s) a probabilidade (desconhecida) de um indivíduo da população ser classificado na categoria Bj de B.

∑∑∑∑=

•=

•= =

===s

1jj

r

1ii

r

1i

s

1jij ppp1 .




33

Ora, se os atributos são independentes, verifica-se a conhecida relação,

P(Ai∩Bj) = P(Ai) P(Bj),

isto é,

pij= pi⋅× p⋅j Assim, as hipóteses anteriores podem ser formuladas do seguinte modo:

H0: pij= pi⋅× p⋅j (para todo i e j)

H1: pij≠ pi⋅× p⋅j (para algum i≠j).




34

Os verdadeiros valores das probabilidades pi⋅ e p⋅j são estimadas, a partir dos dados amostrais, por

nOp i

i•

• = e n

Op j

j•

• = ,

Notação: eij=n pij número esperado de indivíduos na classe Ai de A e Bj de B.

Quando H0 é verdadeira, i.e, pij= pi⋅× p⋅j , temos

eij=n pij =n pi⋅× p⋅j ⎯⎯⎯⎯ →⎯ porestimado

nOO

ppne jijiij

••••

×==




35

A estatística do teste de independência é então:

∑∑= =

−=χ

r

1i

s

1j ij

2ijij2

e)eO(

,

que, sob o pressuposto de H0 ser verdadeira, tem distribuição assimptótica do

Qui-quadrado com (r-1)(s-1) graus de liberdade.

Vimos que quando H0 é verdadeira eij pode ser estimado por jiij ppne ••= .

Logo, a diferença entre Oij (frequência observada) e ije (estimativa da frequência

esperada supondo a independência) não deve ser grande.

Assim, a estatística teste, mede o afastamento dos dados em relação à

hipótese de independência. Trata-se então de um teste unilateral à direita.




36

Exemplo: Um supermercado quer testar ao nível de significância de 5% a

hipótese de que o modo de pagamento dos clientes nesse estabelecimento é

independente do período do dia em que fazem as compras. Existem três modos

de efectuar os pagamentos: por cheque, dinheiro e cartão de débito/crédito.

A seguinte tabela de contingência 3×3 apresenta os resultados obtidos numa

amostra de 4000 clientes:

PERÍODO DO DIA MODO DE PAGAMENTO Manhã Tarde Noite

Cheque 750 1500 750 Dinheiro 125 300 75

Cartão de débito/Crédito 125 200 175




37

Denotando por A o atributo Modo de pagamento e por B o atributo Período do

dia em que faz as compras, as hipóteses as testar são

H0: A e B são independentes

H1: A e B não são independentes

Uma vez que A e B assumem cada uma 3 modalidades, sob H0, a estatística

teste tem distribuição assimptótica do Qui-quadrado com (r-1)(s-1)=(3-1)(3-1)= 4

graus de liberdade.

Ao nível de significância de 0.05, a região crítica é então [9.49, +∞[ (consulte

tabela ou faça no EXCEL: INV.CHI(0,05;4)).




38

PERÍODO DO DIA MODO DE PAGAMENTO Manhã Tarde Noite Totais

Cheque 750 1500 750 3000 Dinheiro 125 300 75 500

Cartão de Crédito 125 200 175 500 Totais 1000 2000 1000 4000

Cálculo das frequências esperadas: jiij ppne ••= =nn

Oi•n

O j• =nOO ji ••

11e =(3000×1000)/4000=750

12e =(3000×2000)/4000=1500

13e =(3000×1000)/4000=750.

M




39

Frequências esperadas

PERÍODO DO DIA MODO DE PAGAMENTO Manhã Tarde Noite Totais

Cheque 750 1500 750 3000 Dinheiro 125 250 125 500

Cartão de Crédito 125 250 125 500 Totais 1000 2000 1000 4000

Valor observado da estatística teste:

χ2obs =

750)750750( 2− +

1500)15001500( 2− +...+

250)250200( 2− +

125)125175( 2− =60.

Uma vez que 60 excede o valor crítico 9.49, ao nível de significância de 0.05,

rejeitamos a hipótese de que o modo de pagamento é independente do período

do dia em que as compras são feitas.




40

Medidas de Associação

No teste do Qui-Quadrado apresentado, se for rejeitada a hipótese de

independência entre os atributos, pode interessar medir a intensidade da

associação entre os mesmos, através de uma medida adequada.

Uma vez que a estatística do teste mede o afastamento em relação à hipótese

de independência, o seu valor observado poderá ser usado para avaliar o grau de

associação entre os atributos.




41

Coeficiente de Contingência de Pearson: n

C 2

2

+χχ

=

Este coeficiente varia entre 0 e q)1q( − onde q=min{r,s} e portanto nunca

assume o valor 1.

Valores pequenos de C indicam fraca associação entre os atributos, enquanto

que valores grandes de C indicam forte associação.

O facto deste coeficiente não assumir o valor 1 no caso de associação

completa é uma sua limitação. Para obviar este problema, Tshuprow propôs o

seguinte coeficiente.




42

Coeficiente de Tshuprow: )1s()1r(n

2T

−×−χ

=

Este coeficiente varia entre 0 e 1, tomando o valor 0 no caso de existir

independência e o valor 1 quando r=s e houver associação completa.

Por último, referimos o coeficiente proposto por Cramer que atinge o valor 1

quando há associação completa.

Coeficiente V de Cramer: )1q(n

V2

−χ

= , com q=min{r,s} 0≤V≤1.




43

Para o exemplo anterior, rejeitámos a hipótese de independência entre o modo

de pagamento e o período do dia em que as compras eram efectuadas.

Para ter uma ideia da intensidade de associação entre estes dois atributos,

calculam-se os coeficientes que acabámos de descrever.

Coeficiente de Contingência de Pearson: 1220400060

602

2.

nC =

+=

+χ

χ=

0≤C≤ q)q( 1− , onde q=min{r,s}=3, i.e, 0 ≤C≤ 0.816.




44

Coeficiente de Tshuprow: 224000

6011

2

×−×−χ ==

)s()r(nT =0.087

Coeficiente V de Cramer: 24000

601

2

×=

−χ

=)q(n

V =0.087

Verificamos, então, que apesar de haver associação entre os atributos, esta

pode considerar-se fraca.




45

Teste de Homogeneidade Suponha que são recolhidas amostras aleatórias de s populações

(sub-populações ou estratos) B1, B2,..., Bs , nas quais se observa um atributo A

com r categorias A1, A2,..., Ar.

Neste contexto, surge também uma tabela de contingência r×s:

B1 B2 ... Bs

A1 O11 O12 ... O1s

A2 O21 O22 ... O2s

M M M O M

Ar Or1 Or2 ... Ors

Oij (i=1,...,r e j=1,...,s) número de elementos da amostra da população Bj

classificados na categoria Ai de A.




46

Sejam:

• Oi⋅ ∑=

=s

1jijO (i=1,...,r) nº de elementos na categoria Ai de A em todas as

amostras;

• O⋅j ∑=

=r

1iijO (j=1,...,s) tamanho da amostra recolhida na população Bj.

Neste caso, cada Bj rotula uma sub-população cujos elementos se distribuem

pelas r modalidades do atributo A, e o que se pretende saber é se existe homogeneidade, isto é, se não há diferença entre as populações no modo como os seus elementos se distribuem pelas modalidades do atributo A.




47

À semelhança do teste de independência, a estatística do teste é

∑∑= =

−=χ

r

1i

s

1j ij

2ijij2

e)eO(

,

que, sob o pressuposto de H0 ser verdadeira, tem distribuição assimptótica do

Qui-Quadrado com (r-1)(s-1) graus de liberdade.

Valores muito grandes da estatística de teste traduzem um grande afastamento

dos dados em relação à hipótese nula, conduzindo à rejeição desta. Assim, a estatística de teste mede o afastamento dos dados em relação à hipótese de homogeneidade.




48

Para aplicar os testes de independência e de homogeneidade devem ser

seguidas as mesmas regras que vimos para o teste de ajustamento do Qui-

quadrado, isto é, se tivermos:

- mais de 20% das frequências esperadas, ei’s, inferiores a 5 ou,

- alguma frequência esperada inferior a 1

devemos proceder à agregação de algumas classes contíguas.




49

Teste exacto de Fisher O teste do Qui-quadrado é, como já se disse, baseado numa distribuição

assimptótica, o que portanto limita a sua aplicação ao caso de grandes amostras

(recorde as limitações sobre as frequências esperadas).

Em tabelas de contingência 2x2, existe uma alternativa ao teste do

Qui-quadrado, o teste de Fisher, que é um teste exacto, i.e., a distribuição da

estatística é exacta (os pontos críticos e valores-p são calculados de forma

exacta).


TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Ajuste entre duas Amostras Independentes


1

AJUSTE ENTRE DUAS AMOSTRAS INDEPENDENTES Objectivo: Dadas duas amostras aleatórias e independentes provenientes de duas

populações, pretende-se testar a hipótese H0 de que as duas distribuições

populacionais são idênticas, isto é, as duas amostras podem ser consideradas

como provenientes de populações com a mesma distribuição.


H0: As duas amostras são retiradas de populações com a mesma distribuição

H1: As duas amostras são retiradas de populações com distribuições diferentes




2

Teste do Qui-quadrado

Os valores possíveis da característica em estudo são repartidos por m classes

mutuamente exclusivas A1, A2,...,Am.

A hipótese H0 que se pretende testar é a de que as duas populações em

estudo têm a mesma distribuição, isto é, não há diferença entre as duas

populações no modo como os seus elementos se distribuem pelas diversas

classes. Por outras palavras, as duas populações são homogéneas.

Trata-se então do teste do Qui-quadrado de homogeneidade para duas

populações (s=2).




3

Teste de Kolmogorov-Smirnov Este teste aplica-se a distribuições contínuas.

Comparam-se as frequências relativas acumuladas registadas nas duas amostras

(digamos A e B). Se não se registarem diferenças significativas, não é rejeitada a hipótese

nula de que as duas amostras provêm de populações com a mesma distribuição.

A estatística de teste considera a maior das diferenças, em valor absoluto, entre as

proporções de valores inferiores ou iguais a x observadas em cada amostra, SA(x)–SB(x).

Estatística de teste:

)()(sup' xSxSD BAx

−=+∞<<∞−

Para um nível de significância α, a hipótese H0 é rejeitada se o valor observado da

estatística de teste for superior ao ponto crítico α'D (a ser consultado numa tabela).




4

Exemplo: Registaram-se os valores de uma análise feita a 80 indivíduos com a variante

A de uma dada doença, obtendo-se os seguintes resultados

VALORES 20 22 23 26 29 30 31 33 34 N.º indivíduos 2 3 9 12 27 16 7 2 2

Seleccionaram-se aleatoriamente 70 indivíduos com a variante B da mesma doença. Os

valores da análise para estes 70 indivíduos estão registados seguidamente.

VALORES 23 24 26 28 30 31 32 33 34 36 38

N.º indivíduos 1 2 3 6 15 20 13 4 3 2 1

Pode-se admitir que a distribuição dos valores da análise é a mesma para as duas

variantes da doença? Servirá esta análise como meio de diagnostico da variante A ou B

desta doença? (Use α=0.01)




5

Variante A: VALORES 20 22 23 26 29 30 31 33 34

N.º indivíduos 2 3 9 12 27 16 7 2 2 Freq. acumuladas 2 5 14 26 53 69 76 78 80

SA(x) 2/80 5/80 14/80 26/80 53/80 69/80 76/80 78/80 1 Variante B:

VALORES 23 24 26 28 30 31 32 33 34 36 38

N.º indivíduos 1 2 3 6 15 20 13 4 3 2 1

Freq. acumuladas 1 3 6 12 27 47 60 64 67 69 70 SB(x) 1/70 3/70 6/70 12/70 27/70 47/70 60/70 64/70 67/70 69/70 1




6

Cálculo do valor observado da estatística de teste:

Valores 20 22 23 24 26 28 29 30 31 32 33 34 36 38

SA(x) 2/80 5/80 14/80 14/80 26/80 26/80 53/80 69/80 76/80 76/80 78/80 1 1 1 SB(x) 0 0 1/70 3/70 6/70 12/70 12/70 27/70 47/70 60/70 64/70 67/70 69/70 1

|SA(x)- SB(x)| 0,025 0,063 0,161 0,132 0,239 0,154 0,491 0,477 0,279 0,093 0,061 0,043 0,014 0

O valor observado da estatística de teste é então D’obs=0.491.

Para α=0.01, o ponto crítico é (consulte tabela): 267.07080708063.1 =

×+ .




7

Dado que o valor observado da estatística de teste é 0.491>0.267, então

rejeita-se a hipótese nula de as duas variantes da doença não se distinguirem

quanto à distribuição dos valores da análise. Há portanto evidência estatística, ao

nível de significância de 0.01, de que os valores da análise de distribuem de

forma diferente na variante A e B da doença.


TESTES DE HIPÓTESES NÃO PARAMÉTRICOS Teste de Kruskal_Wallis


1

TESTE DE KRUSKAL-WALLIS

Objectivo: Dadas k populações nas quais se estuda uma característica comum e de onde

foram extraídas k amostras aleatórias e independentes, pretende-se testar a

hipótese H0 de que as distribuições populacionais são idênticas, isto é, as k

amostras podem ser consideradas como provenientes de populações com a

mesma distribuição.

Nota: O teste de Krukal-Wallis constitui uma alternativa à análise de variância com um

factor, a ser abordada mais tarde, quando os pressupostos desta não podem ser

verificados.




2


H0: As k amostras são retiradas de populações com a mesma distribuição

H1: As k amostras não são retiradas de populações com a mesma distribuição,

isto é, há pelo menos duas populações com distribuições diferentes

O teste de Kruskal-Wallis é particularmente sensível a diferenças nas medidas

de localização.

Por esta razão as hipóteses são geralmente formuladas em termos das médias

ou das medianas populacionais.




3

Notação: µi média da i-ésima população

Mi mediana da i-ésima população

H0: µ1=µ2=…=µk (as médias populacionais são iguais para as k populações)

H1: µi≠µj , i≠j (há pelo menos duas populações com médias diferentes)

H0: M1=M2=…=Mk (as k medianas populacionais são iguais)

H1: Mi=Mj , i≠j (há pelo menos duas populações com medianas diferentes)




4

Notação: ni - o tamanho da amostra retirada da população i (i=1,...k);

N =∑=

k

iin

1- nº total de observações;

Xij - a j-ésima observação da amostra da população i.

Procedimento: ordenam-se todas as observações por ordem crescente dos seus valores;

atribui-se um nº de ordem, ou posto, Rij, a cada observação Xij (a

observação mais pequena fica com o nº de ordem, ou posto, 1 e a observação

maior com o posto N);

para cada população i determina-se o valor Ri da soma dos postos das

observações correspondentes a esse grupo populacional: ∑=

=in

1jiji RR




5

Quando há empates nos valores observados, o número de ordem, ou posto,

que deve ser atribuído a cada valor empatado deve ser a média dos números de

ordem que seriam atribuídos a estes valores se não estivessem empatados. Por

exemplo, suponhamos que ordenando os valores observados obtínhamos

100, 102, 102, 102, 102.5, 103, 103, 104.

Neste caso, os números de ordem seriam respectivamente,

1, 3, 3, 3, 5, 6.5, 6.5, 8.




6

Quando não há empates nos valores observados das amostras, ou o nº de empates é muito pequeno, a estatística de teste é:

H= )1N(3nR

)1N(N12 k

1i i

2i +−

+∑=

A hipótese nula deve ser rejeitada se o valor observado da estatística H for

muito grande, i.e., superior ao ponto crítico (teste unilateral à direita).

Pontos críticos:

o Se k=3 e ni≤5 para todo i=1,...,k, consultar tabela da distribuição exacta da estatística H, sob H0.

o Se ni≥5 para todo i=1,...,k, sob H0, H tem aproximadamente distribuição 2

1−kχ ; consultar tabela desta distribuição.




7

Quando há muitos empates nos valores observados das amostras a

estatística de teste a usar deve ser:

H'= ⎥⎦

⎤⎢⎣

⎡ +−∑

= 4)1N(N

nR

S1 2k

1i i

2i

2

onde,

⎥⎦

⎤⎢⎣

⎡ +−−

= ∑∑= = 4

)1N(NR1N

1S2k

1i

n

1j

2ij

2 i

Pontos críticos:

o Se ni≥5 para todo i=1,...,k, sob H0, H’ tem aproximadamente distribuição 2

1−kχ ; consultar tabela desta distribuição.




8

Exemplo: Para avaliar o mérito de três métodos de ensino diferentes, cada um de 14

estudantes foi aleatoriamente matriculado em uma de três turmas. Em cada turma

utilizou-se um método de ensino diferente. Após algumas aulas, pediu-se a cada

estudante que resolvesse o mesmo problema. Os tempos respectivos (em minutos)

constam do quadro seguinte.

Método 1 Método 2 Método 3 15 21 11 12 16 19 18 13 17 20 9 22 10 24

Será possível afirmar que os métodos de ensino produzem resultados diferentes no que

diz respeito à rapidez de um aluno para resolver um problema? (Use α=0.05)




9

Ordenam-se as observações, registando o grupo (mét. ensino) a que

pertencem, e determina-se o posto de cada uma:

Observação 9 10 11 12 13 15 16 17 18 19 20 21 22 24

Posto - Rij 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Grupo (mét.) 2 1 3 1 2 1 2 3 1 3 1 2 3 3

R1=2+4+6+9+11=32

R2=1+5+7+12=25

R3=3+8+10+13+14=48




10

Não havendo empates, a estatística de teste é H= )1N(3nR

)1N(N12 k

1i i

2i +−

+∑=

cujo

valor observado é: Hobs= =+−⎟⎟⎠

⎞⎜⎜⎝

⎛++

+)114(3

548

425

532

)114(1412 222

1.963.

Consultando a tabela da distribuição exacta de H, sob H0, retira-se o ponto

crítico para α=0.05: 5.6429.

Dado que Hobs=1.963<5.6429, não se rejeita a hipótese nula dos três métodos

de ensino produzirem efeitos idênticos. Por outras palavras, não há evidência

estatística de que o tipo de método de ensino influencie o desempenho dos

estudantes na resolução de problemas.




11

Testes de Comparações múltiplas

Quando rejeitamos a hipótese H0, surge a questão de identificar onde se

encontram as diferenças, i.e., quais são as amostras onde se encontram

diferenças significativas.

Para isso temos de comparar cada par de amostras da seguinte maneira:

para cada amostra, calcula-se o posto médio iR , dividindo a soma dos

postos Ri pelo tamanho da amostra ni;

Determinam-se as diferenças absolutas entre cada par de postos médios

ji RR − , i,j=1,…,k




12

Cada diferença absoluta ji RR − é comparada com o valor crítico

⎟⎟⎠

⎞⎜⎜⎝

⎛+⎟

⎠⎞

⎜⎝⎛ +

χ= −αji

21k,ij n

1n1

12)1N(Nc

onde, 21k, −αχ é o ponto crítico usado para o teste de Kruskal-Wallis.

Se ijji cRR >− , então, considera-se significativa a diferença entre as

amostras i e j, havendo, portanto, evidência de existirem diferenças entre

as populações de onde se extraíram estas amostras.

4. Testes não Paramétricos

Documents