An´ alise de Variˆ ancia com mais de duas vari´ aveis independentes (mais de dois fa- tores) Na aula do dia 17 de outubro (aula #08) in- troduzimos a t´ ecnica de An´ alise de variˆ ancia (ANOVA) a um fator, que resulta num teste F cuja hip´ otese nula ´ e a igualdade das m´ edias para a condi¸ c˜ oes diferentes (vari´ avel indepen- dente). As suposi¸ c˜ oes s˜ ao de que a vari´ avel resposta (dependente) tem distribui¸c˜ ao nor- mal e as variˆ ancias s˜ ao iguais sob as diferentes condi¸ c˜ oes. Podemos ter amostras independentes (expe- rimento entre participantes ou como chama- mos em estat´ ıstica: experimento completamen- te aleatorizado) ou amostras relacionadas (ex- perimento intraparticipantes ou como chama- mos em estat´ ıstica experimentos em blocos completos aleatorizados). 1
47
Embed
An alise de Vari^ancia com mais de duas tores) · 2013-11-08 · An alise de Vari^ancia com mais de duas vari aveis independentes (mais de dois fa-tores) Na aula do dia 17 de outubro
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Na ANOVA a um fator a hipotese nula e dadapor{H0 : µ1 = µ2 = ... = µaH1 : pelo menos uma das medias e diferente das demais
µj corresponde a media do j-esimo grupo.
Variancia entre grupos: corresponde a variacaodevida as condicoes que definem os grupos.
Variancia intra-grupos: corresponde a variacaodentro de cada grupo.
Na ANOVA a um fator com amostras inde-pendentes a variacao total e decomposta emduas parcelas correspondentes a variacao entregrupos e a variacao intra-grupos.
SQTot︸ ︷︷ ︸variacao total
= SQentre︸ ︷︷ ︸variacao entre grupos
+ SQdentro︸ ︷︷ ︸variacao dentro dos grupos
Se a hipotese nula de que todas as medias sao iguais,isto e, de que nao ha variacao entre grupos, e ver-dadeira, segue que a variacao dentro dos grupos tendea ser igual a variacao total.
3
Notacao: SQTot: variacao total, SQentre: va-riacao entre grupos e SQdentro: variacao intragrupos.
QMTot =SQTotN − 1
: e uma media da variacao to-
tal.
N = n1 + n2 + ... + na e o numero total deobservacoes no problema. Se nj = n para todoj, teremos N = an.
QMentre =SQentre
a− 1: e uma media da variacao
entre grupos, chamada quadrado medio entregrupos.
a e o numero de grupos (condicoes) no pro-blema.
QMdentro =SQdentroN − a
: e uma media da variacao
intra grupos, chamada quadrado medio intragrupos ou quadrado medio residual.
esima condicao, i = 1,2, ..., n e j = 1,2, ..., a.
8
Na ANOVA a um fator com amostras rela-
cionadas a variacao total e decomposta em
tres parcelas correspondentes a variacao entre
grupos, a variacao inerente a cada participante
(variacao dos blocos) e a variacao residual.
SQTot︸ ︷︷ ︸variacao total
= SQentre︸ ︷︷ ︸variacao entre grupos
+ SQBl︸ ︷︷ ︸variacao do indivıduo
+ SQres︸ ︷︷ ︸variacao residual
Notacao: SQTot: variacao total, SQentre: va-
riacao entre grupos, SQBl - variacao nos blo-
cos (individual) e SQdentro: variacao residual
(dentro de cada grupo).
QMTot =SQTotN − 1
: e uma media da variacao to-
tal.
N e o numero total de observacoes no pro-
blema.
9
QMentre =SQentre
a− 1: e uma media da variacao
entre grupos, chamada quadrado medio entre
grupos.
a e o numero de grupos (condicoes) no pro-
blema.
QMBl =SQBln− 1
: e uma media da variacao dos
blocos, chamada quadrado medio dos blocos.
n e o numero de observacoes (igual) sob cada
condicao.
QMdentro =SQdentro
(a− 1)(n− 1): e uma media da
variacao residual, chamada quadrado medio re-
sidual ou intra grupos.
10
A estatıstica do teste realizado pela ANOVAnesse caso e dada pela razao dos quadradosmedios entre grupos e residual, a saber,
F =QMentre
QMdentro.
Se a hipotese nula e verdadeira, e possıvel mos-trar que a estatıstica F tem uma distribuicaoF de Snedecor com a − 1 e (a − 1)(n − 1)graus de liberdade no numerador e denomi-nador, respectivamente. Observe que apesarda aparencia da estatıstica F ser a igual emambos os casos, o calculo de QMDentro e dife-rente em ambos os casos.
Se a hipotese nula e verdadeira, espera-se quea razao entre os quadrados medios entre e den-tro dos grupos seja pequena. Em geral, re-jeitaremos H0 quando os valores amostrais deF forem grandes.
11
A tabela ANOVA correspondente a esse caso
e dada por
fonte devariacao SQ gl QM F
entregrupos SQentre a− 1 QMentre F = QMentre
QMdentro
blocos(individual) SQBl n− 1 QMBl
dentro dosgrupos
(residual) SQdentro (a− 1)(n− 1) QMdentro
total SQTot N − 1
QMentre =SQentre
a− 1, QMDentro =
SQdentro
(a− 1)(n− 1)
Se o valor de F for grande, H0 sera rejeitada.
O Bioestat tem essa funcao.
Estatısticas, Analise da Variancia, ANOVA: dois criterios.
12
Cuidado: toda vez que as medidas forem re-
petidas para as mesmas unidades amostrais e
fundamental rodar a ANOVA adequada, pois,
caso contrario, a variacao dentro dos grupos
podera ficar inflacionada acarretando na nao
rejeicao de H0 um maior numero de vezes por
conta da variacao residual inflacionada, ou seja,
aumentando a chance de cometer o erro tipo
II.
Se as amostras forem relacionadas, ou seja, se
for um experimento intra-participantes, rode o
a ANOVA adequada. No Bioestat isso corre-
sponde a rodar o caso ANOVA a dois criterios.
13
Na aula de hoje veremos uma extensao da A-
NOVA: ANOVA com mais de um fator (mais
de uma variavel independente) nas seguintes
situacoes:
(S1) dois fatores inter participantes (experi-
mento completamente aleatorizado);
(S2) dois fatores intra participantes (experi-
mento em blocos completos aleatorizado);
(S3) dois fatores um inter e um intra partici-
pantes. (experimento hierarquico a dois esta-
gios).
O mais importante aqui e o princıpio por tras
de cada uma dessas situacoes que e a decom-
posicao da variacao total dos dados em parce-
las devidas a cada um dos fatores e possıveis
interacoes entre fatores mais a variacao que
sobre chamada variacao residual.
14
Todas as situacoes levarao a uma tabela ANO-
VA similar as ja estudadas na aula #08, in-
cluindo mais linhas na tabela devido a presenca
de mais fontes de variacao.
Vamos comecar com o caso em que ha duas
variaveis independentes A e B e as amostras
sao independentes sob cada condicao do ex-
perimento. Se a variavel A admite a nıveis e,
a B admite b nıveis, teremos ao todo ab com-
binacoes de nıveis de tratamento.
15
Veja na figura a seguir, como e o planejamento
de uma situacao como essa na qual as variaveis
independentes tem duas respostas cada.
Observe que para cada combinacao de condicoes,
os grupos investigados sao independentes.
16
Na situacao mais simples temos a = 2 e b = 2
tal que o numero de combinacoes possıveis e
2 × 2 = 4.
Veja o exemplo a seguir.
EXEMPLO 1: Os dados a seguir referem a
notas finais para cada participante em quatro
condicoes distintas: revisao na sala de estar
ou na sala do exame, exame na sala de estar
ou na sala do exame. Suponha que os quatro
grupos seja independentes (experimento inter-
participantes).
A - sala do exame: estar ou de exame
B - sala da revisao: estar ou de exame
Variavel observada: desempenho final na avaliacao
apos o processo de revisao.
17
18
Nesse primeiro momento vamos supor que tem-
se 4 grupos diferentes de 20 participantes: ao
todo N = 80 participantes distribuıdos aleato-
riamente em 4 grupos de 20.
A variacao total SQTot aqui sera decomposta
em 4 parcelas, a saber, SQA - variacao devido
a sala do exame, SQB - variacao devido a sala
da revisao, SQAB - variacao devido a uma in-
teracao entre sala do exame e sala da revisao
e, SQRes - variacao residual.
SQTot︸ ︷︷ ︸N−1=abn−1
= SQA︸︷︷︸a−1
+SQB︸ ︷︷ ︸b−1
+ SQAB︸ ︷︷ ︸(a−1)(b−1)
+ SQRes︸ ︷︷ ︸ab(n−1)
19
A tabela ANOVA contera as linhas de variacao
devido ao fator A, ao fator B, ao fator de in-
teracao AB mais a variacao residual, que jun-
tas dao a variacao total.
fonte devariacao SQ gl QM F
A SQA a− 1 QMA FA = QMA
QMRes
B SQB b− 1 QMB FB = QMB
QMRes
AB SQAB (a− 1)(b− 1) QMAB FAB = QMAB
QMRes
Residual SQRes ab(n− 1) QMRes
total SQTot abn− 1
n e o numero de observacoes sob cada combinacao denıveis dos fatores (variaveis independentes).
No exemplo sob investigacao n = 20, a = b = 2, asvariaveis independentes sao sala do exame(estar ou ex-ame) e sala da revisao (estar ou exame).
A variavel dependente e o desempenho (nota) do exame.
20
As hipoteses de interesse aqui sao investigar
se os fatores A (sala do exame), B (sala da
revisao) e de interacao AB sala do exame com
sala de revisao exercem algum efeito sobre a
media do desempenho. Nos testes da ANOVA
nesse caso, a hipotese nula e a de que esses
fatores nao exercem nenhum efeito sobre a
media, contra a alternativa de que exercem al-
gum efeito.
Sob H0 as estatısticas de teste seguem uma
distribuicao F com os seguintes graus de liber-
dade
FA ∼ Fa−1,ab(n−1),
FB ∼ Fb−1,ab(n−1) e
FAB ∼ F (a− 1)(b− 1), abn(n− 1).
21
Rejeitaremos a hipotese nula de ausencia de
efeito sobre a media em relacao a cada fator
se o valor amostral da estatıstica de teste for
grande.
Vamos ver como realizar essa ANOVA usando
o Bioestat.
Estatısticas, ANOVA fatorial a× b.
Nesse caso, o Bioestat demanda que entremos
com os dados de forma isolada conforme a tela
a seguir.
22
Observe que nessa entrada de dados os trata-
mentos correspondem ao tipo de sala do exame
e os blocos correspondem ao tipo de sala da
revisao.
tratamento 1: sala do exame em sala de es-
tar, tratamento 2: sala do exame em sala do
exame.
Bloco A: sala da revisao em sala de estar,
Bloco B: sala da revisao em sala do exame.23
O resultado obtido esta na tela a seguir.
Da saıda do Bioestat, verificamos que ao nıvel
de significancia de 5%, os efeitos de sala da re-
visao (blocos) e de interacao de sala da revisao
com sala de exame sao significativos.
24
Para interpretar os efeitos dos fatores sobrea media, um grafico de medias e sempre util.A seguir apresentamos graficos ilustrando osefeitos principais de sala do exame (que foinao significativo) e de sala de revisao. Observeque as medias sao calculadas com base nas 40 notas sob cada nıveldo fator principal.
25
Para entender melhor o efeito de interacao quefoi significativo para esses dados, observe ografico de medias a seguir. Agora as mediasforam calculadas com base nos 4 grupos de 20,sob as diferentes combinacoes dos nıveis dosfatores.
Percebe-se que se o exame foi feito na sala doexame, a media parece sofrer um efeito posi-tivo quando a revisao e feita tambem na salado exame; ao passo que se o exame e feito nasala de estar, a media parece sofrer um efeitonegativo se a revisao e feita na sala do exame.