Regressão Múltipla para Dados Repetidos Análise Multivariada Aplicada as Ciências Agrárias Universidade Federal Rural do Rio de Janeiro CPGA-Solos Carlos Alberto Alves Varella Novembro-2006
Regressão Múltipla para Dados Repetidos
Análise Multivariada Aplicada as Ciências Agrárias
Universidade Federal Rural do Rio de JaneiroCPGA-Solos
Carlos Alberto Alves VarellaNovembro-2006
Introdução
• Quando temos duas ou mais respostas para o mesmo tratamento;
• SQTratamentos é decomposto em SQregressão e SQFalta de ajustamento;
• O ajuste do modelo é avaliado pelo teste para falta de ajustamento.
Regressão Linear Múltipla para Dados com Repetição
Tratamentos (X)
Repetições (Y) Total de tratamentos
Média de tratamentos
1 2
2 5 5 10 5,0
4 5 7 12 6,0
6 7 8 15 7,5
8 8 9 17 8,5
10 9 12 21 10,5
Análise de variância da regressão com o teste para falta de ajustamento
• Exemplo para dados de um delineamento experimental inteiramente casualizado. Tratamentos são 5 níveis de uma mesma variável.
iYiT
Regressão Linear Múltipla para Dados com Repetição
N=número de observações = 10; n=número de tratamentos = 5;r=número de repetições; G=total de observações=75.
Obtenção da variância residual ou erro puro• A variância residual é obtida por ANOVA;• O modelo estatístico para delineamento
inteiramente causalizado é:
Regressão Linear Múltipla para Dados com Repetição
.
;
;
;
puroerroresíduoe
tratamentodeefeitot
stratamentodemédia
respostaY
ij
i
ij
ijiij etY
ANOVA para delineamento inteiramente casualizado
Regressão Linear Múltipla para Dados com Repetição
F.V. G.L. S.Q. Q.M.
Tratamentos 4 37,00
Resíduo 5 7,50 1,50
Total 9 44,50
50,441075
125,2
22
2
1
,
2
N
YcsendocYSQTotal
N
ii
ji ij
00,371075
211210211 2
222
1
2
cTr
tosSQTratamenn
ii
50,700,3750,44 SQTratSQTotalSQR
.550,155,7
ˆ 22 glncomsQMR e
Neste caso não tem sentido aplicar o teste F
• O teste F tem como hipótese nula a igualdade das médias de fatores da variação;
• De fato o que estamos analisando são níveis de um mesmo fator, então só temos um fator e não tem sentido a aplicação do teste F;
• A estatística utilizada para avaliar o efeito de níveis de um mesmo fator quantitativo é a análise de variância da regressão.
Regressão Linear Múltipla para Dados com Repetição
É preciso conhecer o fenômeno para depois modelar, ou melhor, tentar
imitar o mundo real.• Neste caso estamos usando dois
modelos: ANOVA e REGRESSÃO
Regressão Linear Múltipla para Dados com Repetição
ijiij etY
iii eXY 10
• Cada valor distinto de X é considerado com um diferente tratamento.
• Neste caso, usado apenas para obter o erro puro=variância residual da estimativa.
• Cada valor distinto de X é considerado com um diferente valor de X.
• De fato é o que ocorre no mundo real. • Este é o modelo que devemos usar para avaliar o efeito da
variação de X sobre o fenômeno.
Podemos adotar 3 estratégias diferentes para a análise da regressão1. Utilizando as observações individualizadas2. Utilizando os totais de tratamentos3. Utilizando a média de tratamentos
• A estratégia utilizada não altera o resultado da análise;A equação de regressão será a mesma, isto é, mesmo intercepto e mesmos regressores.
Regressão Linear Múltipla para Dados com Repetição
Primeiro caso: utilizando as observações individualizadas
1
0
ˆ
ˆˆ,
504
75',
44060
6010',
101
101
81
81
61
61
41
41
21
21
,
12
9
9
8
8
7
7
5
5
5
YXXXXY
ii XY 675,045,3ˆ
Regressão Linear Múltipla para Dados com Repetição
675,0
45,3
504
75
1060
60440
8001ˆ
''ˆ'ˆ' 1
YXXXYXXX
Segundo caso: utilizando os totais de tratamentos
1
0
ˆ
ˆˆ,
504
75',
22030
305',
101
81
61
41
21
,
21
17
15
12
10
YXXXXY
ii XY 675,045,3ˆ
Regressão Linear Múltipla para Dados com Repetição
675,0
45,3
504
75
530
30220
2001
21ˆ
''1ˆ'ˆ' 1
YXXXr
YXXXr
675,0
45,3
252
5,37
530
30220
2001ˆ
''ˆ'ˆ' 1
YXXXYXXX
Terceiro caso: utilizando a média de tratamentos
1
0
ˆ
ˆˆ,
252
5,37',
22030
305',
101
81
61
41
21
,
51,10
5,8
5,7
0,6
0,5
YXXXXY
ii XY 675,045,3ˆ
Regressão Linear Múltipla para Dados com Repetição
Seleção de modelos de regressão utilizando o teste F para falta de ajustamento
Regressão Linear Múltipla para Dados com Repetição
regressão
falta deajustamento
erro puro
F
modelo podeser selecionado
ns
*modelo
inadequado
F
modeloinadequado
ns
*modelo pode
ser selecionado
MODELO
Análise de variância da regressão com o teste para falta de ajustamento: observações individualizadas
55,02750,02ˆ.
05,895,598607''ˆ'
45,3650,56295,59850,562504
75675,045,3''ˆ
50,4450,562607'
2
1
I
iii YYroajustamentdeSQfalta
YXYYoSQregressãSQtotalregressãodaSQresíduo
cyXoSQregressã
cYYSQtotal
Regressão Linear Múltipla para Dados com Repetição
Cálculo da soma de quadrados para a falta de ajustamento
2 5 4,8 0,20 0,0400
4 6 6,15 -0,15 0,0225
6 7,5 7,50 0,00 0,0000
8 8,5 8,85 -0,35 0,1225
10 10,5 10,20 0,30 0,0900
0,00 0,2750
iX iY iY ii YY ˆ 2ii YY
Resultado da análise de variância da regressão com o teste para falta de ajustamento
**= p<0,01; n.s=p>0,05
Regressão Linear Múltipla para Dados com Repetição
FV GL SQ QM F
Regressão 1 36,45 36,45 24,30**
Resíduo da regressão
8 8,05 1,00
Falta de ajustamento
3 0,55 0,18 0,12ns
Resíduo 5 7,50 1,50
Total 9 44,50