ANÁLISE DE MEDIDAS REPETIDAS NO TEMPO USANDO O SAS Euclides Braga MALHEIROS * Medidas repetidas no tempo ou espaço: medidas tomadas em uma seqüência de tempos ou espaços, em uma mesma unidade experimental. Os experimentos com medidas repetidas no tempo envolvem geralmente, além de possíveis fatores de controle local, 2 fatores: tratamentos e tempos, e são freqüentes em experimentos com animais, plantas, humanos, etc. O objetivo principal desse tipo de experimento é examinar e comparar as tendências dos tratamentos ao longo do tempo. Isto pode envolver comparações entre tratamentos dentro de cada tempo, ou comparações de tempos dentro de cada tratamento. Exemplo1: Cinco variedades de uma cultura (tratamentos), com 3 repetições, avaliadas ao longo do tempo (0, 30, 60, 90, 120 e 150 dias), em um experimento Inteiramente Casualizado. Os dados observados são apresentados na Tabela 1. Tabela 1. Dados de açúcar na cana, (pol%), obtidos em um DIC com 5 variedades de cana, 3 repetições, observados em 6 tempos de desenvolvimento da cultura. Variedades Rep. Tempo em dias 0 30 60 90 120 150 V1 1 11,82 14,86 13,84 15,53 15,49 15,82 2 12,07 14,44 13,92 15,47 16,34 18,64 3 12,45 14,18 13,76 14,35 15,93 16,52 V2 1 12,47 15,19 15,02 15,54 18,53 15,76 2 11,07 13,38 14,61 14,07 17,84 16,91 3 10,66 14,22 13,54 15,93 15,94 16,81 V3 1 12,92 14,49 13,40 13,68 16,26 14,78 2 10,29 14,42 14,62 15,84 16,29 15,62 3 12,83 13,92 15,69 15,12 14,91 17,22 V4 1 11,96 14,71 14,98 15,25 16,21 15,53 * Departamento de Ciências Exatas – FCAV/UNESP, Campus de Jaboticabal. 14870-000 Jaboticabal SP
27
Embed
ANÁLISE DE MEDIDAS REPETIDAS NO TEMPOjaguar.fcav.unesp.br/euclides/AL_2011/S_MRT/Sem_MRTf.doc · Web view... 1,11 0,98 0,78 1 4 0,08 0,17 0,97 1,11 1,70 0,92 0,74 2 1 0,13 0,36 0,89
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
ANÁLISE DE MEDIDAS REPETIDAS NO TEMPO USANDO O SAS
Euclides Braga MALHEIROS*
Medidas repetidas no tempo ou espaço: medidas tomadas em uma seqüência de tempos ou espaços, em uma mesma unidade experimental. Os experimentos com medidas repetidas no tempo envolvem geralmente, além de possíveis fatores de controle local, 2 fatores: tratamentos e tempos, e são freqüentes em experimentos com animais, plantas, humanos, etc. O objetivo principal desse tipo de experimento é examinar e comparar as tendências dos tratamentos ao longo do tempo. Isto pode envolver comparações entre tratamentos dentro de cada tempo, ou comparações de tempos dentro de cada tratamento.
Exemplo1:Cinco variedades de uma cultura (tratamentos), com 3 repetições, avaliadas ao longo do tempo (0, 30, 60, 90, 120 e 150 dias), em um experimento Inteiramente Casualizado.Os dados observados são apresentados na Tabela 1.
Tabela 1. Dados de açúcar na cana, (pol%), obtidos em um DIC com 5 variedades de cana, 3 repetições, observados em 6 tempos de desenvolvimento da cultura.
1. Análise como parcelas subdivididas.Na literatura, encontram-se muitas abordagens para analisar dados em medidas repetidas (no tempo ou no espaço). Um procedimento comum é analisar os dados como se fosse um
* Departamento de Ciências Exatas – FCAV/UNESP, Campus de Jaboticabal. 14870-000 Jaboticabal SP
experimento em Parcelas Subdivididas. O problema é que no delineamento em parcelas subdivididas pressupõe-se que a matriz de covariâncias entre as subparcelas seja do “Tipo 2I”, devido a casualização das mesmas dentro das parcelas, o que não ocorre em ensaios com medidas repetidas. Isso resulta muitas vezes em testes F incorretos na Análise da Variância. Veja Anexo 1.
Pelo Anexo, a matriz de variâncias e covariâncias entre tempos é:
= ,
onde i2 é a variância no tempo i, e ij é a covariância entre os tempos i e j. Na estrutura
homogênea i2=2 , i e ij=, ij.
Essa estrutura não é a esperada para dados com medidas repetidas no tempo, o que faz com que os testes F correspondentes a Tempo e interação Tempo x Trat podem não serem exatos. O que se encontra na literatura é que as medidas repetidas em uma mesma unidade experimental (animal, plantas ou humanos) são correlacionadas e que medidas em tempos mais próximos apresentam correlações mais altas que em tempos mais distantes. Uma estrutura que tem sido estudada é a autoregressiva.Segundo Huynh & Feldt (1970) uma condição necessária e suficiente para que os testes F sejam exatos, é que a matriz satisfaça a condição de esfericidade (ou circularidade), ou seja, que satisfaça a condição:
,
onde é a diferença entre as médias das variâncias e as medias das covariâncias.Esta condição, denominada condição H-F ou condição de esfericidade (ou circularidade) da matriz , eqüivale a especificar que as variâncias das diferenças entre pares de tempos sejam todas iguais, ou seja:
.Para exemplificar, verifique se a matriz abaixo satisfaz a condição de esfericidade:
Observe que : ; ; e assim por diante.
Logo a matriz satisfaz a condição de esfericidade.
Em 1984 o comando REPEATED foi incluído no PROC GLM do SAS, onde o teste de esfericidade , teste de Murchly, é realizado.
2
Teste de Esfericidade da matriz usando o comando REPEATED do PROC GLM.Este comando do SAS exige que os Dados estejam na forma Multivariada (ver Anexo 2).
Uma das possíveis <opções 1> é: DATA=<SDS> - especifica o SAS-DATA-SET a ser usado.
Uma das possíveis <opções 2> é: NOUNI – não executa as análises unidimensionais, dentro de cada tempo.
Alguns dos possíveis <tipos de contrastes> são: CONTRAST [(nível referencial)] – gera contrastes entre cada nível do fator tempo
com o nível referencial. Quando o nível referencial não for especificado, considera o último.
POLYNOMIAL – gera contrastes de polinômios ortogonais para os níveis do fator tempo.
HELMERT – gera contrastes entre cada nível do fator tempo com a média dos subsequentes.
MEAN (nível referencial) – gera contrastes entre o cada nível (exceto o referencial) com a média dos outros.
PROFILE – gera contrastes entre níveis adjacentes do fator tempo.
A colocação dos níveis do fator tempo é opcional se forem equidistantes e necessário se não forem.
Algumas das <opções 3> são: CANONICAL – executa uma análise canônica das matrizes H e E. HTYPE=n – especifica o tipo da soma de quadrados a ser usado. NOM – Não executa a análise multivariada. NOUNI – Não executa as análises univariadas. PRINT|E|H|M|V – Imprime a matriz especificada:
E - matriz da soma de quadrados dos produtos cruzados para erros. Com a opção PRINTE o SAS apresenta o teste de esfericidade da matriz de covariâncias.
H - matriz da soma de quadrados dos produtos cruzados (SS&CP) para a Hipótese.M - matriz dos contrates.V - matriz dos auto-valores e auto-vetores associada ao teste.
SUMMARY – apresenta a tabela da análise da variância dos contrastes para o fator tempo.
Exercício 1 – (PROG1.SAS)
3
Fazer um programa SAS para:a) Criar um SDS Importando o arquivo ASC II univariado (MRT1U.txt)b) Representar graficamente os perfis médios das variedades ao longo do tempo.c) Criar um SDS multivariado (MRT1M).d) Testar a esfericidade da matriz.e) Se a matriz for esférica realizar a análise da variância como parcelas subdivididas, caso
contrário crie um SDS permanente para MRT2U e MRT2M, para posterior análise.
PROGRAMA (Prog_1.SAS):/* EXEMPLO 1 - TESTE DA ESFERICIDADE DA MATRIZ*/OPTIONS LS=78 PS=64;DATA MRT1U;INFILE "C:\S_MRT\MRT1U.TXT";INPUT VR TP RP Y;PROC PRINT;RUN;
/* REPRESENTACAO GRAFICA - TENDENCIA DOS TRATAMENTOS AO LONGO DO TEMPO */OPTIONS LS=78 PS=64;PROC SORT DATA=MRT1U; BY VR TP; RUN;PROC MEANS MEAN NOPRINT;OUTPUT OUT=MRT1G MEAN=YG;BY VR TP;VAR Y;RUN;PROC PRINT DATA=MRT1G; RUN;PROC SORT DATA=MRT1G; BY TP VR;PROC GPLOT DATA=MRT1G;PLOT YG*TP=VR/LEGEND GRID HAXIS=0 TO 150 BY 30;SYMBOL1 COLOR=RED INTERPOL=JOIN VALUE=DOT;SYMBOL2 COLOR=BLUE INTERPOL=JOIN VALUE=DOT;SYMBOL3 COLOR=GREEN INTERPOL=JOIN VALUE=DOT;SYMBOL4 COLOR=BLACK INTERPOL=JOIN VALUE=DOT;SYMBOL5 COLOR=ORANGE INTERPOL=JOIN VALUE=DOT;TITLE HEIGHT=1.4 "TENDENCIA DOS TRAT. AO LONGO DO TEMPO";RUN;
/*CRIACAO DO SAS-DATA-SET MULTIVARIADO A PARTIR DO UNIVARIADO */PROC SORT DATA=MRT1U; BY VR RP;PROC TRANSPOSE OUT=MRT1M(RENAME=(_0=T1 _30=T2 _60=T3 _90=T4 _120=T5 _150=T6));BY VR RP;ID TP;RUN;PROC PRINT DATA=MRT1M;RUN;
/* Análise usando o comando REPEATED do PROC GLM */PROC GLM DATA=MRT1M;CLASS VR;MODEL T1-T6=VR/NOUNI;REPEATED TP 6 POLYNOMIAL/PRINTE SUMMARY;RUN;
O SAS apresenta 2 testes de esfericidade. O primeiro depende do tipo de contrastes solicitado e o segundo é válido para qualquer conjunto de contrastes ortogonais.Observa-se com esses resultados que a condição de esfericidade da matriz é rejeitada ao nível de 10% de probabilidade. Assim sendo os dados podem ser analisados como Parcelas subdivididas.
Exemplo 2:Dados de IAF de 5 genótipos de leguminosa, obtidos num experimento DBC com 4 blocos, avaliados em 7 épocas (dias) - apresentados na Tabela 2.
Exercício 2 – (Prog_2.SAS) Fazer um programa SAS para:a) Criar um SDS Importando o arquivo ASC II multivariado (MRT2M.txt).b) Criar um SDS uniivariado (MRT2U).c) Representar graficamente os perfis médios das variedades ao longo do tempo.d) Testar a esfericidade da matriz.e) Se a matriz for esférica realizar a análise da variância como parcelas subdivididas, caso
contrário crie um SDS permanente para MRT2U e MRT2M, para posterior análise.Tabela 2. Dados de IAF de 5 genótipos de leguminosa, obtidos num experimento DBC
com 4 blocos, avaliados em 7 épocas (dias)
5
Genótipo Bloco Número de dias88 104 120 137,5 153,5 181,5 209,5
PROGRAMA (Prog_2.SAS):/* EXEMPLO 2 - ANÁLISE DE DADOS EM MEDIDAS REPETIDAS NO TEMPO*//* DADOS NA FORMA MULTIVARIADA*/OPTIONS LS=78 PS=64;DATA MRT2M;INFILE "C:\S_MRT\MRT2M.TXT";INPUT GN BL T1-T7;PROC PRINT DATA=MRT2M;RUN;/* GERAR O SDS NA FORMA UNIVARIADA*/DATA MRT2U (KEEP=GN BL TP Y);SET MRT2M;TP=88; Y=T1; OUTPUT MRT2U;TP=104; Y=T2; OUTPUT MRT2U;TP=120; Y=T3; OUTPUT MRT2U;TP=137.5; Y=T4; OUTPUT MRT2U;TP=153.5; Y=T5; OUTPUT MRT2U;TP=181.5; Y=T6; OUTPUT MRT2U;TP=209.5; Y=T7; OUTPUT MRT2U;RUN;PROC PRINT DATA=MRT2U;RUN;
/* REPRESENTACAO GRAFICA - TENDENCIA DOS TRATAMENTOS AO LONGO DO TEMPO */PROC SORT DATA=MRT2U; BY GN TP; RUN;PROC MEANS MEAN NOPRINT;OUTPUT OUT=MRT2G MEAN=YG;BY GN TP;VAR Y; RUN;PROC PRINT DATA=MRT2G; RUN;PROC GPLOT DATA=MRT2G;
6
PLOT YG*TP=GN/LEGEND GRID;SYMBOL1 COLOR=RED INTERPOL=JOIN VALUE=DOT;SYMBOL2 COLOR=BLUE INTERPOL=JOIN VALUE=DOT;SYMBOL3 COLOR=GREEN INTERPOL=JOIN VALUE=DOT;SYMBOL4 COLOR=BLACK INTERPOL=JOIN VALUE=DOT;SYMBOL5 COLOR=ORANGE INTERPOL=JOIN VALUE=DOT;TITLE HEIGHT=1.4 "TENDENCIA DOS TRAT. AO LONGO DO TEMPO";RUN;
Observa-se com esses resultados que a condição de esfericidade da matriz é rejeitada, ao nível de 10% de probabilidade. Assim sendo os testes F da análise em parcelas subdivididas não são exatos.
2. Análise usando o PROC MIXED.
7
O PROC MIXED é um procedimento utilizado para modelos mistos que é uma generalização do modelo linear geral, separando no modelo os efeitos fixos dos aleatórios e é escrito como: y=X+Z+ onde é o vetor dos parâmetros associados aos efeitos fixos, aos efeitos aleatórios, e vetor de erros aleatórios, sendo e não correlacionados, com esperanças nulas e matrizes de covariâncias G e R, respectivamente. O PROC MIXED permite informar a estrutura da matriz (G), através do comando RANDOM, e a dos erros (R) ), através do comando REPEATED.
Para este tipo de análise os dados devem estar na forma univariada.
A sintaxe do PROC MIXED é:
PROC MIXED <opções1>;CLASS <var. de classif.>; MODEL <var. dep.>=<efeitos fixos> / <opções2>; RANDOM <efeitos aleatórios em G> / <opções3>;REPEATED <efeito repetido> / <opções4>;MAKE “<Tabela>” OUT=<SDS>;RUN;
Algumas das <opções 1> são: DATA=<SDS> - especifica o SAS-DATA-SET a ser usado. METHOD=<ML|REML|MIVQUE0> - especifica o método a ser usado para estimar
os componentes da variância.
Algumas das <opções 2> são: HTYPE =<n> - especifica o tipo da soma de quadrados.
O comando RANDOM especifica os efeitos aleatórios do modelo Uma das possíveis <opções3 > é: TYPE =<CS|AR(1)|SIMPLE|UN|....> - especifica a estrutura da matriz G (dos efeitos
aleatórios), dentro de uma lista de opções.
O comando REPEATED especifica a estrutura de erros. Não tem nada a ver com o REPEATED do PROC GLM. Uma das possíveis <opções4 > é:
TYPE =<CS|AR(1)|SIMPLE|UN|....> - especifica a estrutura da matriz E (dos erros), dentro de uma lista de opções.
SUB=<efeito> - especifica o efeito que identifica a unidade experimental. É assumida completa independência entre tais unidades, de tal forma que este comando produz uma estrutura bloco-diagonal em R com blocos idênticos.
R – solicita a impressão da primeira matriz bloco-diagonal de R. RCORR - solicita a impressão da matriz R.
O comando MAKE é usado para criar arquivos a partir de Tabelas do OUTPUT. Algumas das Tabelas do comando MAKE são:
8
FITTINGS - Tabela das estatísticas usadas na seleção do modelo. ML|REML|MIVQUE0 - Tabela das estimativas dos componentes da variância. TESTS – Testes de hipóteses associados aos efeitos fixos. Etc.
Os comandos CONTRAST, ESTIMATE e LSMEANS podem ser usadas da mesma forma do PROC GLM.
Como se viu até aqui a análise de medidas repetidas no tempo requer especial atenção na estrutura da matriz de variâncias e covariâncias. A análise de dados com medidas repetidas pelo PROC MIXED é feita em dois passos, ou sejam: 1) Avaliar a estrutura da matriz de covariâncias.2) Analisar a tendência dos tratamentos ao longo dos tempos.
Passo 1: Avaliação da estrutura da matriz de covariâncias para os dados do Exemplo 2.
Várias estruturas disponíveis no SAS podem ser avaliadas. Algumas delas são apresentadas a seguir:
Auto-Regr. 1ª ordem –AR(1) Auto-Regr. Harm. –ARH(1)
Composta Simétrica - CS Composta Sim. Harm – CSH
TOEP TOEPH
Desestruturada – UN Desestruturada – UN(1)
9
Como a apresentação aqui tem um objetivo mais didático, apenas 3 estruturas serão estudadas, ou sejam: Composta simétrica –CS; Auto regressiva de 1ª ordem – AR(1), Toeplitx - TOEP. É interessante observar que o número de parâmetros a serem estimados depende da estrutura. Para t tempos, na CS o número de parâmetros é 2, na AR(1) é 2 e na UN é t(t+1)/2.
Exercício 3Fazer um programa SAS para, a partir dos SDS referentes ao Exemplo 2, avaliar qual dessas três estruturas melhor representa a estrutura de covariâncias entre os tempos.
PROGRAMA (Prog_2a.SAS):* USO DO PROC MIXED PARA TRES ESTRUTURAS - CS, AR(1) E UN;OPTIONS LS=78 PS=64 PAGENO=1;LIBNAME PASTA "C:\S_MRT";DATA MRT2U; SET PASTA.MRT2U;PROC PRINT DATA=MRT2U; RUN;
* PROCEDIMENTOS PARA A ANALISE USANDO O PROC MIXED;PROC MIXED DATA=MRT2U;CLASS GN BL TP;MODEL Y=GN TP GN*TP;RANDOM BL;REPEATED TP/TYPE=CS SUB=GN*BL R RCORR;RUN;
PROC MIXED DATA=MRT2U;CLASS GN BL TP;MODEL Y=GN TP GN*TP;RANDOM BL;REPEATED TP/TYPE=AR(1) SUB=GN*BL R RCORR;RUN;
PROC MIXED DATA=MRT2U;CLASS GN BL TP;MODEL Y=GN TP GN*TP;RANDOM BL;REPEATED TP/TYPE=UN SUB=GN*BL R RCORR;RUN;
Dentre as diversas informações do output, a de interesse para a seleção da estrutura é a tabela dos critérios:
a) Para CS Fit Statistics -2 Res Log Likelihood 324.2 AIC (smaller is better) 330.2 AICC (smaller is better) 330.5
BIC (smaller is better) 328.4
10
b) Para AR(1)Fit Statistics
-2 Res Log Likelihood 315.9 AIC (smaller is better) 321.9 AICC (smaller is better) 322.2 BIC (smaller is better) 320.1
c) Para UN Fit Statistics -2 Res Log Likelihood 205.8 AIC (smaller is better) 263.8 AICC (smaller is better) 287.0 BIC (smaller is better) 246.0
Com esses resultados no output observa-se várias estatísticas usadas para a seleção da melhor estrutura da matriz de covariâncias, ou sejam:RLL – Res Log Likelihood - RLL, AIC – Akaike's Information CriterionAICC - Akaike's Information Criterion com correção e BIC – Schwarz's Bayesian Criterion.
Os critérios AIC e BIC são ajustes do RLL e são os mais usados na literatura.Quanto menor o valor dessas estatísticas, melhor a estrutura.
O que interessa na prática é obter uma Tabela na forma da Tabela 3.
Tabela – 2 Estatísticas utilizadas para a escolha da melhor estrutura para a matriz de variâncias e covariâncias dos tempos.
A partir desta Tabela concluímos que dentre as três estruturas avaliadas, a desestruturada (UN) é a mais apropriada, independente do critério utilizado.
Exercício 4. Fazer um programa SAS, usando Macro Subprograma (ver Anexo 3) e que crie uma Tabela com as estatísticas para seleção, para todas as estruturas utilizadas.
PROGRAMA (Programa PROG_2c.SAS):OPTIONS LS=78 PS=64 PAGENO=1;LIBNAME PASTA "C:\S_MRT";DATA MRT2U; SET PASTA.MRT2U;PROC PRINT DATA=MRT2U; RUN;
* MACRO COM A COMANDO MAKE PARA SALVAR OS RESULTADOS DE INTERESSE;%MACRO SIGMA(SDSE,EST,SDSS,VAL);PROC MIXED DATA=&SDSE;CLASS GN BL TP;MODEL Y=GN TP GN*TP;
11
RANDOM BL;REPEATED TP/TYPE=&EST SUB=GN*BL R RCORR;MAKE "FITTING" OUT=&SDSS(RENAME=(VALUE=&VAL));RUN;%MEND SIGMA;* CHAMANDO A MACRO PARA CADA ESTRUTURA;%SIGMA(MRT2U,CS,SDSCS,CS);%SIGMA(MRT2U,AR(1),SDSAR1,AR1);%SIGMA(MRT2U,UN,SDSUN,UN);PROC PRINT DATA=SDSCS;PROC PRINT DATA=SDSAR1;PROC PRINT DATA=SDSUN;RUN;
* JUNTANDO OS ARQUIVOS - TABELA DAS ESTATISTICAS;DATA RESULT;MERGE SDSCS SDSAR1 SDSUN;RUN;PROC PRINT DATA=RESULT;RUN;
Esse programa pode ser usado testando todas as estruturas disponíveis no SAS. Algumas das opções são:Estrutura Descrição ParâmetrosANTE(1) Ante-Dependence 2t-1AR(1) Autoregressive 2ARH(1) Heterogeneous Autoregressive t+1ARMA(1,1) ARMA(1,1) 3CS Compound Symmetric 2CSH Heterogeneous Compound Symmetric t+1FA(q) Factor Analytic q/2(2t-q+1)+tFA0(q) No Factor Analytic q/2(2t-q+1)HF Huynh-Feldt t+1LIN(q) General Linear qTOEP Toeplitz tTOEP(q) Banded Toeplitz qTOEPH Heterogeneous Toeplitz 2t-1TOEPH(q) Banded Heterogeneous Toeplitz t+q-1UN Unstructured t(t+1)/2UNAR(q) Banded q/2(2t-q+1)UNR Unstructured Corrs t(t+1)/2VC Variance Components q
Para apresentar mais informações sobre situações encontradas na prática, vamos fazer a análise completa do dados do Exemplo 3.
Exemplo 3: Dados de um experimento de degradação ruminal instalado num delineamento em quadrado latino 6x6 – 6 períodos, 6 animais e 6 tratamentos, avaliado em 10 tempos (3, 6,
12
12, 24, 48, 60, 72, 84, 96 e 120h). Foram avaliadas três variáveis dependentes (Y1=DEG, Y2=FDN e Y3=FDA).Os dados encontram-se no arquivo MRT3U.TXT.
Exercício 5. Fazer um programa SAS, usando macros apropriadas, para:a) Importar o arquivo MRT3U.TXT.b) Criar o SDS MRT3M.TXTc) Representar graficamente o perfil médio dos tratamentos ao longo do tempo.d) Testar a esfericidade da matriz de covariâncias.e) Analisar os dados usando metodologias apropriadas.
PROGRAMA (Prog_3.SAS):/* Análise DE DADOS DE MEDISDAS REPETIDAS - DQL - usando o PROC MIXED */OPTIONS LS=78 PS=64 PAGENO=1;
* IMPORTANDO O ARQUIVO UNI (AU) - ARQUIVO ASC;DATA AUC;INFILE "C:\S_MRT\MRT3U.TXT" FIRSTOBS=2;INPUT TP PR AN TR Y1-Y3;LABEL Y1="DEG" Y2="FDN" Y3="FDA";PROC PRINT;RUN;
%LET Y=Y1;DATA AU; SET AUC;KEEP TP PR AN TR &Y;PROC PRINT;
RUN;
* CRIANDO O SDS MULTI (AM);PROC SORT DATA=AU; BY PR AN TR;PROC TRANSPOSE OUT=AM(RENAME=(_3=T1 _6=T2 _12=T3 _24=T4 _48=T5 _60=T6 _72=T7 _84=T8 _96=T9 _120=T10));BY PR AN TR;ID TP;RUN;PROC PRINT DATA=AM;RUN;DATA AM; SET AM;KEEP AN PR TR T1-T10;PROC PRINT;RUN;
SYMBOL4 COLOR=BLACK INTERPOL=JOIN VALUE=DOT HEIGHT=0.5;SYMBOL5 COLOR=ORANGE INTERPOL=JOIN VALUE=DOT HEIGHT=0.5;SYMBOL6 COLOR=CYAN INTERPOL=JOIN VALUE=DOT HEIGHT=0.5;TITLE HEIGHT=1.4 C=BLUE "PERFIL DOS TRATAMENTOS AO LONGO DO TEMPO";RUN;
* TESTE DE ESFERICIDADE DA MATRIZ SIGMA;PROC GLM DATA=AM;CLASS PR AN TR ;MODEL T1-T10=PR AN TR/NOUNI;REPEATED TP 6 (3 6 12 24 48 60 72 84 96 120) POLYNOMIAL/PRINTE SUMMARY;RUN;
* ESCOLHA DA ESTRUTURA DE SIGMA;%MACRO E_SIGMA(SDSE,EST,SDSS,VAL);PROC MIXED DATA=&SDSE;CLASS PR AN TR TP;MODEL &Y=PR AN TR TP TR*TP/HTYPE=3 ;RANDOM AN PR;REPEATED TP/TYPE=&EST SUB=TR(PR AN) R RCORR;MAKE "FitStatistics" OUT=&SDSS(RENAME=(VALUE=&VAL));RUN;%MEND E_SIGMA;
DATA A; SET AU;PROC PRINT DATA=A; RUN;%E_SIGMA(A,ANTE(1),SDS_ANTE,V_ANTE);%E_SIGMA(A,AR(1),SDS_AR,V_AR);%E_SIGMA(A,ARH(1),SDS_ARH,V_ARH);%E_SIGMA(A,ARMA(1,1),SDS_ARMA,V_ARMA);%E_SIGMA(A,CS,SDS_CS,V_CS);%E_SIGMA(A,CSH,SDS_CSH,V_CSH);%E_SIGMA(A,FA0(1),SDS_FA0,V_FA0);%E_SIGMA(A,FA(1),SDS_FA1,V_FA1);%E_SIGMA(A,HF,SDS_HF,V_HF);%E_SIGMA(A,SIMPLE,SDS_SIMPLE,V_SIMPLE);%E_SIGMA(A,TOEP,SDS_TOEP,V_TOEP);%E_SIGMA(A,TOEPH,SDS_TOEPH,V_TOEPH);%E_SIGMA(A,UN,SDS_UN,V_UN);%E_SIGMA(A,UNAR,SDS_UNAR,V_UNAR);%E_SIGMA(A,UNCS,SDS_UNCS,V_UNCS);%E_SIGMA(A,UNR,SDS_UNR,V_UNR);%E_SIGMA(A,VC,SDS_VC,V_VC);RUN;
Observe que a melhor estrutura é a ANTE(1) (Ante-Dependence) e que as estruturas FAO, HF, UNAR e UNCS apresentaram problemas na convergência do método iterativo.
15
ANEXO 1
MEDIDAS REPETIDAS NO TEMPO - USANDO O PROC MIXED
Como são os vetores e matrizes do modelo: y=X+Z+ para os dados do exemplo:
y=X+Z+onde: é o vetor dos parâmetros associados aos efeitos fixos
aos efeitos aleatórios, e vetor de erros aleatórios, e não correlacionados, com esperanças nulas e matrizes de covariâncias G e R,
respectivamente
Tabela 1. Dados pol%. 5 variedades com 3 repetições em 6 tempos.Variedades Rep.
Vi , Tk e VTik são farores de efeitos fixos.Rj:i e Eijk são farores de efeitos aleatórios.
Rj:i N(0, ); Rj:i e Eijk são independentes mas Eijk não são
normalmente e independentemente distribuídos com média 0 e variância . = (, V1, V2, ..., V5, T1, T2, ... T6, VT11, VT12, … VT56)’ – dimensões 42x1,X tem dimensões 90x42 = (R1:1, R2:1, ..., R3:5) ’ – dimensões 15x1Z tem dimensões 90x15 tem dimensões 90x90 e é da forma:
16
ANEXO 2
ARQUIVOS SAS (SDS) NAS FORMAS:UNIVARIADA E MULTIVARIADA
No SAS, a maioria dos procedimentos usa o SDS na forma univariada, as colunas são as variáveis e as linhas os registros. Alguns como o PROC GLM com o comando REPEATED usa o SDS na forma multivariada (uma coluna para cada tempo). Para exemplificar apresentamos essas duas formas para os dados do Exemplo 1.
Dados na forma univariada: Variedade Tempo Repetição Y
O SAS permite vários tipos de macros, apresentaremos dois que serão utilizados aqui.
1. Macro variáveis.
Uma macro variável permite definir um valor a uma variável no SAS.
Sintaxe para definir a macro:%LET <nome>=<valor>;
Sintaxe para chamar a macro:&<nome>
2. Macro subprograma com parâmetros.
Uma macro subprograma permite definir uma rotina à parte, variando alguns parâmetros, que podem ser parâmetros de entrada ou de saída. A rotina pode ser chamada tantas vezes quantas precisar.
Sintaxe para definir a macro:%macro <nome(par1,par2, ... )>;<subprograma incluindo os parâmetros precedidos por & (ex: &par1, &par2, etc.>)%mend <nome>;
Sintaxe para chamar a macro:%<nome(v_par1,v_par2, ... )>
onde v_par1, v_par2 são os valores dos parâmetros par1, par2, respectivamente.