UNIVERSIDADE ESTADUAL PAULISTA “JULIO DE MESQUITA FILHO” FACULDADE DE CIÊNCIAS AGRÁRIAS E VETERINÁRIAS CÂMPUS DE JABOTICABAL MODELOS DE AVALIAÇÃO GENÉTICA ALTERNATIVOS NA PRESENÇA DE DIFERENÇAS GENÉTICAS ENTRE AMBIENTES Roberto Carvalheiro Zootecnista Orientadora: Profa. Dra. Sandra Aidar de Queiroz Co-orientadores: Dr. Luiz Alberto Fries Dr. Flávio Schramm Schenkel Tese apresentada à Faculdade de Ciências Agrárias e Veterinárias, Câmpus de Jaboticabal - UNESP, para a obtenção do Título de Doutor em Zootecnia (Produção Animal). JABOTICABAL - SÃO PAULO - BRASIL 2004
86
Embed
MODELOS DE AVALIAÇÃO GENÉTICA ALTERNATIVOS NA …schenkel/papers.htg/Tese_R.Carvalheiro-Final.pdfCo-orientadores:Dr. Luiz Alberto Fries Dr. Flávio Schramm Schenkel Tese apresentada
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
UNIVERSIDADE ESTADUAL PAULISTA “JULIO DE MESQUITA FILHO”FACULDADE DE CIÊNCIAS AGRÁRIAS E VETERINÁRIAS
CÂMPUS DE JABOTICABAL
MODELOS DE AVALIAÇÃO GENÉTICA ALTERNATIVOS NAPRESENÇA DE DIFERENÇAS GENÉTICAS ENTRE
AMBIENTES
Roberto CarvalheiroZootecnista
Orientadora: Profa. Dra. Sandra Aidar de QueirozCo-orientadores: Dr. Luiz Alberto Fries
Dr. Flávio Schramm Schenkel
Tese apresentada à Faculdade deCiências Agrárias e Veterinárias, Câmpusde Jaboticabal - UNESP, para a obtençãodo Título de Doutor em Zootecnia(Produção Animal).
JABOTICABAL - SÃO PAULO - BRASIL
2004
ii
DADOS CURRICULARES DO AUTOR
Roberto Carvalheiro, filho de Manuel Henriques Carvalheiro e de Alda Gonçalves
Carvalheiro, nasceu em 27 de setembro de 1974 em São Paulo, SP. Em janeiro de
1998, graduou-se no curso de Zootecnia pela Universidade Federal de Lavras (UFLA),
onde foi bolsista do Programa Institucional de Bolsa de Iniciação Científica –
CNPq/PIBIC no período de agosto de 1995 a julho de 1997. Em março de 2000, obteve
o título de Mestre em Zootecnia pela Faculdade de Ciências Agrárias e Veterinárias,
Universidade Estadual Paulista “Julio de Mesquita Filho”, Câmpus de Jaboticabal
(FCAV–UNESP/Jaboticabal), onde foi bolsista da CAPES no período de março de 1998
a fevereiro de 2000. Em fevereiro de 2004, obteve o título de Doutor em Zootecnia pela
FCAV–UNESP/Jaboticabal, sendo bolsista do CNPq por seis meses, da FAPESP por
dois anos e seis meses, e da CAPES - do programa de doutorado com estágio no
exterior (PDEE) - por um ano. O estágio no exterior foi realizado no Centre for Genetic
Improvement of Livestock, Department of Animal and Poultry Science, University of
Guelph, Guelph, Ontario, Canada, no período de setembro de 2002 a agosto de 2003.
iii
Dedico
À minha família e à Liziane, por tudo que vocês são e representam para mim!
Agradeço
À Profa. Dra. Sandra Aidar de Queiroz, ao Dr. Luiz Alberto Fries e ao Dr. Flávio
Schramm Schenkel, pela amizade, orientação, ensinamentos, apoio, motivação, ...
Vocês foram fundamentais para o meu crescimento profissional e pessoal!
Aos professores do Departamento de Zootecnia e do Departamento de Ciências Exatas
da FCAV-UNESP/Jaboticabal, pelo agradável convívio e por toda a contribuição em
minha formação acadêmica.
À Coordenadora do Programa de Pós-Graduação em Zootecnia da FCAV-
UNESP/Jaboticabal, Profa. Dra. Telma Teresinha Berchielli Moreno, por todo o auxílio e
incentivo prestados ao longo do curso.
Aos membros da Comissão Examinadora, Prof. Dr. Danísio Prado Munari, Prof. Dr.
Elias Nunes Martins, Dr. Roberto Augusto de Almeida Torres Júnior, Dr. Maurício Mello
de Alencar, pelas contribuições valiosas. Foi uma honra contar com a participação de
vocês!
Ao CNPq, FAPESP e CAPES, pela concessão de recursos durante períodos distintos
do doutorado.
Aos pesquisadores do Centre for Genetic Improvement of Livestock, University of
Guelph, em especial ao Dr. S. P. Miller, pela oportunidade prestada para a realização
do doutorado “sanduíche”, e ao Dr. L. R. Schaeffer, pelos ensinamentos.
iv
Aos amigos do GenSys, por todo o auxílio, apoio e motivação prestados ao longo do
doutorado.
À todos os amigos da pós-graduação, em especial aos meus contemporâneos, Laila,
Rodrigo, Luciele e Vânia. Foi uma benção e um privilégio ter a oportunidade de
“caminhar” com vocês!
Por fim, gostaria de agradecer de forma especial aos amigos da família Schenkel -
Sandra, Mariana, Daniel e Flávio - e ao amigo Vanerlei, pela acolhida formidável e por
terem tornado muito agradável a minha estada no Canadá.
v
SUMÁRIO
Resumo ........................................................................................................ vii
Summary..................................................................................................... viii
1.1 – Problema em estudo ............................................................................. 1
1.2 – Justificativa para a condução do estudo ............................................... 3
1.3 – Objetivos do estudo .............................................................................. 4
1.4 – Estratégias de desenvolvimento do trabalho......................................... 4
Capítulo 2 - Propriedades empíricas das soluções das equações demodelo misto de Henderson para diferentes situações deassociação entre touros e grupos de contemporâneos...... 6
HENDERSON (1973 e 1975) apresentou condições especiais em que as
soluções das EMMH regulares são não viesadas mesmo que a pressuposição E(ai)=0seja violada. Tais condições, como, por exemplo, informação de parentesco completa e
decisões tomadas exclusivamente com base em funções invariantes a translação ou em
variáveis não correlacionadas ao valor genético, dificilmente são atendidas em
conjuntos de dados reais oriundos de programas de melhoramento. Para casos em que
estas condições não são atendidas, HENDERSON (1975) propôs modificações nas
EMMH regulares para que o BLUP dos valores genéticos fosse obtido. As EMMH
modificadas requerem uma matriz para descrever o processo seletivo que, no geral,
não é trivial de ser construída. Além disso, não há garantia de que as EMMH
modificadas forneçam valores genéticos preditos que sejam um critério de seleção
ótimo no sentido de permitir a seleção de animais com a média dos valores genéticos
maximizada.
GIANOLA et al. (1988), GIANOLA et al. (1989) e IM et al. (1989) propuseram
modelos alternativos baseados em métodos de estimação por máxima verossimilhança.
Nestes trabalhos, são apresentados argumentos favoráveis ao uso de funções de
verossimilhança não condicionais ao processo de seleção (uL). Se uL for utilizada, o
processo de seleção é ignorável (as funções de verossimilhança resultariam nos
mesmos estimadores considerando ou não os processos de seleção) quando for
3
baseado apenas em informação contida nos dados para análise, ou nos dados e em
variáveis independentes a eles. Caso contrário, o conhecimento do processo de
seleção é necessário para que inferência correta seja feita sobre os parâmetros de
interesse. Se a função conjunta das variáveis aleatórias e das observações fenotípicas
for maximizada condicionalmente ao processo de seleção (cL), as condições para
ignorá-lo são, de acordo com IM et al. (1989), ainda mais restritas do que as
apresentadas por HENDERSON (1975). GIANOLA et al. (1988) derivaram as equações
resultantes da maximização de cL e descreveram as situações especiais em que os
processos de seleção poderiam ser ignorados, como, por exemplo, quando a seleção
ocorre com base em funções das observações fenotípicas que sejam invariantes a
translação.
A derivação do BLUP pressupondo E(ai)≠≠≠≠0 resulta em soluções para os efeitos
ambientais e genéticos sendo obtidas pelo método de quadrados mínimos ponderados
(FRIES & SCHENKEL, 1993; SCHENKEL, 1998), ou pelo método de quadrados
mínimos ordinários (OLS) se homogeneidade de variância residual for assumida. Neste
caso, os efeitos ambientais e genéticos seriam tratados como efeitos fixos e, no geral,
não haveria possibilidade de aplicação do modelo animal individual em virtude da
deficiência de posto da matriz de coeficientes. Uma alternativa seria a utilização de um
modelo touro e vaca, considerando-os como efeitos fixos. Entretanto, assim como nos
modelos de seleção propostos por HENDERSON (1975), não há garantia de que esse
modelo forneça valores genéticos preditos que sejam um critério de seleção ótimo no
sentido de maximizar a média dos valores genéticos dos animais selecionados.
1.2 - Justificativa para a condução do estudoComo não há, até o presente momento, uma solução estatística clara e definitiva
para tratar a não aleatoriedade de ocorrência dos níveis de efeito genético nos níveis
de efeito ambiental, isto é, para tratar forças que atuam no sentido de gerar diferenças
genéticas entre ambientes, torna-se importante a condução de estudos comparando
diferentes modelos e procurando aqueles que forneçam melhores critérios de seleção
sob estas condições.
4
1.3 - Objetivos do estudoOs principais objetivos do presente trabalho foram: (1) avaliar propriedades das
soluções fornecidas pelas Equações de Modelos Mistos de Henderson, sob diferentes
situações de diferenças genéticas entre ambientes; (2) comparar modelos alternativos
de avaliação genética, para cada situação estudada, com base nas propriedades das
soluções fornecidas pelos diferentes modelos; e (3) fornecer informações que possam
auxiliar os melhoristas na escolha de modelos mais apropriados para situações de
diferenças genéticas entre ambientes.
1.4 - Estratégias de desenvolvimento do trabalho1.4.1 - Como comparar os modelos?
Na dificuldade de comparar analiticamente diferentes modelos quanto às suas
propriedades estatísticas e genéticas, especialmente quando E(ai)=0 não é uma
pressuposição atendida, optou-se pela condução de estudos de simulação, seguindo
recomendações de HENDERSON (1989 e 1990).
1.4.2 - Que situações simular?
Na deficiência e impossibilidade de simular todas as situações práticas possíveis,
dois casos isolados foram escolhidos de forma a gerar diferenças genéticas entre
ambientes. Em um primeiro trabalho, investigaram-se as propriedades empíricas das
soluções fornecidas por diferentes modelos sob situações de associação não aleatória
entre touros e grupos de contemporâneos. Um segundo estudo foi conduzido para
comparar os modelos na presença de diferentes tipos de seleção parental.
1.4.3 - Que modelos comparar?
As EMMH foram aplicadas sob seu modelo usual, considerando os valores
genéticos como efeito aleatório e os efeitos de GC como fixos. Os modelos alternativos
utilizados foram baseados nas propostas de FRIES & SCHENKEL (1993) e de
SCHAEFFER (2003), de considerar os valores genéticos ou parte deles como efeitos
fixos. Optou-se pelo emprego de tais modelos porque: (1) há evidências na literatura de
5
que os mesmos possam ser mais apropriados para situações de diferenças genéticas
são modelos que não requerem a descrição/conhecimento dos processos responsáveis
pela não aleatoriedade de ocorrência dos níveis de efeito genético nos níveis de efeito
ambiental; e (3) são modelos de fácil implementação computacional.
6
CAPÍTULO 2 - PROPRIEDADES EMPÍRICAS DAS SOLUÇÕES DAS EQUAÇÕES DEMODELO MISTO DE HENDERSON PARA DIFERENTES SITUAÇÕES DEASSOCIAÇÃO ENTRE TOUROS E GRUPOS DE CONTEMPORÂNEOS
Resumo: Simulações estocásticas foram conduzidas com o objetivo de
investigar propriedades empíricas das soluções das equações de modelo misto de
Henderson (EMMH) sob quatro diferentes situações (ST1 a ST4) de associação entre
touros e grupos de contemporâneos (GC). Os touros tiveram progênie distribuída nos
GCs independentemente de seus valores genéticos verdadeiros (VGV) na situação
ST1, e de acordo com seus VGV nas situações ST2 a ST4, em que diferenças
genéticas entre GCs foram geradas. ST2 foi caracterizada por ausência de correlação
entre os efeitos de touro e de GC. ST3 e ST4 apresentaram, respectivamente,
correlação positiva e negativa entre os efeitos de touro e de GC. As EMMH foram
aplicadas sob um modelo que incluiu os efeitos de GC como fixo, e touro e vaca como
aleatórios (M1). Três modelos alternativos foram usados (M2 a M4). GC, touro e vaca
foram assumidos como efeitos aleatórios no modelo M2, e como efeitos fixos em M3.
No modelo M4, consideraram-se os efeitos de GC e touro como fixos e vaca como
aleatório. Na situação em que não houve diferenças genéticas entre GCs (ST1), os
modelos M1, M2 e M4 apresentaram resultados semelhantes entre si quanto aos
critérios de comparação estudados, enquanto que M3 forneceu soluções com maior
quadrado médio do erro de predição em comparação com os demais modelos. Na
presença de diferenças genéticas entre GCs (ST2 a ST4), as soluções do M1 foram
viesadas, o que reduziu sua habilidade em classificar apropriadamente os animais, bem
como sua eficiência em selecionar touros geneticamente superiores. Dentre os modelos
alternativos testados, M4 apresentou os melhores resultados quanto aos critérios
estudados, mostrando-se superior a M1 nas situações ST2 a ST4, e similar na ST1.
Palavras-chave: avaliação genética, BLUP, correlação entre efeitos ambientais e
genéticos, predições viesadas
7
2.1 - Introdução
Em melhoramento animal, o modelo de avaliação genética usualmente aplicado,
proposto por HENDERSON (1963), é baseado na pressuposição de que a esperança
marginal dos valores genéticos de todos os animais que estão sendo avaliados seja
igual a zero (E(ai)=0).
Diferentes formas de seleção ou práticas que resultem na distribuição não
aleatória dos animais nos níveis de efeitos ambientais (ex.: grupos de contemporâneos
(GC)) podem gerar diferenças genéticas entre estes níveis e, consequentemente,
invalidar a pressuposição E(ai)=0. A seleção parental, por exemplo, se bem aplicada,
faz com que animais de gerações posteriores tenham valor genético esperado superior
ao da média dos valores genéticos da população dos animais que os geraram.
Diferenças genéticas também podem ser criadas a partir de associações não aleatórias
entre touros e GCs como, por exemplo, touros com mérito genético superior sendo
utilizados nos melhores ambientes.
Como conseqüência da violação de E(ai)=0, as soluções das Equações de
Modelo Misto de Henderson (EMMH), que forneceriam sob condições ideais o BLUP
dos valores genéticos, não são garantidas de serem não viesadas (HARVEY, 1979;
especiais em que as soluções das EMMH são não viesadas mesmo que a
pressuposição E(ai)=0 seja violada. Tais condições, como, por exemplo, informação de
parentesco completa e diferenças genéticas geradas com base em funções das
observações fenotípicas invariantes a translação, dificilmente são atendidas em
conjuntos de dados reais oriundos de programas de melhoramento.
O viés das soluções das EMMH pode fazer com que animais com mérito
genético inferior sejam selecionados para a reprodução, podendo também afetar as
estimativas e predições de tendências genéticas e ambientais, bem como a proporção
de animais jovens de determinado rebanho a receber certificado de superioridade
genética. Diante de tais conseqüências, torna-se importante o estudo de modelos de
avaliação genética alternativos e o fornecimento de informações que auxiliem os
8
melhoristas na escolha de modelos mais adequados ou menos sensíveis à violação da
pressuposição E(ai)=0.
Os objetivos do presente trabalho foram os de investigar, por meio de simulação
estocástica, propriedades empíricas das soluções das EMMH sob situações de
diferenças genéticas entre GCs causadas pela associação não aleatória entre os
efeitos de touro e de GC, e comparar modelos alternativos nestas situações.
2.2 - Material e Métodos2.2.1 - Estrutura das populações simuladas
A população base simulada consistiu de 250 machos (touros) e 2.500 fêmeas
(vacas), não aparentados, não selecionados e assumidos de serem amostrados
aleatoriamente de uma população conceitualmente infinita. Cada vaca foi acasalada
duas vezes, com touros escolhidos aleatoriamente, gerando dois produtos, um por
acasalamento. Apenas uma geração de progênie foi simulada. Os 5.000 produtos
gerados foram distribuídos em 200 grupos de contemporâneos (GC) de acordo com
quatro situações distintas (ST1 a ST4).
Para gerar as diferentes situações, cinco conjuntos de 40 GCs (sGC1 a sGC5) e
cinco conjuntos de 50 touros foram formados com base na sua identificação (ID) ou na
classificação dos valores verdadeiros de seus efeitos (rank), dependendo da situação
simulada (segue ilustração na Tabela 2.1, e no Apêndice 1). Os touros foram agrupados
conforme sua ID na ST1 e conforme seu rank, em ordem decrescente dos valores
genéticos verdadeiros, nas situações ST2 a ST4. Os GCs foram agrupados conforme
sua ID nas situações ST1 e ST2, e seu rank nas situações ST3 (ordem decrescente) e
ST4 (ordem crescente).
9
Tabela 2.1 Valores genéticos verdadeiros (VGV) dos touros e efeitos verdadeiros dos gruposde contemporâneos (VGC), com respectivas classificações, referentes à primeiraamostra do processo de simulação utilizada para simular a situação controle (ST1a).
a Situação caracterizada pela ausência de diferenças genéticas entre GCs e ausência de correlaçãogenética ambiental, com conjuntos de touros e de GCs formados de acordo com suas identificações.
As subclasses definidas por conjuntos de touros e de GCs apresentaram
diferentes probabilidades de ocorrência devido à distribuição não aleatória dos produtos
nos GCs (Tabela 2.2). Os valores das probabilidades foram definidos de forma
arbitrária, levando-se apenas em consideração que cada conjunto de GC e de touro
apresentasse igual probabilidade de ocorrência (0,20).
10
Tabela 2.2 Freqüências (%) esperadas e observadas da ocorrência das subclasses definidaspor conjuntos de touros e conjuntos de grupos de contemporâneos (GCs).
Conjuntos Conjuntos de GCs a
de Touros b 1-40 41-80 81-120 121-160 161-2001-50 12 c (11,96 d) 6 (5,93) 2 (1,96) 0 (0,00) 0 (0,00)
a Os conjuntos de GCs foram formados conforme o número de identificação do GC nas situações 1 (ST1)e 2 (ST2), de acordo com a classificação descendente dos efeitos verdadeiros de GC (VGC) na ST3, econforme a classificação ascendente de VGC na ST4.
b Os conjuntos de touros foram formados de acordo com o número de identificação do touro na ST1, econforme a classificação descendente de seus valores genéticos verdadeiros nas situações ST2 a ST4.
c Valores esperados, que foram utilizados no processo de simulação.d Valores observados (média das 50 repetições).
Na ST1, situação controle, diferenças genéticas entre GCs não são esperadas
visto que os conjuntos de touros foram formados de acordo com sua ID. Entretanto,
para as situações ST2 a ST4, diferenças genéticas entre GCs foram geradas pois os
touros foram agrupados conforme seu rank, de forma que, sGC1 e sGC2 tiveram maior
proporção de produtos dos melhores touros, sGC3 apresentou maior proporção de
produtos dos touros intermediários, enquanto que sGC4 e sGC5 apresentaram maior
proporção de produtos dos piores touros (Tabela 2.2).
ST2 foi caracterizada por ausência de correlação genética ambiental (rG,E), pois
os GCs foram agrupados com base em sua ID. Já, para as situações ST3 e ST4, rG,E
positivas e negativas foram geradas em decorrência da formação de conjuntos de GCs
baseados em seu rank nas ordens decrescente e crescente, respectivamente.
A conectabilidade dos GCs foi garantida pela imposição de restrições sobre o
valor mínimo para número de produtos por touro (5), produtos por GC (10), touros por
GC (3) e GC por touro (3), e também por meio da aplicação do programa MILC (FRIES,
1998), que considera como dado conectado aquele que estiver em um GC com mais de
10 laços genéticos com outros GCs e que tenha pelo menos três pais (touros e/ou
11
vacas) conectados. Novas replicações foram simuladas caso algum GC estivesse
desconectado.
Para cada situação, 50 repetições foram simuladas, sendo gerados, portanto,
200 conjuntos de dados. Variaram, a cada replicação, o acasalamento entre os animais
base, o número de filhos por touro, a alocação e o número de animais por GC.
2.2.2 - Modelo de simulaçãoA cada repetição, observações fenotípicas de uma característica hipotética, que
será denominada como ganho de peso pós-desmame (GPPD), foram simuladas, exceto
para os animais base, de acordo com o modelo: yij = bi + aij + eij , em que yij é o GPPD
do animal j no GC i, bi é o efeito do GC i, aij é o valor genético aditivo do animal j no GC
i e eij é o termo referente ao erro aleatório.
Valores para eij foram independentemente amostrados de uma distribuição
normal com média zero e variância de 180 kg2 (N(0;180)). Valores para bi foram
amostrados de uma N(172,5;300). Os valores genéticos dos animais base foram
gerados a partir de uma N(0;120), e os valores genéticos de seus produtos foram
gerados como: aij = ½( asj + adj) + mij, em que asj e adj são os valores genéticos aditivos
do touro e da vaca que geraram o animal j, e mij é o efeito da Segregação Mendeliana
do animal j, que foi amostrada de uma N(0;60). Os parâmetros usados no processo de
simulação reproduziram uma característica com herdabilidade igual a 0,4 e são
semelhantes aos estimados por CARVALHEIRO (2000) para a característica GPPD de
um conjunto de dados de bovinos da raça Nelore.
Os programas para simular a estrutura dos dados e as observações fenotípicas
foram desenvolvidos no software estatístico SAS (Statistical Analysis System) (SAS,
1998), e se encontram nos Apêndices 2 e 3, respectivamente.
2.2.3 - Análises Estatísticas
Para cada um dos 200 conjuntos de dados, análises foram conduzidas sob
quatro diferentes modelos, que podem ser descritos pela equação:
y = Xββββ + Zss + Zdd + e ,
12
em que: y é o vetor de GPPD, ββββ é o vetor de efeito de GC, s e d são, respectivamente,
os vetores de efeito genético aditivo de touro e de vaca, e é o vetor de resíduos, X, Zs e
Zd são as matrizes de incidência que relacionam os elementos de ββββ, s e d com os
elementos de y, respectivamente. O modelo de touro e vaca foi utilizado, pois o mesmo
eqüivale ao modelo animal para as situações simuladas no presente estudo, em que
animais base não apresentaram dados (observações fenotípicas) e animais com dados
não apresentaram progênie (HENDERSON, 1984).
No modelo 1 (M1), ββββ foi considerado como vetor de efeito fixo, e s e d como
vetores de efeitos aleatórios. As matrizes de esperança e (co)variância são dadas por:
conforme equações similares as EMMH, mas sem adicionar a relação entre as
variâncias residual e de touro ( 2eσσσσ / 2
sσσσσ ) aos elementos da diagonal da matriz de
coeficientes correspondentes ao efeito de touro. A restrição de que a soma dos
elementos em s fosse igual a zero foi imposta, e as soluções para s foram regredidas
como segundo passo usando o mesmo fator de regressão definido para o M3.
Para todos os modelos, os valores genéticos esperados (VGE) dos touros e
vacas foram obtidos multiplicando-se as soluções para s e d por dois. Os componentes
de variância usados nas análises foram iguais àqueles empregados no processo de
simulação dos dados, ou seja, não foram estimados.
Os programas desenvolvidos para conduzir as avaliações genéticas, sob os
quatro diferentes modelos, encontram-se no Apêndice 4.
2.2.4 - Critérios de comparação dos modelosOs modelos foram comparados com relação ao viés e ao quadrado médio do
erro de predição (QME), que foram definidos por:
14
viésw = 1/q∑=
−q
iii ww
1
)ˆ( , e QMEw = 1/q∑=
−q
iii ww
1
2)ˆ( ,
em que: wi é o efeito verdadeiro de GC (VGC) ou efeito genético verdadeiro (VGV) de
touro ou de vaca, iw é o efeito estimado de GC (EGC) ou o VGE de touro ou de vaca,
e q é o número de GCs, touros ou vacas, respectivamente.
Correlações de Spearman entre VGV e VGE foram calculadas como uma
alternativa de avaliar a habilidade de cada modelo em classificar apropriadamente os
animais. Na tentativa de mensurar a eficiência de cada modelo em selecionar animais
de mérito genético superior, também foram calculadas as médias dos VGVs de touros
selecionados conforme os VGEs fornecidos pelos diferentes modelos. Para este último
critério, foram conduzidos testes-t pareados com um nível de significância de 5%.
Para todos os critérios descritos acima, os modelos foram comparados com base
na média aritmética dos valores que cada critério assumiu em cada uma das 50
repetições.
2.3 - Resultados e Discussão2.3.1 - Dados Simulados
Resultados referentes à estrutura das populações simuladas são apresentados
na Tabela 2.3. Em média, 9,2% das subclasses definidas por touro e GC foram
preenchidas, os touros apresentaram o mínimo de 8,6 e o máximo de 33,5 produtos, e
os GCs apresentaram o mínimo de 12,5 e o máximo de 40,3 animais.
Tabela 2.3 Informações referentes à estrutura das populações simuladas (médias das 50repetições).
Média Mínimo MáximoProdutos por touro 20,00 8,60 33,48Produtos por GC 25,00 12,54 40,28Touros por GC 22,94 11,54 36,08GCs por touro 18,35 8,12 30,04% de subclasses touro x GCpreenchidas 9,18 9,10 9,26
15
Na Tabela 2.4, são apresentadas as médias e variâncias dos valores genéticos
verdadeiros (VGV) dos produtos e dos efeitos verdadeiros de GC (VGC) para as
diferentes situações simuladas. Como desejado, os valores observados das médias e
variâncias gerais (última linha da tabela) foram próximos aos parâmetros utilizados no
processo de simulação. As médias de VGV por conjunto de GC foram próximas a zero
na situação ST1, e variaram de –5,52 a 5,36 kg nas situações ST2 a ST4. As variâncias
de VGV foram reduzidas nas situações ST2 a ST4, mas foram semelhantes entre os
conjuntos de GC, isto é, não houve heterogeneidade de variância genética. As médias
de VGC por conjunto de GC foram próximas a 172,5 kg em ST1 e ST2, e variaram de
148,37 a 197,27 kg em ST3 e ST4. Heterogeneidade de variância de VGC entre os
conjuntos de GC foi observada nas situações ST3 e ST4. Seguindo o processo de
simulação, ST1 foi caracterizada por ausência de diferenças genéticas entre GCs e de
correlação entre o VGV dos produtos e o VGC (rG,E); ST2, ST3 e ST4 apresentaram
diferenças genéticas entre GCs, e rG,E iguais a 0,00, 0,34, e –0,34, respectivamente (as
correlações entre o VGV dos touros e o VGC foram iguais a 0,00 para ST1 e ST2, 0,68
para ST3 e –0,68 para ST4).
Tabela 2.4 Médias (kg) e variânciasa (kg2) dos valores genéticos verdadeiros dos produtos(VGV) e dos efeitos verdadeiros dos grupos de contemporâneos (VGC), porconjunto de GC e situação simuladab (médias das 50 repetições).
Geral -0,09 (119,78) -0,08 (119,60) 172,69 (307,44) 172,69 (307,44) 172,69 (307,44)a Valores entre parênteses.b ST1: ausência de diferenças genéticas entre GCs e de correlação entre os efeitos de touro e de GC.
ST2: diferenças genéticas entre GCs e ausência de correlação entre os efeitos de touro e de GC.ST3: diferenças genéticas entre GCs e correlação positiva entre os efeitos de touro e de GC.ST4: diferenças genéticas entre GCs e correlação negativa entre os efeitos de touro e de GC.
16
2.3.2 - Soluções para o efeito de grupo de contemporâneos
São apresentados, na Tabela 2.5, o viés e o QME das soluções para os efeitos
de GC (EGC) fornecidas pelos diferentes modelos. Observou-se que o modelo M1
apresentou EGC viesado para as situações em que houve diferenças genéticas entre
GCs (ST2 a ST4). GCs com animais superiores geneticamente tiveram seus efeitos
superestimados (e vice versa), de acordo com as considerações de HARVEY (1979) e
FRIES & SCHENKEL (1993), de que as soluções para os efeitos fixos fornecidas pelas
EMMH podem estar contaminadas por efeitos genéticos. É interessante notar que
quando todos os GCs foram considerados (viés geral) o viés não foi observado.
O viés e o QME das soluções de M1 foram os mesmos para as situações ST2,
ST3 e ST4, evidenciando que o problema está associado à existência de diferenças
genéticas entre GCs, e não em razão da covariância genética ambiental. Mesmo
quando rG,E foi igual a zero, a soluções das EMMH foram viesadas (soluções do M1 na
ST2).
Considerar GC como efeito aleatório (modelo M2) resultou em pequena redução
do viés em comparação com o modelo M1, na ST2. A redução do QME também foi
pequena, em ST1 e ST2. Estes resultados estão relacionados ao tamanho dos GCs,
que em média apresentaram 25 animais, e ao valor relativamente pequeno da razão
entre as variâncias residual e de GC (HENDERSON, 1973). Na situação ST3, em
concordância com UGARTE et al. (1992) e VISSCHER & GODDARD (1993), M2
apresentou melhores resultados do que o modelo M1 com relação ao viés e ao QME.
As soluções regredidas do efeito de GC, obtidas ao considerá-lo como efeito aleatório
(M2), foram menos contaminadas pelos valores genéticos em comparação com M1. A
mesma redução no viés não foi observada em ST4. Nesta situação, o viés e o QME
foram maiores no modelo M2 do que no M1, assim como observado por VISSCHER &
GODDARD (1993). Portanto, parece que a decisão de tratar o efeito de GC como fixo
ou aleatório não depende apenas do tamanho do GC e do valor da razão entre as
variâncias residual e de GC, mas também da direção de uma possível covariância
genética ambiental.
17
Tabela 2.5 Viés e quadrado médio do erro (QME) das estimativas dos efeitos de grupos decontemporâneos (EGC) fornecidas pelos diferentes modelos, por conjunto de GC esituação simuladaa (médias das 50 repetições).
Geral 0,00 16,60 0,00 20,51 0,00 23,39 0,00 11,81a ST1: ausência de diferenças genéticas entre GCs e de correlação entre os efeitos de touro e de GC.
ST2: diferenças genéticas entre GCs e ausência de correlação entre os efeitos de touro e de GC.ST3: diferenças genéticas entre GCs e correlação positiva entre os efeitos de touro e de GC.ST4: diferenças genéticas entre GCs e correlação negativa entre os efeitos de touro e de GC.
18
Seguindo as considerações de HARVEY (1979) e FRIES & SCHENKEL (1993),
as soluções do efeito de GC fornecidas pelo modelo M3 foram não viesadas em todas
as situações simuladas (ST1 a ST4). Entretanto, como esperado (HENDERSON, 1978),
M3 apresentou maior QME do que M1, em decorrência da maior variância do erro de
predição (VEP) (VEP = QME - viés2). Note que as soluções do M3 foram obtidas por
OLS como primeiro passo e que as vacas apresentaram apenas dois produtos, fator
este que contribuiu para os resultados observados. O VEP de soluções por OLS
também pode ser altamente influenciado pelo grau de desbalanceamento dos dados. O
viés e o QME do M3 foram idênticos para todas as situações (ST1 a ST4), isto é, seus
valores independeram da presença de diferenças genéticas entre GCs e de correlação
genética ambiental.
Similarmente ao modelo M3, os resultados do modelo M4 com respeito ao viés e
ao QME foram os mesmos para todas as situações simuladas. Além de não viesadas,
as soluções do modelo M4 apresentaram QME semelhante ao do modelo M1 na
situação ST1. Para casos em que as fêmeas apresentam número reduzido de progênie
e não são a principal causa da existência de diferenças genéticas entre GCs (como, por
exemplo, para espécies em que há pouca oportunidade para a seleção operar sobre as
fêmeas), o uso do modelo M4 parece ser um comprometimento entre remover o viés
sem que ocorra aumento expressivo do VEP. Com relação ao viés e ao QME, M4
apresentou melhores resultados do que o modelo M1 nas situações ST2 a ST4. Mesmo
quando a pressuposição usual requerida pelas EMMH para fornecer estimativas não
viesadas foi atendida (ST1), M4 não apresentou resultados inferiores a M1.
2.3.3 - Soluções para touros
A Tabela 2.6 apresenta os valores de viés e QME dos VGEs dos touros para
cada situação (ST1 a ST4) e modelo (M1 a M4). Correlações de Spearman (CORR)
entre VGV e VGE também são apresentadas. Foram obtidos resultados gerais e por
conjunto de touros.
19
Tabela 2.6 Viés (kg) e quadrado médio do erro (QME) (kg2) dos valores genéticos esperadosdos touros (VGE), e correlação de Spearman entre VGE e o valor genéticoverdadeiro (CORR), para cada modelo, conjunto de touros e situação simuladaa
Geral 0,13 60,82 0,65 0,13 72,08 0,56 0,13 69,28 0,69 0,13 40,31 0,80a ST1: ausência de diferenças genéticas entre GCs e de correlação entre os efeitos de touro e de GC.
ST2: diferenças genéticas entre GCs e ausência de correlação entre os efeitos de touro e de GC.ST3: diferenças genéticas entre GCs e correlação positiva entre os efeitos de touro e de GC.ST4: diferenças genéticas entre GCs e correlação negativa entre os efeitos de touro e de GC.
20
Em ST1, os VGEs fornecidos por todos os modelos estudados foram não
viesados. O modelo M3 apresentou maiores QME e menores CORR. Os demais
modelos apresentaram QME e CORR semelhantes entre si.
Nas situações ST2 a ST4, todos os modelos apresentaram soluções viesadas.
O viés dos modelos M3 e M4 está relacionado ao uso do fator de regressão (como
segundo passo) para obtenção das soluções, fazendo com que os touros extremos
tivessem seus VGEs proporcionalmente mais regredidos em relação a zero do que os
touros intermediários. M1 apresentou viés adicional pois, como mencionado
anteriormente, as soluções para os efeitos de GC deste modelo foram contaminadas
por efeitos genéticos. Os touros superiores tiveram seus VGEs subestimados porque
parte de sua superioridade foi estimada como efeito de GC, sendo que o oposto
ocorreu para os touros inferiores.
Ao considerar GC como efeito aleatório (M2), funções dos efeitos de GC são
incorporadas nos VGEs (VAN VLECK, 1987). Assim como em VISSCHER &
GODDARD (1993), a conseqüência deste confundimento foi que os resultados de M2
foram, em comparação com M1, favoráveis (menor viés e QME e maior CORR) nas
situações ST2 e ST3 e desfavoráveis em ST4. Os valores das correlações genética
ambiental nas situações ST2, ST3 e ST4 explicam estes resultados. Na situação ST4,
por exemplo, em que os melhores touros estão associados aos piores GCs, as funções
dos efeitos de GC incorporadas nos VGEs, ao considerar GC como aleatório, fizeram
com que os VGEs dos melhores touros fossem subestimados de forma mais acentuada,
e vice versa.
Em todas as situações estudadas, o modelo M3 apresentou menores CORR por
conjunto de touros do que o modelo M1, em decorrência da maior VEP. Entretanto, é
interessante notar que, nas situações ST2 a ST4, M3 apresentou maior CORR geral do
que M1, em decorrência do confundimento entre os efeitos de touro e de GC nas
soluções fornecidas por M1. Semelhantemente aos resultados de HARVEY (1979), a
CORR geral do modelo M3 permaneceu a mesma para as diferentes situações,
enquanto que a CORR geral do modelo M1 foi maior em ST1 do que nas situações ST2
a ST4.
21
Diferenças genéticas entre GCs (ST2 a ST4) reduziram a habilidade de M4 em
classificar apropriadamente os animais por conjunto de touros, assim como para os
outros modelos, pois touros de mérito genético similar tenderam a ser comparados mais
freqüentemente entre eles. Contudo, a CORR geral do modelo M4 permaneceu
constante (0,8) para todas as situações, e foi superior àquelas obtidas pelos demais
modelos nas situações ST2 a ST4.
Na tentativa de mensurar a eficiência de cada modelo em predizer a
superioridade genética nas diferentes situações, foram calculadas as médias dos VGVs
de touros “top” selecionados conforme os VGEs fornecidos pelos diferentes modelos
(Tabela 2.7). Três intensidades de seleção foram aplicadas: 50% (top50), 20% (top20) e
2% (top2) dos melhores touros. Na última coluna da Tabela 2.7 são apresentadas as
médias dos VGVs dos touros “top” numa situação hipotética em que estes seriam
selecionados de acordo com o VGV, apenas para avaliar quão distante cada modelo
está desta situação ideal.
Para os modelos M1 e M2, as diferenças genéticas entre GCs tiveram,
proporcionalmente, maior impacto sobre o VGV médio de touros selecionados com
intensidade moderada (20%) e baixa (50%). No M1, o VGV médio dos top20 e top50 foi
menor para as situações ST2 a ST4 do que para a ST1 (p<0,05). O mesmo foi
observado para o modelo M2 (p<0,05). A habilidade de M3 e M4 em selecionar touros
não foi afetada pela situação simulada, isto é, os resultados de ST1 e ST2 a ST4 não
diferiram (p>0,05). Considerando as situações ST2 a ST4, o modelo M1 apresentou
maior VGV médio do que M3 para os top2, mas menor para os top50, e o modelo M4
apresentou maior VGV médio do que M1 para todas as intensidades de seleção
(p<0,05). Contrastando os modelos M4 e M2, M4 foi superior a M2 para os top50 e
top20 na situação ST3 e para todas as intensidades de seleção na situação ST4
(p<0,05).
22
Tabela 2.7 Médias (kg) dos valores genéticos verdadeiros dos touros (VGV) selecionadosconforme as soluções de cada modelo, para diferentes intensidades de seleção esituações simuladasa (médias das 50 repetições).
a ST1: ausência de diferenças genéticas entre GCs e de correlação entre os efeitos de touro e de GC.ST2: diferenças genéticas entre GCs e ausência de correlação entre os efeitos de touro e de GC.ST3: diferenças genéticas entre GCs e correlação positiva entre os efeitos de touro e de GC.ST4: diferenças genéticas entre GCs e correlação negativa entre os efeitos de touro e de GC.
Conforme os resultados apresentados, é possível notar que a existência de
heterogeneidade de variância ambiental entre os conjuntos de GC nas situações ST3 e
ST4 não afetou as soluções dos modelos que assumiram GC como fixo (M1, M2 e M3),
pois estes apresentaram resultados iguais para as situações ST3 e ST4 em
comparação com a situação ST2 - caracterizada pela ausência de heterogeneidade de
variância ambiental.
As comparações para as soluções de vacas não foram apresentadas porque
todos os modelos tiveram resultados semelhantes independente da situação simulada,
como esperado, uma vez que as vacas não eram fonte da existência de diferenças
genéticas entre GCs.
Os VGEs dos produtos foram obtidos por retro-substituição (HENDERSON,
1984). Considerando o modelo M1 e as situações ST2 a ST4, os VGEs dos produtos
não foram tão afetados pelo viés quanto os VGEs dos touros (dados não
apresentados). Este resultado é explicado pela existência de viés em direção oposta
para as soluções de touro e de GC, que tenderam a se cancelar ao estimar o efeito da
Segregação Mendeliana.
23
2.3.4 - Discussão geral
Propriedades empíricas das soluções das equações de modelo misto de
Henderson foram investigadas para diferentes situações de associação entre touros e
GCs. As situações ST2 a ST4 são casos de “seleção do tipo L’u” de acordo com a
terminologia adotada por HENDERSON (1973), pois os touros tiveram seus produtos
alocados nos GCs com base em informações “externas” (conhecimento a priori do VGV
dos touros). Segundo o autor, se a associação entre touros e GCs ocorresse com base
no BLUP, em vez do VGV, as soluções do M1 seriam não viesadas.
Na prática, diferenças genéticas entre GCs podem ser geradas como resultado
de tomadas de decisão dos produtores (ex.: quais touros usar e como alocar sua
progênie em diferentes grupos de manejo). Normalmente, estas decisões não são
tomadas apenas com base no BLUP dos valores genéticos. HENDERSON (1975, 1990)
sugeriu que o estudo de situações de “seleção do tipo L’u” poderia ser útil para
representar casos reais comuns como, por exemplo, diferenças genéticas sendo
criadas com base em informações prévias ou em variáveis correlacionadas com o VGV
e não disponíveis ou utilizadas na análise. Nestas condições, o uso do modelo M1
resultou em soluções viesadas e, como conseqüência, em redução da habilidade em
classificar os animais apropriadamente.
HENDERSON (1973) mencionou que embora seja lógico considerar rebanho
como efeito aleatório, considerá-lo como fixo elimina o viés causado por diferenças no
mérito de rebanhos associados à determinados touros. Os resultados do presente
estudo não estão em desacordo com esta afirmação, pois HENDERSON (1973) não se
referiu à situações como a ST3 ou a ST4 simuladas no presente estudo, mas sim à
situação em que a média dos efeitos de GC difere entre os touros, mas não há
diferenças genéticas entre GCs.
Ao expressar o melhor preditor linear não viesado (BLUP) dos valores genéticos
(û) desenvolvido por HENDERSON (1949, 1963) na forma )ˆXy(V'GZu 1 ββββ−−−−==== −−−− , talvez
torna-se mais claro que o viés em ββββ pode afetar as soluções de û. Se ββββ é tratado como
fixo, HENDERSON (1973) mostrou que o valor esperado de û fornecido pelas EMMH é
24
invariante a ββββ , o que não significa necessariamente que û é livre de um possível viés
em ββββ .
Estimadores não viesados podem ser inadmissíveis sob o critério QME, isto é,
estimadores viesados com menor QME podem existir (GIANOLA, 1990). No entanto,
com relação as EMMH e as situações simuladas, o viés que afetou ββββ foi uma função
dos efeitos genéticos, o que reduziu a habilidade das EMMH em discriminar os
melhores animais, o que pode ser observado na Tabela 2.6 contrastando a CORR do
M1 na ST1 contra as demais situações (ST2 a ST4).
Viés nas soluções das EMMH também foi observado por HARVEY (1979),
Modelo predominantemente aplicado em programas de melhoramento animal,
em que ββββ é considerado como vetor de efeitos fixos; Za = Zss + Zdd + m, sendo a ovetor aleatório de efeito genético aditivo de cada animal e Z a matriz que associa os
elementos de a com os de y. As matrizes de esperança e (co)variâncias são dadas por:
E(y) = Xββββ, E(a) = E(e) = 0, Var(y) = V = 2en
2a I'ZAZ σσσσ++++σσσσ , Var(a) = 2
aAσσσσ e Var(e) = 2enI σσσσ ,
em que A é a matriz de numeradores do coeficiente de parentesco genético aditivo
(WRIGHT, 1922), nI é uma matriz identidade de ordem n (número de animais em y),2aσσσσ é a variância genética aditiva na população base e 2
eσσσσ é a variância residual.
Soluções para ββββ e a foram obtidas com o emprego das EMMH regulares
Conforme descrito em VANRADEN & WIGGANS (1991), o â fornecido pelas
EMMH regulares pode ser decomposto em: â = w1(informação própria) +
w2(informação dos pais) + w3(informação da progênie), sendo w1=n/(n+2k+0,5pk),
36
w2=2k/(n+2k+0,5pk) e w3=0,5pk/(n+2k+0,5pk), em que n é o número de observações
fenotípicas do animal, k= 2eσσσσ / 2
aσσσσ e p é o tamanho da progênie. SCHAEFFER (2003)
propôs o uso destes fatores de ponderação para combinar as duas soluções que um
animal com informação própria e da progênie pode apresentar quando o modelo touro e
vaca é empregado. Este procedimento foi adotado considerando as soluções â, s e dfornecidas pelo modelo MA1_tv. Assim, os valores genéticos preditos dos animais com
progênie, combinando as diferentes fontes de informação (âc) foram obtidos por:
âc=(((w1+w2)â)+(w3 s ))/(w1+w2+w3), caso o animal fosse touro (exceto touros da G0),
e âc=(((w1+w2)â)+(w3 d))/(w1+w2+w3), caso o animal fosse vaca (exceto vacas da
Similar ao procedimento descrito anteriormente (MA5_c), porém utilizando as
soluções â, s e d do modelo MA2_tv, para obter âc.
3.2.6 - Critérios de comparação dos modelos
Os modelos foram comparados com relação ao viés das soluções, definido por:
viésw = 1/q∑∑∑∑====
−−−−q
1iii )ww( , em que wi é o efeito verdadeiro de GC (VGC) ou valor genético
verdadeiro (VGV), iw é o efeito estimado de GC (EGC) ou o valor genético predito
(VGE), e q é o número de níveis do efeito em consideração.
Na tentativa de mensurar a eficiência de cada modelo em predizer a
superioridade genética, também foram calculadas as médias dos VGVs de animais
selecionados sob diferentes pressões de seleção e com base nas soluções fornecidas
pelos diferentes modelos. Para este critério de comparação, testes-t pareados, com um
nível de significância de 5%, foram conduzidos contrastando todos os modelos, um por
vez, com o modelo MMH_a.
Os modelos também foram avaliados quanto à capacidade de predição da
tendência genética, calculando-se a média dos valores genéticos preditos, por geração.
37
Todos os critérios de comparação foram tomados com base na média dos
valores das 50 repetições.
3.3 - Resultados e Discussão
O problema de violação da pressuposição E(ai)=0 é geralmente tratado na
literatura como um problema de efeito de seleção. Entretanto, cabe salientar que forças
ou práticas de manejo dos animais que geram diferenças genéticas entre níveis dos
efeitos ambientais, entre GCs, por exemplo, estarão atuando no sentido de invalidar a
pressuposição E(ai)=0. Com isso, enfatiza-se que o principal foco dos resultados e
discussões a seguir deveria ser dado sobre as conseqüências da existência de
diferenças genéticas entre GCs e não da seleção em si.
3.3.1 - ViésO viés das estimativas de efeito de GC (EGC), por geração, encontra-se na
Tabela 3.1. Foi apresentado apenas o viés referente aos três primeiros modelos
descritos no material e métodos, pois para os demais “modelos” os efeitos de GC não
foram estimados.
Quando houve seleção com base no BLUP e informação de parentesco
completa, apenas as soluções das EMMH regulares (modelo MMH_a) não
apresentaram viés. Esse resultado empírico está de acordo com as considerações de
HENDERSON (1973) de que as EMMH regulares acomodariam diferenças genéticas
entre níveis de efeitos ambientais sendo geradas seguindo seleção com base em
funções lineares das observações fenotípicas e que sejam invariantes a translação,
como é o caso do BLUP.
Considerando ainda a situação de seleção com base no BLUP e informação de
parentesco completa, é possível notar, na Tabela 3.1, que os modelos touro e vaca
apresentaram EGCs viesados. O viés ocorreu no sentido de subestimar EGCs de
gerações com animais de mérito genético superior. Embora o modelo MA1_tv não
requeira em sua derivação a pressuposição de ausência de diferenças genéticas entre
38
GCs (E(ai)=0), pois touro e vaca são considerados efeitos fixos, suas soluções foram
viesadas porque o emprego de tal modelo eqüivale a assumir herdabilidade igual a um
(HENDERSON et al., 1959) ou, de modo semelhante, a utilizar apenas a informação
“intra-bloco” (CUNNINGHAM & HENDERSON, 1966), sendo bloco, neste caso, os
efeitos de touro e vaca.
Tabela 3.1 Viés (kg) das estimativas de efeito de grupo de contemporâneos, por geração,critério de seleçãoa, modelo de avaliaçãob e tipo de informação de parentescoc
a Três critérios de seleção parental foram empregados: (1) o BLUP dos valores genéticos; (2) o fenótipo;e (3) os valores genéticos verdadeiros (VGV).
b Modelos MMH_a, MA1_tv, MA2_tv, conforme descrito no material e métodos.c Informação de parentesco completa, e 10% dos animais das gerações G2 a G6 com informação de
touro perdida (10% ITP).
39
Assim como em SCHENKEL et al. (2002), as soluções para GC do modelo
MMH_a não foram afetadas por seleção fenotípica, com informação de parentesco
completa. Esse resultado inesperado (HENDERSON ,1975; FERNANDO & GIANOLA,
1990) poderia, de acordo com SCHENKEL et al. (2002), estar em parte associado ao
fato de diferenças genéticas expressivas entre GCs de uma mesma geração não serem
esperadas para o processo de simulação utilizado, uma vez que, a cada geração, os
animais foram distribuídos aleatoriamente entre os GCs, e também pelo fato dos GCs
apresentarem, em média, número razoável de animais, permitindo assim estimação
acurada de seus efeitos.
Dentre os modelos touro e vaca empregados, apenas o modelo que os
considerou como efeitos fixos (MA1_tv) apresentou EGCs não viesados para a situação
de seleção fenotípica com informação de parentesco completa. O viés nos EGCs do
modelo MA2_tv está possivelmente associado ao uso de uma matriz diagonal para
descrever o parentesco entre as vacas.
Seleção do tipo L’u (com base no VGV) fez com que os modelos que
considerassem os efeitos genéticos ou parte deles como aleatórios, apresentassem
EGCs viesados. Mesmo quando uma matriz de parentesco correta e completa foi
definida, o modelo que assumiu o valor genético aditivo como efeito aleatório (modelo
MMH_a) não foi capaz de acomodar as diferenças genéticas entre GCs de diferentes
gerações, ao contrário do ocorrido para os demais tipos de seleção estudados.
Considerar touro e vaca como fixos (modelo MA1_tv) fez com que os EGCs fossem não
viesados. Resultados semelhantes foram observados por CARVALHEIRO et al. (2004–
capítulo anterior), porém estudando situações de diferenças genéticas entre GCs de
uma mesma geração.
Informação de touro perdida (10%ITP) fez com que todos os modelos
apresentassem EGCs viesados no sentido de superestimar o efeito de GCs de
gerações com animais de mérito genético superior. Mesmo os modelos MMH_a e
MA1_tv, que não haviam sido afetados por seleção com base no BLUP e no fenótipo e
com base no fenótipo e no VGV, respectivamente, apresentaram viés. É interessante
notar que considerando os modelos MA1_tv e MA2_tv e seleção com base no BLUP, o
40
viés apresentado pela perda de informação de parentesco foi em sentido oposto ao viés
dos EGCs com informação de parentesco completa.
Na Tabela 3.2, o viés dos valores genéticos preditos dos touros é apresentado.
Demais categorias (vacas e animais sem progênie) apresentaram resultados similares
aos de touro, porém, no geral, com viés (quando foi o caso) um pouco menos
acentuado.
Tabela 3.2 Viés (kg) dos valores genéticos preditos dos touros, por geração, critério deseleçãoa, modelo de avaliaçãob e tipo de informação de parentescoc (médias das50 repetições).
a Três critérios de seleção parental foram empregados: (1) o BLUP dos valores genéticos; (2) o fenótipo;e (3) os valores genéticos verdadeiros (VGV).
b Modelos MMH_a, MA1_tv, MA2_tv, MA3_a, MA4_a, MA5_c, MA6_c, conforme descrito no material emétodos.
c Informação de parentesco completa, e 10% dos animais das gerações G2 a G6 com informação detouro perdida (10% ITP).
41
Com informação de parentesco completa, os VGEs dos touros fornecidos pelo
modelo MMH_a foram não viesados para as situações de seleção com base no BLUP e
no fenótipo e viesados quando houve seleção com base no VGV. Para esta última
situação, como mencionado anteriormente, as soluções para os efeitos de GC do
modelo MMH_a foram contaminadas por efeitos genéticos. Com isso, os touros
superiores tiveram seus VGEs subestimados porque parte de sua superioridade foi
estimada como efeito de GC, sendo que o oposto ocorreu para os touros com mérito
genético inferior.
Os modelos touro e vaca (MA1_tv e MA2_tv), por considerarem touro como
efeito fixo, apresentaram, considerando informação de parentesco completa, soluções
não viesadas nos casos de seleção fenotípica e baseada no VGV, e VGEs viesados
para a situação de seleção com base no BLUP. O viés ocorreu no sentido de
superestimar os VGEs dos touros usados em gerações com mérito genético superior.
Os modelos MA5_c e MA6_c, por utilizarem as soluções dos modelos MA1_tv e
MA2_tv, respectivamente, para compor os VGEs dos touros, apresentaram
comportamento similar.
O procedimento de utilizar, como segundo passo, uma matriz de parentesco
correta e completa para descrever a covariância entre os valores genéticos fez com que
as soluções dos modelos MA3_a e MA4_a fossem menos viesadas do que aquelas
fornecidas pelos demais modelos alternativos (MA1_tv, MA2_tv, MA5_c e MA6_c), na
situação de informação de parentesco completa e seleção baseada no BLUP. Viés foi
observado, especialmente para o modelo MA4_a, quando houve seleção com base no
VGV, situação esta em que os outros modelos alternativos praticamente não
apresentaram viés. Esse resultado decorre do modelo MA4_a ter utilizado como
primeiro passo, no pré-ajuste das observações fenotípicas, as soluções dos efeitos de
GC fornecidas pelo modelo MA2_tv, soluções estas que apresentaram viés.
Assim como ocorreu com os EGCs, informação de touro perdida (10% ITP) fez
com que todos os modelos apresentassem VGEs viesados, para todas as situações
simuladas. O viés ocorreu no sentido de subestimar os VGEs dos touros usados em
gerações com animais de mérito genético superior. Na situação de seleção com base
42
no BLUP e 10% ITP, o viés dos modelos alternativos ocorreu no sentido oposto ao
observado na situação de parentesco completa, fazendo com que o viés dos VGEs
desses modelos, exceto MA4_a, fosse menos acentuado.
3.3.2 – Médias dos VGVsNa Tabela 3.3, são apresentadas as médias dos valores genéticos verdadeiros
dos 35 touros (10%) melhor classificados conforme os VGEs de cada modelo. Os
resultados mostraram que mesmo na situação ideal para o modelo MMH_a, isto é,
seleção com base no BLUP e informação de parentesco completa, as médias dos
modelos alternativos MA3_a e MA4_a não foram inferiores à do modelo MMH_a. Na
mesma situação, demais modelos alternativos, possivelmente por apresentarem VGEs
com viés relativamente acentuado, apresentaram médias inferiores à do modelo
MMH_a. Comportamento semelhante foi observado na situação de seleção fenotípica e
informação de parentesco completa, com MA3_a e MA4_a apresentando valores muito
próximos à MMH_a, e demais modelos com médias um pouco inferiores.
Tabela 3.3 Média (kg) dos valores genéticos verdadeiros dos touros 10% superiores,selecionados conforme soluções dos diferentes modelos de avaliação. Dados decada modelo são apresentados por critério de seleção e tipo de informação deparentesco, e são referentes à média dos valores das 50 repetições.
* Testes-t pareados, com nível de significância de 5%, foram conduzidos contrastando todos os modelos,um por vez, com o modelo MMH_a. NS indica os contrastes que foram não significativos (p>0,05); >
refere-se à valores maiores do que os fornecidos pelo modelo MMH_a (p<0,05); ausência desobrescrito se refere à valores menores do que os fornecidos pelo modelo MMH_a (p<0,05).
43
Na situação de diferenças genéticas geradas com base no VGV, assim como
observado por CARVALHEIRO et al. (2004– capítulo anterior), modelos alternativos que
consideraram os efeitos genéticos ou parte deles como fixos permitiram, no geral, a
seleção de touros com mérito genético superior ao do modelo MMH_a.
Também foi possível observar na Tabela 3.3 que a informação de touro perdida
está associada à redução da habilidade em selecionar touros geneticamente
superiores, para todos os modelos e situações estudadas, mesmo que 10% ITP tenha
ocasionado redução do viés dos VGEs fornecidos pelos modelos MA1_tv, MA2_tv,
MA3_a, MA5_c e MA6_c na situação de seleção com base no BLUP.
Para as vacas 10% melhor classificadas, o modelo MMH_a apresentou médias
dos VGVs superiores aos demais modelos em todas as situações (p<0,05), embora os
modelos MA3_a e MA4_a tenham apresentado resultados muito próximos ao MMH_a
(Tabela 3.4).
Tabela 3.4 Média (kg) dos valores genéticos verdadeiros das vacas 10% superiores,selecionadas conforme soluções dos diferentes modelos de avaliação. Dados decada modelo são apresentados por critério de seleção e tipo de informação deparentesco, e são referentes à média dos valores das 50 repetições.
* Testes-t pareados, com nível de significância de 5%, foram conduzidos contrastando todos os modelos,um por vez, com o modelo MMH_a. Ausência de sobrescrito ao lado dos valores de média, refere-se àvalores menores do que os fornecidos pelo modelo MMH_a (p<0,05).
Pelos resultados da Tabela 3.4 se verificou que, conforme salientado por FRIES
(1999), a seleção das vacas foi seriamente comprometida ao utilizar modelo touro e
vaca (MA1_tv e MA2_tv), pois as principais fontes de informação (própria e dos pais)
44
não foram utilizadas no cálculo dos VGEs das vacas. A inferioridade do modelo MA2_tv
em relação ao modelo MA1_tv, quanto à média das vacas selecionadas, possivelmente
está associada ao uso, em MA2_tv, de uma matriz diagonal para descrever o
parentesco entre as vacas. Em CARVALHEIRO et al. (2004– capítulo anterior), MA2_tv
se mostrou superior à MA1_tv, quanto às propriedades empíricas estudadas, porém
naquele caso não havia realmente parentesco entre as vacas da população simulada.
Utilizar a proposta de SCHAEFFER (2003), de combinar as diferentes fontes de
informação, teve resultados favoráveis (maiores médias dos VGVs) para o modelo que
assumiu vaca como efeito aleatório (MA6_c) e desfavoráveis ao assumir vaca como fixo
(MA5_c). Mais investigações devem ser conduzidas para identificar porque o modelo
MA5_c apresentou médias dos VGVs das vacas inferiores às do modelo MA1_tv.
Outras intensidades foram aplicadas, selecionando 2%, 20% e 50% dos touros e
vacas melhores classificados, e resultados semelhantes aos descritos acima foram
observados (dados não apresentados).
3.3.3 – Tendências genéticasA seguir, o termo tendência genética será utilizado se referindo à media dos
valores genéticos preditos por geração. No presente estudo, tendências genéticas não
foram estimadas com a aplicação de modelos de regressão.
Os resultados de tendências genéticas apresentados nas Figuras 3.1 a 3.3
seguem os resultados referentes ao viés das soluções de cada modelo nas diferentes
situações. As tendências dos modelos MA5_c e MA6_c não foram apresentadas, pois
elas foram muito próximas as tendências dos modelos MA1_tv e MA2_tv,
respectivamente. A linha representada por VGV é referente a tendência verdadeira.
Considerando informação de parentesco completa, os modelos que assumiram
touro e vaca como efeitos fixos (MA1_tv, MA3_a e MA5_c) superestimaram o ganho
genético quando houve seleção com base no BLUP, e estimaram a tendência de forma
apropriada para as demais situações, exceto o modelo MA3_a que subestimou o ganho
na seleção com base no VGV, pois os VGEs dos touros e, consequentemente, dos
produtos, apresentaram um pouco de viés nesta situação. Informação de touro perdida
45
fez com que os modelos MA1_tv, MA3_a e MA5_c subestimassem o ganho em todas
as situações, assim como ocorrido com os demais modelos.
Modelos que consideraram touro como fixo e vaca como efeito aleatório
(MA2_tv, MA4_a e MA6_c), apenas não subestimaram o ganho genético para a
situação de seleção com base no BLUP e informação de parentesco completa.
Seguindo os resultados de viés, observou-se que o modelo MMH_a foi adequado
para estimar o ganho genético nas situações de seleção com base no BLUP e no
fenótipo e informação de parentesco completa. Quando diferenças genéticas com base
no VGV foram geradas, o modelo MMH_a foi o que mais subestimou a tendência
genética.
A combinação de seleção com base no BLUP e informação de parentesco
perdida fez com que as tendências genéticas estimadas pelos modelos MA1_tv, MA3_a
e MA5_c fossem mais próximas da tendência verdadeira do que aquela estimada pelo
modelo MMH_a.
46
Figura 3.1 Tendências genéticas para os diferentes modelos, com e sem informação de touroperdida (10% ITP), na situação de seleção com base no BLUP.
Figura 3.3 Tendências genéticas para os diferentes modelos, com e sem informação de touroperdida (10% ITP), na situação de seleção com base no valor genético verdadeiro(VGV).
FERNANDO, R. L.; GIANOLA, D. Statistical inferences in populations undergoing
selection and non-random mating. In: Advances in Statistical Methods for GeneticImprovement of Livestock (ed. D. Gianola, and K. Hammond), Springer-Verlag,
Berlin. p.437-453. 1990.
FRIES, L. A. Connectability in beef cattle genetic evaluation: the heuristic approach
used in MILC.FOR. In: WORLD CONGRESS ON GENETICS APPLIED TO
HENDERSON, C. R. Sire evaluation and genetics trends. In: ANIMAL BREEDING AND
GENETIC SYMPOSIUM IN HONOR OF DR. JAY L. LUSH, ASAS, 1973, Illinois,
USA, Proceedings... p.10-41.
HENDERSON, C. R. Best linear unbiased estimation and prediction under a selection
model. Biometrics, v.31, p.423-447. 1975.
HENDERSON, C. R. Undesirable properties of regressed least squares prediction of
breeding values. J. Dairy Sci., v.61, p.114-120. 1978.
HENDERSON, C. R. Applications of linear models in animal breeding. University of
Guelph, Ontario, Canada. 1984. 462 p.
55
HENDERSON, C. R. Comment. In: IM et al. (1989). Likelihood inferences in animal
breeding under selection: a missing-data theory view point. Genet. Sel. Evol., v.21,
p.409-410. 1989.
HENDERSON, C. R. Accounting for selection and mating biases in genetic evaluations.
In: Advances in Statistical Methods for Genetic Improvement of Livestock (ed.
D. Gianola, and K. Hammond), Springer-Verlag, Berlin. p.413-436. 1990.
HENDERSON, C. R.; KEMPTHORNE, O.; SEARLE, S. R.; VON KROSIGK, C. M. The
estimation of environmental and genetic trends from records subject to culling.
Biometrics, v.15, p.192-218. 1959.
IM, S.; FERNANDO, R. L.; GIANOLA, D. Likelihood inferences in animal breeding under
selection: a missing-data theory view point. Genet. Sel. Evol., v.21, p.399-414. 1989.
SAS Institute Inc. SAS/STAT, 1998. User guide. Cary: SAS Institute Inc., USA.
SCHAEFFER, L. R. Effects of non-random mating. In: QUANTITATIVE GENETICS
AND ANIMAL MODELS, Lesson 17, Winter Course. University of Guelph, Ontario,
Canada. 2003. 7p.
SCHENKEL, F. S. Studies on effects of parental selection on estimation of geneticparameters and breeding values of metric traits. Ph.D. Thesis. University of
Guelph, Ontario. 1998. 191p.
SCHENKEL, F. S.; SCHAEFFER, L. R.; BOETTCHER, P. J. Comparison between
estimation of breeding values and fixed effects using Bayesian and empirical BLUP
estimation under selection on parents and missing pedigree information. Genet. Sel.Evol., v.34, p.41-59. 2002.
SIMIANER, H. Prospects for third generation methods of genetic evaluation. In:
ANNUAL MEETING OF THE EUROPEAN ASSOCIATION FOR ANIMAL
SIMIANER, H.; WOLLNY, C. Impact of the potential use of bovine somatotropin on the
efficiency of a conventional dairy cattle breeding scheme. Livest. Prod. Sci., v.22,
p.31. 1989.
56
SORENSEN, D. A.; GIANOLA, D. Likelihood, Bayesian, and MCMC methods inquantitative genetics. Springer. 2002. 740p.
SORENSEN, D. A.; KENNEDY, B. W. Estimation of genetic variances from unselected
and selected populations. J. Anim. Sci., v.59, p.1213-1223. 1984.
SULLIVAN, P. Genetic evaluation strategies for multiple traits and countries. Ph.D.
Thesis. University of Guelph, Ontario. 2002. 152p.
TÄUBERT, H.; SWALVE, H. H.; SIMIANER, H. Treatment of management groups in
dairy cattle evaluations. In: WORLD CONGRESS ON GENETICS APPLIED TO
LIVESTOCK PRODUCTION, 7., 2002, Montpellier, France, Proceedings...
Communication 20-12.
TORRES JR., R. A. A.; BRACCINI NETO, J.; SILVA, M. A.; LOPES, P. S. Avaliação de
metodologias de predição de valor genético por meio de simulação. Rev. Bras.Zootec., v.26, p.1142-1146. 1997.
UGARTE, E.; ALENDA, R.; CARABAÑO, M. J. Fixed or random contemporary groups in
genetic evaluations. J. Dairy Sci., v.75, p.269-278. 1992.
VAN DER WERF, J. H. J. Models to estimate genetic parameters in cross breddairy cattle populations under selection. Ph. D. Thesis, Department of Animal
Apêndice 2: Programa de simulação desenvolvido em SAS para gerar a estrutura dos
dados simulados no primeiro estudo, conforme descrito no Capítulo 2, item 2.2.1.
/*************************************//* RC *//* *//* doutorado JAN/2003 *//* *//* gerando estrutura dos dados *//* *//*************************************/
proc iml;
seed=27903441;
%MACRO CRIAR; /* comando MACRO usado para gerar repetições */%DO J=1 %TO 50; /* e gravar arq. saída com diferentes nomes */
n1=5000; /* n1=nº total de observações (animais) */n2=250; /* n2=nº de touros */n3=200; /* n3=nº de GC´s */
t=j(n1,1,0); /* t=touro (n2 touros gerando n1 animais) */gc=j(n1,1,0); /* n1 animais distribuídos em n3 GC´s */tgc=j(n2,n3,0); /* tgc subclasses touro*gc */ntgc=j(n3,1,0); /* ntgc=nº de touros por GC */ngct=j(n2,1,0); /* ngct=nº de GCs por touro */nt=j(n2,1,0); /* nt=nº de filhos por touro */ngc=j(n3,1,0); /* ngc=nº de animais por GC */
vaca=j(n1,1,0);an=j(n1,1,0);
/* "Restrições": mínimo máximo *//* (1) filhos por touro n4 n5 *//* (2) animais por GC n6 n7 *//* (3) touro por GC n8 n9 *//* (4) GC por touro n10 n11 */
n4=5;n5=50;n6=10;n7=100;n8=3;n9=50;n10=3;n11=40;
60
/* Iniciando Processo de amostragem (pseudo)aleatória *//* usando distribuição uniforme para amostrar touro e GC */
R=1;DO WHILE(R=1);
REINI:do i= 1 to n1;
an[i]=20000+i; if i<=(n1/2) then vaca[i]=10000+i; else vaca[i]=10000+i-(n1/2);
INIT: t[i]=int(ranuni(seed)*n2)+1;
if t[i]<=50 then rt=1; if t[i]>50 then if t[i]<=100 then rt=2; if t[i]>100 then if t[i]<=150 then rt=3; if t[i]>150 then if t[i]<=200 then rt=4; if t[i]>200 then rt=5;
prob1=0; rng1=ranuni(seed); if rng1<=.6 then prob1=1; if rng1>.6 then if rng1<=.9 then prob1=2; if rng1>.9 then prob1=3;
prob2=0; rng2=ranuni(seed); if rng2<=.3 then prob2=1; if rng2>.3 then if rng2<=.7 then prob2=2; if rng2>.7 then if rng2<=.9 then prob2=3; if rng2>.9 then prob2=4;
prob3=0; rng3=ranuni(seed); if rng3<=.1 then prob3=1; if rng3>.1 then if rng3<=.3 then prob3=2; if rng3>.3 then if rng3<=.7 then prob3=3; if rng3>.7 then if rng3<=.9 then prob3=4; if rng3>.9 then prob3=5;
if rt=1 then if prob1=1 then gc[i]=int(ranuni(seed)*20)+1; if rt=1 then if prob1=2 then gc[i]=int(ranuni(seed)*20)+41; if rt=1 then if prob1=3 then gc[i]=int(ranuni(seed)*20)+81;
if rt=2 then if prob2=1 then gc[i]=int(ranuni(seed)*20)+1; if rt=2 then if prob2=2 then gc[i]=int(ranuni(seed)*20)+41; if rt=2 then if prob2=3 then gc[i]=int(ranuni(seed)*20)+81; if rt=2 then if prob2=4 then gc[i]=int(ranuni(seed)*20)+121;
61
if rt=3 then if prob3=1 then gc[i]=int(ranuni(seed)*20)+1; if rt=3 then if prob3=2 then gc[i]=int(ranuni(seed)*20)+41; if rt=3 then if prob3=3 then gc[i]=int(ranuni(seed)*20)+81; if rt=3 then if prob3=4 then gc[i]=int(ranuni(seed)*20)+121; if rt=3 then if prob3=5 then gc[i]=int(ranuni(seed)*20)+161;
if rt=4 then if prob2=4 then gc[i]=int(ranuni(seed)*20)+41; if rt=4 then if prob2=3 then gc[i]=int(ranuni(seed)*20)+81; if rt=4 then if prob2=2 then gc[i]=int(ranuni(seed)*20)+121; if rt=4 then if prob2=1 then gc[i]=int(ranuni(seed)*20)+161;
if rt=5 then if prob1=3 then gc[i]=int(ranuni(seed)*20)+81; if rt=5 then if prob1=2 then gc[i]=int(ranuni(seed)*20)+121; if rt=5 then if prob1=1 then gc[i]=int(ranuni(seed)*20)+161;
resto=(mod(i,2)); if resto^=0 then gc[i]=gc[i]+20;
nt[t[i]]=nt[t[i]]+1; if nt[t[i]]>n5 then do; /* máximo de filhos por touro */ nt[t[i]]=nt[t[i]]-1; go to INIT; end;
ngc[gc[i]]=ngc[gc[i]]+1; if ngc[gc[i]]>n7 then do; /* máximo de animais por GC */ nt[t[i]]=nt[t[i]]-1; ngc[gc[i]]=ngc[gc[i]]-1; go to INIT; end;
tgc[t[i],gc[i]]=1; ntgc[gc[i]]=0; ngct[t[i]]=0;
do l=1 to n2; ntgc[gc[i]]=ntgc[gc[i]]+tgc[l,gc[i]]; end; if ntgc[gc[i]]>n9 then do; /* máximo de touros por GC */ nt[t[i]]=nt[t[i]]-1; ngc[gc[i]]=ngc[gc[i]]-1; tgc[t[i],gc[i]]=0; go to INIT; end;
do l=1 to n3; ngct[t[i]]=ngct[t[i]]+tgc[t[i],l]; end; if ngct[t[i]]>n11 then do; /* máximo de GCs por touro */ nt[t[i]]=nt[t[i]]-1; ngc[gc[i]]=ngc[gc[i]]-1; tgc[t[i],gc[i]]=0; go to INIT; end;
62
end;
restr1=0;restr2=0;restr3=0;restr4=0; /* Verificando Restrições */ /* */do m=1 to n2; /* */ if nt[m]<n4 then restr1=1; /* mínimo de filhos por touro */end; /* */ /* */
do m=1 to n3; /* */ if ngc[m]<n6 then restr2=1; /* mínimo de animais por GC */end; /* */ /* */do m=1 to n3; /* */ if ntgc[m]<n8 then restr3=1; /* mínimo de touros por GC */end; /* */ /* */do m=1 to n2; /* */ if ngct[m]<n10 then restr4=1; /* mínimo de GCs por touro */end; /* */
/* Iniciando avaliação de conectabilidade das subclasses (touro*GC) *//* de acordo com Schaeffer (1983 - p.39). *//* Se nsub=soma, então os dados estão conectados, *//* senão, REINIciar amostragem. */
nsub=0;obs=0;soma=sum(tgc);
do i1=1 to n2; do j1=1 to n3;
if obs=0 then do; if tgc[i1,j1]=1 then do; tgc[i1,j1]=0; nsub=nsub+1; obs=obs+1; CONT: do i2=1 to n3; if tgc[i1,i2]=1 then tgc[i1,i2]=2; end; do j2=1 to n2; if tgc[j2,j1]=1 then tgc[j2,j1]=2; end;
end; end;
63
if tgc[i1,j1]=2 then do; tgc[i1,j1]=0; nsub=nsub+1; go to CONT; end;
if i1=n2 then if j1=n3 then do; do i3=1 to n2; do j3=1 to n3; if tgc[i3,j3]=2 then do; i1=1; j1=1; end; end; end; end;
end;end;
do o=1 to n2; /* Zerando contadores */ nt[o]=0; /* para a próxima repetição */end; /* ou para REINIciar se */do p=1 to n3; /* restrições de mínimo não */ ngc[p]=0; /* foram atendidas (restr=1) */end; /* ou ainda se dados não */do q=1 to n2; /* estão conectados */ do s=1 to n3; tgc[q,s]=0; end;end;
print restr1 restr2 restr3 restr4 soma nsub;
if restr1=1 then go to REINI;if restr2=1 then go to REINI;if restr3=1 then go to REINI;if restr4=1 then go to REINI;if nsub^=soma then go to REINI;
R=R+1;END;
CREATE ESQ&J VAR{an t vaca gc};APPEND;CLOSE ESQ&J;
%END;%MEND CRIAR;%CRIAR;
quit;run;
64
%MACRO GRAVAR;%DO J=1 %TO 50;
data a;set esq&J;file "c:\roberto\s030331\dados&J";put an 1-6 t 8-13 vaca 15-20 gc 22-24;run;
%END;%MEND GRAVAR;%GRAVAR;
65
Apêndice 3: Programa de simulação desenvolvido em SAS para gerar os parâmetros
do modelo e as observações fenotípicas das simulações referentes ao primeiro estudo,
C Lendo arquivo de dadosC I=1 MU=0.0 10 CONTINUE READ(11,911,END=12)KA(I),ISIRE(I),IDAM(I),IGC(I),Y(I) MU=MU+(Y(I)-MU)/I I=I+1 GOTO 10 12 CONTINUE IREG=I-1 WRITE(*,*)' IREG=',IREG WRITE(*,*)' Media Geral=',mu
CC (i)Gerando nova ID para SIRE, DAM e GC de acordo com a ordem queC aparecem no arquivo de dadosC obs: KT, KV e KG sao a "ID sequencial"C (ii)Obtendo numero de touros, vacas e GC presentes noC arquivo de dados (NT,NV,NG)C
Apêndice 5: Desdobramento das equações de modelos mistos de Henderson
modificadas para a obtenção do BLUE/BLUP sob situações de “seleção do tipo L’y”
com L’X=0, e seleção com base no BLUP.
Baseado nos resultados de PEARSON (1903), HENDERSON (1975) derivou as
seguintes equações para a obtenção do BLUE/BLUP sob situações de seleção:
====
++++−−−−−−−−++++
−−−−
−−−−
−−−−
−−−−−−−−−−−−−−−−−−−−
−−−−−−−−−−−−−−−−−−−−
−−−−−−−−−−−−
yR'ByR'ZyR'X
tub
BR'BBR'BG'BZR'BXR'B
BGBR'ZGZR'ZXR'ZBR'XZR'XXR'X
1e
1
1
u1
ue1
e1
u1
e1
e
u1
e1111
e111
. (1)
Seleção com base em y:
Se a seleção for baseada nas observações fenotípicas, HENDERSON (1975)
demonstrou que as equações (1) se reduzem a:
====
++++
−−−−
−−−−
−−−−
−−−−−−−−−−−−
−−−−−−−−
yR'LyR'ZyR'X
tub
VL'L0X'L0GZR'ZXR'ZL'XZR'XXR'X
1
1
1
111
11
. (2)
Para que as equações (2) sejam equivalentes as EMMH regulares, a condição
L’X=0 deve ser atendida, isto é, a matriz que descreve o processo de seleção (L’) deve
ser ortogonal à matriz X. Esta condição ocorrerá quando as decisões baseadas em yforem tomadas dentro dos diferentes níveis dos efeitos fixos/ambientais, o que
raramente ocorre na prática, sobretudo na existência de covariáveis afetando y (FRIES,
1999; SCHAEFFER, 1999).
Seleção com base no BLUP:
Se o critério de seleção for o BLUP, então: Bu=Cov(u,BLUP) e
Be=Cov(e,BLUP). A seguir, as equações (1) são desdobradas considerando o BLUP
77
como critério de seleção. O objetivo desde desdobramento é averiguar se (1) se
reduziria às EMMH regulares caso a seleção fosse praticada com base no BLUP. Para
que isso ocorra, temos que provar que:
i) X’R-1Be=0ii) Z’R-1Be-G-1Bu=0
No 3º e 4º passos descritos a seguir, i) e ii) serão, respectivamente,