Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear LGN5830 - Biometria de Marcadores Genéticos Tópico 7: Mapeamento de QTLs I Análise dos Marcadores Individualmente Antonio Augusto Franco Garcia http://about.me/augusto.garcia [email protected]Departamento de Genética ESALQ/USP 2017
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
LGN5830 - Biometria de Marcadores GenéticosTópico 7: Mapeamento de QTLs I
Análise dos Marcadores Individualmente
Antonio Augusto Franco Garciahttp://about.me/augusto.garcia
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Caráter Quantitativo
2040
6080
100
BW (peso corporal)
Caráter Quantitativo
Indi
vídu
os
Histograma
BW
Fre
quên
cia
30 40 50 60 70 80
05
1015
20
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Dados Fenotípicos e Genotípicos
1 2 3 4 5 6 7 8 9 10 11 12 13 14
15
914
2026
3238
4450
5662
6874
8086
9298
Marcadores
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Dados Fenotípicos e GenotípicosAzul: Aa; amarelo: AA
1 2 3 4 5 6 7 8 9 10 11 12 13 14
15
914
2026
3238
4450
5662
6874
8086
9298
Marcadores
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Dados Fenotípicos e Genotípicos
1 2 3 4 5 6 7 8 9 10 11 12 13 14
14
710
1418
2226
3034
3842
4650
5458
6266
7074
7882
8690
9498
102
Marcadores
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Análises Estatísticas
Conteúdo
1 Análise dos Marcadores IndividualmenteIntroduçãoFundamentosAnálises Estatísticas
2 Modelos LinearesFundamentosÁlgebra de MatrizesEstimação e Testes
3 Regressão LinearResultadosReferências
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Análises Estatísticas
Motivação
Princípio: testar se há alguma associação entre fenótipo (caráterquantitativo) e genótipo (avaliado com base nos marcadores)
Testar se há diferenças fenotípicas entre indivíduos de diferentesclasses genotípicas
Caso alguma associação seja detectada, há evidências de ligação domarcador com (suposto) QTL (ou QTLs)
Várias alternativas: teste t, ANAVA, regressão linear, LRT, LOD Score,…
Single Marker Analysis vs Análise de Marcas Simples (?)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Análises Estatísticas
Motivação
Princípio: testar se há alguma associação entre fenótipo (caráterquantitativo) e genótipo (avaliado com base nos marcadores)
Testar se há diferenças fenotípicas entre indivíduos de diferentesclasses genotípicas
Caso alguma associação seja detectada, há evidências de ligação domarcador com (suposto) QTL (ou QTLs)
Várias alternativas: teste t, ANAVA, regressão linear, LRT, LOD Score,…
Single Marker Analysis vs Análise de Marcas Simples (?)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Análises Estatísticas
Motivação
Princípio: testar se há alguma associação entre fenótipo (caráterquantitativo) e genótipo (avaliado com base nos marcadores)
Testar se há diferenças fenotípicas entre indivíduos de diferentesclasses genotípicas
Caso alguma associação seja detectada, há evidências de ligação domarcador com (suposto) QTL (ou QTLs)
Várias alternativas: teste t, ANAVA, regressão linear, LRT, LOD Score,…
Single Marker Analysis vs Análise de Marcas Simples (?)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Análises Estatísticas
Motivação
Princípio: testar se há alguma associação entre fenótipo (caráterquantitativo) e genótipo (avaliado com base nos marcadores)
Testar se há diferenças fenotípicas entre indivíduos de diferentesclasses genotípicas
Caso alguma associação seja detectada, há evidências de ligação domarcador com (suposto) QTL (ou QTLs)
Várias alternativas: teste t, ANAVA, regressão linear, LRT, LOD Score,…
Single Marker Analysis vs Análise de Marcas Simples (?)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Análises Estatísticas
Motivação
Princípio: testar se há alguma associação entre fenótipo (caráterquantitativo) e genótipo (avaliado com base nos marcadores)
Testar se há diferenças fenotípicas entre indivíduos de diferentesclasses genotípicas
Caso alguma associação seja detectada, há evidências de ligação domarcador com (suposto) QTL (ou QTLs)
Várias alternativas: teste t, ANAVA, regressão linear, LRT, LOD Score,…
Single Marker Analysis vs Análise de Marcas Simples (?)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Análises Estatísticas
Classes genotípicas
Mouse data
1 2 3 4 5 6 7 8 9 10 11 12 13 14
14
710
1418
2226
3034
3842
4650
5458
6266
7074
7882
8690
9498
102
Marcadores
30
40
50
60
70
80
Genotype
BW
M1
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
AA AB
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Análises Estatísticas
Classes genotípicas
Mouse data, M1
30
40
50
60
70
80
Genotype
BW
M1
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
AA AB
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●●
●●
●
●
●
●
●●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
0 1
3040
5060
7080
M1
Genótipo
Fen
ótip
o
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Análises Estatísticas
Regressão Linear Simples
Modelo Linear, Retrocruzamento
yj = µ+ βxj + εj
j = 1, 2, . . . , n
yj = valor fenotípico do indivíduo j
µ = intercepto
xj =
{1 se o indivíduo j tem genótipoMi/Mi
0 se o indivíduo j tem genótipoMi/mi
β = coeficiente de regressão linear (efeitos genéticos)
εj ∼ N(0, σ2)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Análises Estatísticas
Regressão Linear Simples
Mouse - M1
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●●
●●
●
●
●
●
●●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
0 1
3040
5060
7080
M1
Genótipo
Fen
ótip
o
Teste de Hipóteses: H0 : β = 0 vsH1 : β = 0
Note que β = tan(α) = µ1−µ0
1 = µ1 − µ0
Logo, testarH0 : β = 0 equivale ao teste deH0 : µ1 = µ0 vsH1 : µ1 = µ0
Esta hipótese, é claro, também poderia ser testada de outras formas(por exemplo, teste t, Anava)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Análises Estatísticas
Regressão Linear Simples
Mouse - M1
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●●
●●
●
●
●
●
●●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
0 1
3040
5060
7080
M1
Genótipo
Fen
ótip
o
Teste de Hipóteses: H0 : β = 0 vsH1 : β = 0
Note que β = tan(α) = µ1−µ0
1 = µ1 − µ0
Logo, testarH0 : β = 0 equivale ao teste deH0 : µ1 = µ0 vsH1 : µ1 = µ0
Esta hipótese, é claro, também poderia ser testada de outras formas(por exemplo, teste t, Anava)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Análises Estatísticas
Regressão Linear Simples
Mouse - M1
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●●
●●
●
●
●
●
●●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
0 1
3040
5060
7080
M1
Genótipo
Fen
ótip
o
Teste de Hipóteses: H0 : β = 0 vsH1 : β = 0
Note que β = tan(α) = µ1−µ0
1 = µ1 − µ0
Logo, testarH0 : β = 0 equivale ao teste deH0 : µ1 = µ0 vsH1 : µ1 = µ0
Esta hipótese, é claro, também poderia ser testada de outras formas(por exemplo, teste t, Anava)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Análises Estatísticas
Regressão Linear Simples
Mouse - M1
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●●
●●
●
●
●
●
●●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
0 1
3040
5060
7080
M1
Genótipo
Fen
ótip
o
Teste de Hipóteses: H0 : β = 0 vsH1 : β = 0
Note que β = tan(α) = µ1−µ0
1 = µ1 − µ0
Logo, testarH0 : β = 0 equivale ao teste deH0 : µ1 = µ0 vsH1 : µ1 = µ0
Esta hipótese, é claro, também poderia ser testada de outras formas(por exemplo, teste t, Anava)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Conteúdo
1 Análise dos Marcadores IndividualmenteIntroduçãoFundamentosAnálises Estatísticas
2 Modelos LinearesFundamentosÁlgebra de MatrizesEstimação e Testes
3 Regressão LinearResultadosReferências
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Motivação
y: variável resposta
x: variável preditora (independente)
y = f(x) (Função, processo determinístico)
Processo estocástico: modeloModelos estatísticos (incluem variáveis aleatórias)
EsperançaVariânciaDistribuição de Probabilidades(Incerteza)
George Box
“All models are wrong, but some are useful”
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Motivação
y: variável resposta
x: variável preditora (independente)
y = f(x) (Função, processo determinístico)
Processo estocástico: modeloModelos estatísticos (incluem variáveis aleatórias)
EsperançaVariânciaDistribuição de Probabilidades(Incerteza)
George Box
“All models are wrong, but some are useful”
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Motivação
y: variável resposta
x: variável preditora (independente)
y = f(x) (Função, processo determinístico)
Processo estocástico: modeloModelos estatísticos (incluem variáveis aleatórias)
EsperançaVariânciaDistribuição de Probabilidades(Incerteza)
George Box
“All models are wrong, but some are useful”
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Motivação
y: variável resposta
x: variável preditora (independente)
y = f(x) (Função, processo determinístico)
Processo estocástico: modeloModelos estatísticos (incluem variáveis aleatórias)
EsperançaVariânciaDistribuição de Probabilidades(Incerteza)
George Box
“All models are wrong, but some are useful”
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Motivação
y: variável resposta
x: variável preditora (independente)
y = f(x) (Função, processo determinístico)
Processo estocástico: modeloModelos estatísticos (incluem variáveis aleatórias)
EsperançaVariânciaDistribuição de Probabilidades(Incerteza)
George Box
“All models are wrong, but some are useful”
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Motivação
y: variável resposta
x: variável preditora (independente)
y = f(x) (Função, processo determinístico)
Processo estocástico: modeloModelos estatísticos (incluem variáveis aleatórias)
EsperançaVariânciaDistribuição de Probabilidades(Incerteza)
George Box
“All models are wrong, but some are useful”
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Motivação
y: variável resposta
x: variável preditora (independente)
y = f(x) (Função, processo determinístico)
Processo estocástico: modeloModelos estatísticos (incluem variáveis aleatórias)
EsperançaVariânciaDistribuição de Probabilidades(Incerteza)
George Box
“All models are wrong, but some are useful”
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Motivação
y: variável resposta
x: variável preditora (independente)
y = f(x) (Função, processo determinístico)
Processo estocástico: modeloModelos estatísticos (incluem variáveis aleatórias)
EsperançaVariânciaDistribuição de Probabilidades(Incerteza)
George Box
“All models are wrong, but some are useful”
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Motivação
y: variável resposta
x: variável preditora (independente)
y = f(x) (Função, processo determinístico)
Processo estocástico: modeloModelos estatísticos (incluem variáveis aleatórias)
EsperançaVariânciaDistribuição de Probabilidades(Incerteza)
George Box
“All models are wrong, but some are useful”
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Motivação
y: variável resposta
x: variável preditora (independente)
y = f(x) (Função, processo determinístico)
Processo estocástico: modeloModelos estatísticos (incluem variáveis aleatórias)
EsperançaVariânciaDistribuição de Probabilidades(Incerteza)
George Box
“All models are wrong, but some are useful”
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Sistemas de Equações
Plantas de uma linhagem de feijão, avaliadas em vasos4 = g5 = g2 = g3 = g
yi = g
Sistema inconsistente
Abordagem ingênua do problema
(Muitos acreditam que um dia conseguiremos explicar estasdiferenças, p. ex. incluindo medidas de microclima, fertilidade, etc)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Sistemas de Equações
Plantas de uma linhagem de feijão, avaliadas em vasos4 = g5 = g2 = g3 = g
yi = g
Sistema inconsistente
Abordagem ingênua do problema
(Muitos acreditam que um dia conseguiremos explicar estasdiferenças, p. ex. incluindo medidas de microclima, fertilidade, etc)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Sistemas de Equações
Plantas de uma linhagem de feijão, avaliadas em vasos4 = g5 = g2 = g3 = g
yi = g
Sistema inconsistente
Abordagem ingênua do problema
(Muitos acreditam que um dia conseguiremos explicar estasdiferenças, p. ex. incluindo medidas de microclima, fertilidade, etc)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Sistemas de Equações
Plantas de uma linhagem de feijão, avaliadas em vasos4 = g5 = g2 = g3 = g
yi = g
Sistema inconsistente
Abordagem ingênua do problema
(Muitos acreditam que um dia conseguiremos explicar estasdiferenças, p. ex. incluindo medidas de microclima, fertilidade, etc)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Sistemas de Equações
Plantas de uma linhagem de feijão, avaliadas em vasos4 = g5 = g2 = g3 = g
yi = g
Sistema inconsistente
Abordagem ingênua do problema
(Muitos acreditam que um dia conseguiremos explicar estasdiferenças, p. ex. incluindo medidas de microclima, fertilidade, etc)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Sistema de Equações
Feijão
yi = g + eiy1 = 4 = g + e1y2 = 5 = g + e2y3 = 2 = g + e3y4 = 3 = g + e4
ei: variável aleatóriaDistribuição de ProbabilidadesE(ei), V ar(ei)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Sistema de Equações
Feijão
yi = g + eiy1 = 4 = g + e1y2 = 5 = g + e2y3 = 2 = g + e3y4 = 3 = g + e4
ei: variável aleatóriaDistribuição de ProbabilidadesE(ei), V ar(ei)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Sistema de Equações
Feijão
yi = g + eiy1 = 4 = g + e1y2 = 5 = g + e2y3 = 2 = g + e3y4 = 3 = g + e4
ei: variável aleatóriaDistribuição de ProbabilidadesE(ei), V ar(ei)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Distribuição de Probabilidades do Erro
Distribuição Normal
0.0
0.2
0.4
0.0 2.5 5.0 7.5 10.0g
ei ∼ N(µ, σ2)
Sem viés: ei ∼ N(0, σ2)
Viés? Pode ser algum efeito que não mensuramos!
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Distribuição de Probabilidades do Erro
Distribuição Normal
0.0
0.2
0.4
0.0 2.5 5.0 7.5 10.0g
ei ∼ N(µ, σ2)
Sem viés: ei ∼ N(0, σ2)
Viés? Pode ser algum efeito que não mensuramos!
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Distribuição de Probabilidades do Erro
Distribuição Normal
0.0
0.2
0.4
0.0 2.5 5.0 7.5 10.0g
ei ∼ N(µ, σ2)
Sem viés: ei ∼ N(0, σ2)
Viés? Pode ser algum efeito que não mensuramos!
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Distribuição de Probabilidades do Erro
Distribuição Normal
0.0
0.2
0.4
0.0 2.5 5.0 7.5 10.0g
ei ∼ N(µ, σ2)
Sem viés: ei ∼ N(0, σ2)
Viés? Pode ser algum efeito que não mensuramos!
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Efeito não incluído no modelo
Feijão, problema na irrigação
yi = g + eiy1 = 4 + 1 = g + e1y2 = 5 + 1 = g + e2y3 = 2 + 0 = g + e3y4 = 3 + 0 = g + e4
Claramente, o erro não é centrado em 0 (e sim em 1/2)g será superestimado se assumirmos ei ∼ N(0, σ2)Violação de suposição
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Efeito não incluído no modelo
Feijão, problema na irrigação
yi = g + eiy1 = 4 + 1 = g + e1y2 = 5 + 1 = g + e2y3 = 2 + 0 = g + e3y4 = 3 + 0 = g + e4
Claramente, o erro não é centrado em 0 (e sim em 1/2)g será superestimado se assumirmos ei ∼ N(0, σ2)Violação de suposição
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Efeito não incluído no modelo
Feijão, problema na irrigação
yi = g + eiy1 = 4 + 1 = g + e1y2 = 5 + 1 = g + e2y3 = 2 + 0 = g + e3y4 = 3 + 0 = g + e4
Claramente, o erro não é centrado em 0 (e sim em 1/2)g será superestimado se assumirmos ei ∼ N(0, σ2)Violação de suposição
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Erro centrado
g = yi =
∑yi
ne1 = y1 − ge2 = y2 − ge3 = y3 − ge4 = y4 − g
Diferença entre erro (modelo) e resíduos (após ajuste do modelo)
ei: efeito do ambiente? Não necessariamente!Variações devidas a efeitos não controlados (ou, não incluídos) nomodelo (podem inclusive ser de origem genética)
Exemplo: as linhagens sendo isolinhas, diferindo apenas para poucosQTLs
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Erro centrado
g = yi =
∑yi
ne1 = y1 − ge2 = y2 − ge3 = y3 − ge4 = y4 − g
Diferença entre erro (modelo) e resíduos (após ajuste do modelo)
ei: efeito do ambiente? Não necessariamente!Variações devidas a efeitos não controlados (ou, não incluídos) nomodelo (podem inclusive ser de origem genética)
Exemplo: as linhagens sendo isolinhas, diferindo apenas para poucosQTLs
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Erro centrado
g = yi =
∑yi
ne1 = y1 − ge2 = y2 − ge3 = y3 − ge4 = y4 − g
Diferença entre erro (modelo) e resíduos (após ajuste do modelo)
ei: efeito do ambiente? Não necessariamente!Variações devidas a efeitos não controlados (ou, não incluídos) nomodelo (podem inclusive ser de origem genética)
Exemplo: as linhagens sendo isolinhas, diferindo apenas para poucosQTLs
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Erro centrado
g = yi =
∑yi
ne1 = y1 − ge2 = y2 − ge3 = y3 − ge4 = y4 − g
Diferença entre erro (modelo) e resíduos (após ajuste do modelo)
ei: efeito do ambiente? Não necessariamente!Variações devidas a efeitos não controlados (ou, não incluídos) nomodelo (podem inclusive ser de origem genética)
Exemplo: as linhagens sendo isolinhas, diferindo apenas para poucosQTLs
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Erro centrado
g = yi =
∑yi
ne1 = y1 − ge2 = y2 − ge3 = y3 − ge4 = y4 − g
Diferença entre erro (modelo) e resíduos (após ajuste do modelo)
ei: efeito do ambiente? Não necessariamente!Variações devidas a efeitos não controlados (ou, não incluídos) nomodelo (podem inclusive ser de origem genética)
Exemplo: as linhagens sendo isolinhas, diferindo apenas para poucosQTLs
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Fundamentos
Erro centrado
g = yi =
∑yi
ne1 = y1 − ge2 = y2 − ge3 = y3 − ge4 = y4 − g
Diferença entre erro (modelo) e resíduos (após ajuste do modelo)
ei: efeito do ambiente? Não necessariamente!Variações devidas a efeitos não controlados (ou, não incluídos) nomodelo (podem inclusive ser de origem genética)
Exemplo: as linhagens sendo isolinhas, diferindo apenas para poucosQTLs
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Conteúdo
1 Análise dos Marcadores IndividualmenteIntroduçãoFundamentosAnálises Estatísticas
2 Modelos LinearesFundamentosÁlgebra de MatrizesEstimação e Testes
3 Regressão LinearResultadosReferências
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Notação matricial
Muito conveniente para operar com sistemas de equações lineares(dentre muitas aplicações)Caráter geral e abrangente
Sistema de Equações {2x1 + 3x2 = 13x1 − 4x2 = −11
Ax = b
Am,n =
[2 31 −4
]; xn,1 =
[x1x2
]; bm,1 =
[13
−11
]Am,nxn,1 = bm,1
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Notação matricial
Muito conveniente para operar com sistemas de equações lineares(dentre muitas aplicações)Caráter geral e abrangente
Sistema de Equações {2x1 + 3x2 = 13x1 − 4x2 = −11
Ax = b
Am,n =
[2 31 −4
]; xn,1 =
[x1x2
]; bm,1 =
[13
−11
]Am,nxn,1 = bm,1
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Notação matricial
Muito conveniente para operar com sistemas de equações lineares(dentre muitas aplicações)Caráter geral e abrangente
Sistema de Equações {2x1 + 3x2 = 13x1 − 4x2 = −11
Ax = b
Am,n =
[2 31 −4
]; xn,1 =
[x1x2
]; bm,1 =
[13
−11
]Am,nxn,1 = bm,1
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Notação matricial
Muito conveniente para operar com sistemas de equações lineares(dentre muitas aplicações)Caráter geral e abrangente
Sistema de Equações {2x1 + 3x2 = 13x1 − 4x2 = −11
Ax = b
Am,n =
[2 31 −4
]; xn,1 =
[x1x2
]; bm,1 =
[13
−11
]Am,nxn,1 = bm,1
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Notação matricial
Muito conveniente para operar com sistemas de equações lineares(dentre muitas aplicações)Caráter geral e abrangente
Sistema de Equações {2x1 + 3x2 = 13x1 − 4x2 = −11
Ax = b
Am,n =
[2 31 −4
]; xn,1 =
[x1x2
]; bm,1 =
[13
−11
]Am,nxn,1 = bm,1
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Notação matricial
Muito conveniente para operar com sistemas de equações lineares(dentre muitas aplicações)Caráter geral e abrangente
Sistema de Equações {2x1 + 3x2 = 13x1 − 4x2 = −11
Ax = b
Am,n =
[2 31 −4
]; xn,1 =
[x1x2
]; bm,1 =
[13
−11
]Am,nxn,1 = bm,1
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Álgebra
Soma
Am,n +Bm,n =
[1 34 2
]+
[2 40 3
]=
[3 74 5
]Subtração
Am,n −Bm,n =
[1 34 2
]−
[2 40 3
]=
[−1 −14 −1
]Transposição
A⊤ =
[1 43 2
]; B⊤ =
[2 04 3
]
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Álgebra
Soma
Am,n +Bm,n =
[1 34 2
]+
[2 40 3
]=
[3 74 5
]Subtração
Am,n −Bm,n =
[1 34 2
]−
[2 40 3
]=
[−1 −14 −1
]Transposição
A⊤ =
[1 43 2
]; B⊤ =
[2 04 3
]
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Álgebra
Soma
Am,n +Bm,n =
[1 34 2
]+
[2 40 3
]=
[3 74 5
]Subtração
Am,n −Bm,n =
[1 34 2
]−
[2 40 3
]=
[−1 −14 −1
]Transposição
A⊤ =
[1 43 2
]; B⊤ =
[2 04 3
]
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Algumas Operações
Multiplicação[1 34 2
] [2 40 3
]=
[1(2) + 3(0) 1(4) + 3(3)4(2) + 2(0) 4(4) + 2(3)
]=
[2 138 22
][1 34 2
] [23
]=
[1(2) + 3(3)4(2) + 2(3)
]=
[1114
]
x =
[12
]; x⊤x =
[1 2
] [12
]= 1(1) + 2(2) = 12 + 22 = 5
x⊤x: Soma de Quadrados
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Algumas Operações
Multiplicação[1 34 2
] [2 40 3
]=
[1(2) + 3(0) 1(4) + 3(3)4(2) + 2(0) 4(4) + 2(3)
]=
[2 138 22
][1 34 2
] [23
]=
[1(2) + 3(3)4(2) + 2(3)
]=
[1114
]
x =
[12
]; x⊤x =
[1 2
] [12
]= 1(1) + 2(2) = 12 + 22 = 5
x⊤x: Soma de Quadrados
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Algumas Operações
Multiplicação[1 34 2
] [2 40 3
]=
[1(2) + 3(0) 1(4) + 3(3)4(2) + 2(0) 4(4) + 2(3)
]=
[2 138 22
][1 34 2
] [23
]=
[1(2) + 3(3)4(2) + 2(3)
]=
[1114
]
x =
[12
]; x⊤x =
[1 2
] [12
]= 1(1) + 2(2) = 12 + 22 = 5
x⊤x: Soma de Quadrados
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Inversão
Notação: A−1
Buscar matrizA−1 tal queAA−1 = I (matriz identidade)
Não é trivial
Só é possível para matrizes de posto completo (não singulares)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Inversão
Notação: A−1
Buscar matrizA−1 tal queAA−1 = I (matriz identidade)
Não é trivial
Só é possível para matrizes de posto completo (não singulares)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Inversão
Notação: A−1
Buscar matrizA−1 tal queAA−1 = I (matriz identidade)
Não é trivial
Só é possível para matrizes de posto completo (não singulares)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Inversão
Notação: A−1
Buscar matrizA−1 tal queAA−1 = I (matriz identidade)
Não é trivial
Só é possível para matrizes de posto completo (não singulares)
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Inversão
R
> A <- matrix(c(1,4,3,2),2)> A
[,1] [,2][1,] 1 3[2,] 4 2> solve(A)
[,1] [,2][1,] -0.2 0.3[2,] 0.4 -0.1> A %*% solve(A)
[,1] [,2][1,] 1 -5.551115e-17[2,] 0 1.000000e+00
> B <- matrix(c(2,1,3,-4),2)> B
[,1] [,2][1,] 2 3[2,] 1 -4> solve(B)
[,1] [,2][1,] 0.36363636 0.2727273[2,] 0.09090909 -0.1818182> B %*% solve(B)
[,1] [,2][1,] 1 0[2,] 0 1
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Inversão
R
> C <- matrix(c(4,2,8,4),2)> C
[,1] [,2][1,] 4 8[2,] 2 4> solve(C)Erro em solve.default(C) :Lapack routine dgesv: system is exactly singular: U[2,2] = 0
> det(C)[1] 0> det(A)[1] -10
Pergunta: Matriz C : duas equações e duas incógnitas?
Resp.: Não, única equação: sistema inconsistente ou indeterminado
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Inversão
R
> C <- matrix(c(4,2,8,4),2)> C
[,1] [,2][1,] 4 8[2,] 2 4> solve(C)Erro em solve.default(C) :Lapack routine dgesv: system is exactly singular: U[2,2] = 0
> det(C)[1] 0> det(A)[1] -10
Pergunta: Matriz C : duas equações e duas incógnitas?
Resp.: Não, única equação: sistema inconsistente ou indeterminado
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear
Álgebra de Matrizes
Inversão
R
> C <- matrix(c(4,2,8,4),2)> C
[,1] [,2][1,] 4 8[2,] 2 4> solve(C)Erro em solve.default(C) :Lapack routine dgesv: system is exactly singular: U[2,2] = 0
> det(C)[1] 0> det(A)[1] -10
Pergunta: Matriz C : duas equações e duas incógnitas?
Resp.: Não, única equação: sistema inconsistente ou indeterminado
Análise dos Marcadores Individualmente Modelos Lineares Regressão Linear