Econometria para o BACEN Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00 Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 1 de 43 AULA 00: REGRESSÃO SIMPLES SUMÁRIO PÁGINA 1. Introdução ao Método de Regressão 5 2. Estimação com base em amostra e Método dos Mínimos Quadrados Ordinários (MQO) 8 3. Tabela ANOVA 15 4. Teste de hipóteses sobre os coeficientes 25 5. Lista das questões apresentadas com gabarito 36 6. Gabarito 43 Olá pessoal! Estão prontos para embarcarmos juntos nesta difícil jornada que leva à aprovação em um concurso público? Então vamos lá! Bom pessoal, primeiro que gostaria de bater um papinho com vocês. - “Mas, afinal de contas, quem é você professor?” Boa pergunta! Meu nome é Jeronymo Marcondes Pinto e já tenho uma grande bagagem no que se refere a concursos públicos. Sou Economista, Mestre e Doutor em Economia Aplicada pela Universidade de São Paulo (USP) e, atualmente, sou Auditor Fiscal do Trabalho (AFT), atuando na área de planejamento e análise econômica e estatística da Secretaria de Inspeção do Trabalho (SIT – MTE sede). Já fiz muitos concursos, tendo sido aprovado em vários, como Auditor Fiscal do
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 1 de 43
AULA 00: REGRESSÃO SIMPLES
SUMÁRIO PÁGINA
1. Introdução ao Método de Regressão 5
2. Estimação com base em amostra e Método dos Mínimos
Quadrados Ordinários (MQO) 8
3. Tabela ANOVA 15
4. Teste de hipóteses sobre os coeficientes 25
5. Lista das questões apresentadas com gabarito 36
6. Gabarito 43
Olá pessoal! Estão prontos para embarcarmos juntos nesta difícil jornada que leva à
aprovação em um concurso público? Então vamos lá! Bom pessoal, primeiro que
gostaria de bater um papinho com vocês.
- “Mas, afinal de contas, quem é você professor?”
Boa pergunta! Meu nome é Jeronymo Marcondes Pinto e já tenho uma grande
bagagem no que se refere a concursos públicos. Sou Economista, Mestre e Doutor
em Economia Aplicada pela Universidade de São Paulo (USP) e, atualmente, sou
Auditor Fiscal do Trabalho (AFT), atuando na área de planejamento e análise
econômica e estatística da Secretaria de Inspeção do Trabalho (SIT – MTE sede).
Já fiz muitos concursos, tendo sido aprovado em vários, como Auditor Fiscal do
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 2 de 43
Tesouro Estadual (SEFAZ\RS), Analista de Planejamento, Orçamento e Finanças
Públicas (SEFAZ SP), Economista do MPU, Economista da Câmara Municipal de
São Paulo, Professor universitário da Academia da Força Aérea (AFA), dentre
muitos outros. Porém, já fui reprovado em concurso também!
- “Professor, por que você está nos contando de reprovações, isso não te diminui?”
Muito pelo contrário! Posso dizer que a maior parte da minha experiência deriva do
não sucesso! Aprendi muita coisa ao não ser aprovado, coisas que fizeram com que
eu me tornasse um verdadeiro concurseiro! Ao longo do curso estarei dando “dicas
de concurseiro” para vocês, o que os ajudará nos seus planejamentos, estratégias,
etc.
Vamos falar um pouquinho do Banco Central (BACEN). Sem dúvida nenhum, uma
das melhores instituições para se trabalhar no Brasil, ótima remuneração, condições
de trabalho e grandes possibilidades para crescimento na carreira! Em
contrapartida, concurso muito concorrido e com candidatos de altíssimo nível!
- “Professor, é verdade que só pessoas com mestrado e doutorado passam no
BACEN? Eu ouço o pessoal falar isso nos fóruns, nas conversas de corredor, etc...”
Vou deixar isso muito claro: NÃO! Isso é boato dos grandes, tire isso da sua cabeça
agora! Tenho vários conhecidos no BACEN que sequer têm intenção de fazer
mestrado. Isso é bobeira!
DICA DE UM CONCURSEIRO Gente, o “perdedor” não é aquele que não vence, mas aquele que não tenta por ter medo de perder! Não tenha medo de não ser aprovado, faça o seu melhor! O medo fará com que você desperdice chances que podem mudar a sua vida, além de fazer com que você se esforce menos... o que é, de longe, o principal para ser aprovado!
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 3 de 43
Vamos falar do edital de Econometria, afinal, é para isso que estamos aqui!
- “Que edital pequeno! Vai ser fácil”
Quem está pensando isso, pense de novo! Esta é, provavelmente, a matéria mais
difícil da Área 2. Há conteúdos neste edital que são muito complexos, como o vetor
autoregressivo, por exemplo. Eu tenho duas notícias para vocês, uma boa e uma
ruim.
Primeiro a ruim. Esta matéria é muito complexa, exigindo conhecimentos prévios de
estatística (que vocês devem estar estudando) e muito esforço! Esta matéria
assusta muita gente.
Agora a boa. Vocês vão aprender! Eu não estou sugerindo, estou afirmando. A
única coisa que peço é o seu esforço na leitura das aulas e resolução dos
exercícios, pois econometria só se aprende com exercícios!
Uma estratégia de análise interessante é olhar os dois últimos editais de um
determinado concurso. No caso do BACEN, os editais estão exatamente iguais, o
que sugere que há uma tendência de o BACEN exigir que a banca mantenha o seu
estilo de provas.
ECONOMETRIA: 1. Regressão simples e múltipla. 2. Modelos com variáveis defasadas. 3. Séries temporais. 4. Vetor autoregressivo. 5. Processos estocásticos, estacionaridade. 6. Cointegração e correlação de erros. 7. Métodos de estimação. 8. Números índices.
DICA DE UM CONCURSEIRO Muita gente não presta atenção nos editais. As pessoas dão uma lida por cima e acham que está bom. Elas estão erradas! Leia o edital com MUITA calma (mais de uma vez), pois, se você não o fizer, é muito provável que você acabe estudando matérias inúteis para a prova. O que o seu inimigo (a banca) vai fazer está no edital. Ao longo do curso você vai ver porque estou falando isso, apesar de parecer óbvio, mas, garanto, não é!
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 4 de 43
O cronograma do curso será o seguinte:
Pessoal, não se preocupem!!! Caso a prova ocorra antes de 11/06/2013, eu adiantarei as aulas. Nós vamos ver tudo mesmo!
Veja que a área “Regressão Múltipla” leva 4 aulas! Isso porque o edital não diz, mas
as provas cobram “violação das hipóteses básicas” em regressão múltipla, mas não
falam isso no edital. Grande sacanagem! Além disso, será necessário um
conhecimento prévio de álgebra matricial, cobrado, inclusive, no último concurso,
que terei que dar uma base para vocês!
Bom, chega de papo, vamos trabalhar!
AULA MATÉRIA DATA
00 Regressão Simples 18/02/2013
01,02, 03 e 04 Regressão Múltipla e
Métodos de Estimação 05/03/13, 19/03/2013,
02/04/2013 e 16/04/2013
05 e 06
Modelos com Variáveis Dependentes Defasadas,
Séries Temporais e Processos Estocásticos e
Estacionariedade
30/04/2013 e 14/05/2013
07 Cointegração e Correção
de Erro e Vetor Autoregressivo
28/05/2013
08 Números Índices 11/06/2013
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 5 de 43
1. Introdução ao método de Regressão
Pessoal, hora de forçar a memória escolar e lembrar o que é uma função, ou
melhor, uma função linear. Função é uma relação entre duas variáveis, como por
exemplo:
a)Vendas de uma empresa e gastos em propaganda;
b)Aumento de peso de uma pessoa e quantidade de comida ingerida;
c)Valor da conta de energia e número de equipamentos elétricos em uma casa.
Se chamarmos a primeira variável de cada item de y e a segunda de x,
matematicamente, pode-se descrever tal relação como:
y = f(x).
O que quer dizer “y é função de x”, ou que as vendas de uma empresa é uma
função da quantidade investida em propaganda. Pode-se afirmar que y depende de
x, portanto, a nomenclatura usual chama y de variável dependente ou explicada e x
de variável independente ou explicativa.
Uma das formas de se expressar tal função é a partir de uma relação linear, tal
como:
y = 2 + 3x.
Ou, genericamente, para qualquer valor que pudesse substituir 2 e 3 na equação
acima:
y = α + βx. (1)
Este é um exemplo de uma função linear, dado que o expoente de x é 1. (lembrem-
se que qualquer variável elevada a 1 é igual à própria variável). Esta função linear
(lembrem-se da escola) é uma reta. Se x estivesse elevado ao quadrado, seria uma
parábola. Para que você tenha certeza que isso é uma reta, substitua alguns valores
na primeira equação e os coloque em um gráfico, você verá que se trata de uma
equação de reta.
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 6 de 43
- “Professor, ótimo, mas por que você está falando tudo isso?”
Porque, meus queridos alunos, um dos principais objetivos da econometria é
encontrar uma função linear que descreva o comportamento estatístico entre duas
variáveis. Assim, com base em uma série estatística, a econometria possibilitaria
que você encontrasse os valores de α e β na equação (1).
O processo de encontrar a relação entre y e x é chamado de Regressão e,
se for uma reta, como na equação (1), é chamado de Regressão Linear.
Como a equação (1) só possui uma variável explicativa, o processo de
encontrar tal relação se chama Regressão Linear Simples.
Porém, perceba que é muito raro que uma variável do mundo real, ainda mais
quando ligada à economia ou a fenômenos sociais, consiga ser representada por
uma reta. Vamos supor que estamos tratando do exemplo (a) acima descrito para o
ano de 2012 e que possuímos dados de todas as vendas de todas as empresas de
um determinado setor e de todos os gastos de propaganda efetuados por estas
empresas.1 Colocando tal relação em um gráfico:
A reta é representada pela equação (1) e os pontos são os valores que y assume
para cada x.
1 Gente, só para chamar a atenção, por enquanto estamos trabalhando com dados coletados em um único período de tempo, no caso uma única observação por empresa no ano de 2012 (pode ser a soma de todo o ano, ou de um determinado mês, etc.) Este tipo de disposição de dados é chamado de dados em cortes transversais ou “cross section”. Nós só veremos observações ao longo do tempo na seção de séries temporais.
0
2
4
6
8
10
12
14
0 10 20 30 40 50 60
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 7 de 43
E aí pessoal, o que vocês estão vendo? Veja que a reta explica bem o
comportamento da variável, se aproximando dos valores reais, mas ainda assim não
explica tudo. Olhe o 3º ponto, nele o valor das vendas aumentou, na média, muito
mais do que o esperado para um determinado investimento em propaganda. Isso
pode ser decorrência de muitos fatores do mundo real, como o fato de que a
empresa talvez fosse muito desconhecida até então, portanto, um pequeno
investimento em propaganda teve resultados muito grandes quando comparado a
empresas que já são relativamente conhecidas. Este tipo de raciocínio pode ser
aplicado para os pontos abaixo da reta também, que apresentam, na média,
retornos abaixo do esperado para um determinado gasto em propaganda.
Assim, se uma versão linear e simples da equação de reta for a mais bem ajustada
à série de dados, pode-se inferir que a equação que representa a real dinâmica do
fenômeno em estudo, no caso, as vendas da empresa é dada por:
Sendo ε o termo que representa o “erro”, ou seja, os desvios das observações com
relação à reta (pensem comigo, o erro é a distância da reta até cada um daqueles
pontos no gráfico acima). O subscrito “i” se refere à cada uma das empresas
analisadas em 2012, isto é, a empresa representada no primeiro ponto no gráfico
tem subscrito (1), a segunda subscrito (2) e assim por diante.
Vocês concordam comigo que não dá para levar em conta todas as variáveis que
afetam o comportamento das vendas de todas as empresas? Pode ser que um
gerente comercial muito bom de serviço tenha pedido demissão da empresa (4), o
que puxaria suas vendas para baixo, apesar do investimento em propaganda, etc.
Assim, o erro leva em conta estes efeitos impossíveis de se mensurar, mas que
afetam a dinâmica de y.
Bom, apesar do fato de que este erro é algo que nós temos que aprender a viver
com ele, o mesmo possui uma característica interessante que nós temos que levar
em conta:
( )
Isto é, a média dos erros é igual a zero. Ou seja, os desvios “para cima da reta”
igualam o valor dos desvios” para baixo da reta” na média.
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 8 de 43
Ou seja, estes erros são supostamente aleatórios, então a teoria econométrica nos
permite inferir que, se o modelo estiver corretamente especificado o erro será, na
média, igual a zero.
E aí rapaziada, que cara de sono é esta? Vamos acordando, pois um futuro analista
do BACEN não pode dormir em serviço! Você será bem remunerado e com status,
mas com muita responsabilidade.
2. Estimação com base em amostra e Método dos Mínimos Quadrados Ordinários (MQO)
Vamos ver se vocês estão realmente atentos: lembram-se quando eu disse que a
regressão tinha a ver com todas as empresas, todas as receitas de vendas e todos os gastos em propaganda? Então, hora de lembrar um pouquinho do curso de
estatística do Estratégia, o conceito de população e amostra.
Atenção, até agora falamos de uma regressão com a população, ou universo, das
variáveis escolhidas. Mas, na maioria dos casos, não possuímos o universo. Por
exemplo, no caso de uma regressão do valor salarial obtido por um trabalhador em
função do nível de escolaridade de cada um destes, é praticamente impossível se
realizar este exercício, pois a base de dados para isto é infinitamente grande.
Assim, na maior parte das vezes, o pesquisador acaba trabalhando com uma
População = conjunto de todos os elementos que possuem determinada característica. No exemplo anterior, todas as empresas, gastos e receitas. Amostra = parte não nula da população, mas menor do que esta última.
( )
1ª hipótese sobre o modelo de regressão:
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 9 de 43
amostra! Ao se avaliar uma regressão para uma amostra estaremos a estimar os parâmetros de regressão (α e β na equação (1)), ou como nós falamos no dia a
dia, estimar uma regressão.
- “Tá bom Professor, mas, afinal de contas, como se estima uma regressão?”
Ótimo! Tente imaginar um momento: a estimativa dos parâmetros deve ser feita de
forma a garantir o que?
É isso! De forma a minimizar os erros. Isso é feito pelo método dos Mínimos
Quadrados Ordinários (MQO) que nos dá um valor estimado para α e β, que,
chamaremos, a partir daqui, de e .
Com base no fato de que a média dos erros é igual a zero, não há como se
minimizar a soma dos erros, dado que o valor sempre será zero. Assim, o objetivo
do método é minimizar a soma dos quadrados dos erros, o que é feito pelo
estimador de MQO. Gente, sejamos práticos, nunca caiu e, provavelmente, nunca
vai cair a derivação do estimador de MQO, assim, decorem:
Sendo que o travessão sobre determinada variável representa o valor médio da
mesma, define-se a média de uma variável, bem como o valor de uma variável
centrada na média:
Assim, b pode ser encontrado pelo somatório da multiplicação de cada
com seu respectivo (covariância entre x e y) dividido pela soma de todos os
( )
( )
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 10 de 43
elevados ao quadrado (variância de x). Gente, muita atenção mesmo, perceba que
as variáveis devem ser inseridas na fórmula acima de forma a estarem centradas na
média, ou seja, reduzidas do valor da média de sua série.
No caso da segunda equação, que define α (também chamado de intercepto), há
uma forma específica, mas ela é um pouco esquisita e eu acho que esta forma
facilita a memorização, dado que com os valores médios das variáveis e com a
estimativa de b, encontra-se .
Exercício 1.
Só para vocês ficarem contentes em ver uma aplicação prática, vamos fazer um exemplo. Vamos lá! Dada a seguinte série de dados, estime a regressão linear Y = f(X), ou costumeiramente chamada de “Y contra X”.
Variáveis X Y
103 160
123 167
145 207
126 173
189 256
211 290
178 237
155 209
141 193
156 219
166 235
179 234
197 273
204 272
125 181
112 166
107 161
135 195
144 201
188 255
Soma 3084 4284
Média 154,2 214,2
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 11 de 43
Resolução
Bom, primeiramente, vamos encontrar alguns dados necessários para a resolução.
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 12 de 43
Voltando à aula!
Pessoal, vocês estão entendendo o que representa cada coeficiente? Pense um
pouquinho, se o valor gasto em propaganda aumenta em 1 (uma unidade), espera-
se que o valor das vendas varie, na média, em b.
Cabe destacar a diferença entre erros e resíduos. Os erros são decorrentes dos
aspectos que relatamos acima, já os resíduos são os erros de ajuste após a estimação da reta original (1), ou seja, na regressão feita com base na amostra e
não mais na população. Assim, a versão estimada de (1) é dada por:
(2)
Então, estes parâmetros são a versão estimada dos parâmetros na equação (1).
Portanto, são os resíduos da regressão com base em uma amostra n da
população N.
Meus amigos, vocês conseguem enxergar que este resíduo tem mais um problema
além dos já citados para os erros? Lembra do gerente comercial eficiente que pediu
demissão? Então, este é um desvio natural de se interpretar um comportamento
econômico, derivado de influências de infinitas variáveis, a partir de uma reta.
Agora, há outro fator em cena, há um “erro” decorrente de se inferir uma estimativa
da reta (1) a partir de (2). Ou seja, o fato de nós só termos uma amostra leva a
desvios com relação à estimativa dos parâmetros. Dado que, com base na nossa
regressão estimada, o valor esperado de y é:
Assim, os resíduos são:
( )
Bom pessoal, nós já temos uma estimativa de uma regressão, agora vocês podem
estar se perguntando: “Será que isso está bom? Será que esta reta representa bem
a situação ocorrida no mundo real?”
Então, há diversas formas, que devem ser avaliadas de forma conjunta, para
responder tal pergunta, mas vamos adiantar algumas.
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 13 de 43
Entenderam? Vamos ver:
Exercício 2
(FCC - ANALISTA BACEN 2005) Uma empresa com a finalidade de determinar a relação entre os gastos anuais com propaganda (X), em R$ 1000,00, e o lucro bruto anual (Y), em 1000,00, optou por utilizar o modelo linear simples Y(i) = a + bX(i) + e(i), em que Y(i) é o valor do lucro bruto auferido no ano (i), X(i) é o valor do gasto com propaganda no ano (i) e e(i) o erro aleatório com as respectivas hipóteses consideradas para a regressão linear simples.
Considerou, para o estudo, as seguintes informações referentes às observações dos últimos 10 anos da empresa:
Utilizando a equação da reta obtida pelo método dos mínimos quadrados, tem-se que, caso haja um gasto anual com propaganda de 80 mil reais, a previsão do lucro bruto anual, em mil reais, será de:
a) 158
b) 128,4
c) 121
d) 102,5
e) 84
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 14 de 43
Resolução
Bom, primeiramente, não caia na armadilha! Estes valores que o exercício te deu
não estão centrados na média. Portanto, com base em propriedades estatísticas,
pode-se demonstrar que:
( )
Assim, dadas as formas funcionais para cálculo:
Pode-se inferir as estimativas:
( )
Assim, temos a equação de reta. Substituindo X = 80, tem-se que:
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 15 de 43
3. Tabela ANOVA
Vamos lá pessoal, de olho na aprovação!
Agora vamos falar sobre o grau de ajustamento de uma regressão. Isso é, quanto
uma reta explica dos dados?
Bom, é fácil pensar que há uma parcela da variação explicada pela regressão, ou
seja, aqueles parâmetros que nós estimamos devem explicar parte da variação real
nas observações da amostra, excluída a parte explicada pelos resíduos.
-“Professor, não entendi nada!”
Ok. Acho que esta parte que fica mais intuitiva com a matemática. E aí, qual a
expressão que vocês acham que representa a parcela explicada por uma
regressão? Claro que é:
Dado que α é constante, ela não compõe a parte da variância explicada. Assim, com
o intuito de se definir uma expressão para a variância explicada pode-se descartá-
la:
Portanto, trata-se da parte estimada da reta que dá o valor previsto de y para cada
x, que é costumeiramente descrita como a variável dependente com um acento
circunflexo em cima.
E a parte não explicada?
É evidente que a soma de ambas as equações geram a equação de reta original,
com a soma do comportamento dos resíduos com a parte explicada. Assim,
precisaríamos somar tais expressões para encontrar o total e, a partir daí, tentar
entender como cada uma destas parcelas compõem a tal parcela.
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 16 de 43
Mas, sabendo-se que os resíduos tem soma igual a zero, o estudo será feito com
base na soma dos quadrados dos resíduos e, por conseqüência, com base na
soma dos quadrados explicados e na soma dos quadrados totais.
Vamos, primeiro, pelo mais fácil. A soma dos quadrados totais (SQT) é:
Segue-se a Soma dos Quadrados Explicados (SQE):
E a Soma dos Quadrados dos Resíduos (SQR):
Vocês estão entendendo o que nós estamos fazendo? Em termos bem leigos, nós
estamos decompondo o quanto uma regressão consegue explicar de quanto ela não
consegue! Será que você consegue pensar em um jeito de dizer, em termos percentuais, o quanto uma regressão consegue explicar de uma série de dados, ou
seja, o quanto a regressão estimada se aproxima do real processo gerador de
dados (equação (1))?
Beleza! A resposta é fácil mesmo e é dada por:
( )
( ) ( )
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 17 de 43
Este é o famoso R² ou coeficiente de determinação. Ele determina “o quanto a
regressão está conseguindo refazer da série original a partir de valores estimados”.
Assim, a regressão será bem ajustada quanto mais próximo este coeficiente se
aproximar de 1. Ou seja, um valor de 0,97 indica que a regressão estimada 97% da
variância de y é explicada por x.
Vocês se lembram do coeficiente de correlação amostral nas aulas de estatística?
Então, pode-se demonstrar que:
√ | |
Esta é, somente, uma das formas de se encontrar o R². Mas, ela já caiu várias
vezes, então, meus amigos, vou simplificar para vocês: decorem! No exercício (10),
vou ensinar outra forma importante também. Mas, aconselho tentar fazê-lo primeiro!
Agora podemos partir para a análise da tabela ANOVA. A partir da definição de
SRT, SQT e SQE, iremos construir uma tabela que indica como as parcelas
decompostas variam ao redor da média da regressão como um todo e se todos os
coeficientes em conjunto tem capacidade de explicar a regressão, o que será mais
útil a partir da próxima aula, conforme veremos a seguir.
Esta tabela é chamada de ANOVA e tem o seguinte formato:
Soma dos Quadrados Graus de Liberdade Quadrados Médios Teste F
SQE K
SQR N – k – 1
SQT N – 1
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 18 de 43
Sendo N o número de observações da amostra e k o número de variáveis
explicativas na regressão, assim, no caso da regressão simples, k = 1.
Novamente pessoal, vamos nos lembrar das aulas de Estatística do Estratégia.
Sendo SQR a soma dos quadrados dos resíduos e sua média igual a zero, se nós
dividirmos tal expressão pelos seus graus de liberdade, o que teríamos?
O que é isso? Não é a variância? Exatamente! Trata-se de uma medida não
tendenciosa da variância dos erros. Portanto, o quadrado médio dos resíduos
iguala a variância dos erros. O mesmo pode ser dito com relação ao coeficiente
SQE/k, haja vista o mesmo medir também uma variância, mas a variância explicada.
Bom, nós já temos a variância dos erros e a variância explicada pela regressão,
dada por
, portanto cabe questionar: será que a esta regressão faz sentido?
Não entendeu? Vamos lá. Nós poderíamos encontrar uma regressão na qual os
quadrados médios dos resíduos (variância dos erros) representam a maior parte da
variabilidade da regressão, invalidando a representatividade da regressão como um
processo que poderia ter gerado aquelas variáveis explicadas. Assim, a parte que
se constitui como uma reta (bx) só explicou alguma parte da variável explicada “por
coincidência”, isto é, sem significância estatística.
Como nós podemos verificar isso? Novamente, lembrem-se das aulas de
Estatística, agora, no caso, do teste F. Só para lembrar, o teste F é um teste
estatístico que visa comparar variâncias e se a diferença entre ambas é
estatisticamente significante. Analiticamente, sob a hipótese nula, o quociente entre
dois quadrados médios, isso é, entre duas variâncias, segue uma distribuição F.
A título de ilustração vamos nos utilizar da tabela ANOVA que nós construímos.
Portanto:
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 19 de 43
Sob a hipótese nula de que estas duas variâncias são iguais, a estatística de teste
segue uma distribuição F com k graus de liberdade no numerador e N - k – 1 graus
de liberdade no denominador.
O que você está buscando? Bom, quando você estima uma regressão, você busca
encontrar uma relação estatisticamente significante que explique o fenômeno que
está em estudo. Assim, se você concluir que não há como rejeitar a hipótese nula
de que a variância explicada pela sua regressão é igual à variância dos resíduos, na
verdade, você não encontrou nada! Isso deriva do fato de que, se isso aconteceu, é
muito provável que toda parcela que você conseguiu explicar da variável
dependente foi por acaso, o que deve ter acontecido somente em virtude da
variação dos erros e não de uma especificação correta de uma reta. Ou seja, toda
sua regressão não tem grande validade em termos de explicar a dinâmica da
variável dependente em estudo.
Portanto, o teste F aplicado ao estudo de regressão é equivalente a um teste de
hipóteses conjunto de que todos, ou parte de todos, os coeficientes têm valor igual
a zero.
É pessoal, o buraco é mais embaixo mesmo! Olhe só
isso: o teste F é um teste de comparação de variâncias, porém o mesmo pode
ser utilizado para fazer testes sobre médias.
Isso é possível se você pensar em termos de desvios de uma média. Veja, por
exemplo, o caso em que você queira testar a diferença da produtividade média de
várias empresas. Primeiramente, você vai dividir estas empresas por grupos de
atividade e a sua suposição inicial será de que não há diferenças na média de
produtividade entre os diversos setores. Assim, você pode decompor a variabilidade
das produtividades encontradas com relação à média em duas parcelas:
Desvio da Média total (DM) = DM dentro do Setor + DM entre Grupos
Assim, nós iríamos avaliar se o quanto as observações estão desviando das médias
dos seus respectivos grupos (dentro de cada setor) se iguala aos desvios que as médias dos grupos estão tendo com relação à média do somatório de todos os grupos, ou seja, da média de toda a amostra (média da economia em análise)!
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 20 de 43
Então, se você concluir que não há diferença entre estes dois desvios é equivalente
a dizer que as médias de todos os grupos são iguais.
Entenderam o conceito do problema? Mas, como se utilizar do teste F para se
chegar a tal diagnóstico, afinal, o teste F é para comparação de variâncias. Mas,
atenção, qual é a variável em análise aqui? É isso mesmo, o desvio com relação à
média. Por suposição, vamos trabalhar com uma variável x:
Ok. E se nós fizermos a soma dos quadrados de DM ?
( )
Se nós dividirmos tal expressão pelos seus graus de liberdade, isso não é a
variância? Exatamente!
Assim, ao se utilizar da Soma dos Quadrados dos DM entre setores como nosso
SQE e da Soma de Quadrados dos DM dentro dos setores como nosso SQR,
podemos construir a tabela ANOVA. A análise desta tabela e do teste F nos permite
inferir se há diferenças entre os quadrados destes dois desvios, que nada mais é
que a variância. Caso não seja possível rejeitar a hipótese nula de que as variâncias
são iguais, você concluiu que as médias dos setores são iguais à média da amostra
e, portanto, iguais entre si.
Complicadinho né? Vamos fazer um exercício para entender.
Exercício 3.
(CESGANRIO – BACEN/2010)
Fonte de Variação
Soma dos Quadrados
Graus de Liberdade
Média de Quadrados
F
Fator 6752,0 2
Erro 30178,0
Total 36930,0 29
Analisando a tabela ANOVA acima, considere as conclusões a seguir:
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 21 de 43
I – A análise de variância (ANOVA) teste se várias populações têm a mesma média; para tanto, são comparadas a dispersão das médias amostrais e a variação existente dentro da amostra
II – ANOVA indica que:
III – A estatística F, calculada com a informação da tabela acima, é acima 2,651 e deve ser comparada com o valor tabelado F(2,29) para um grau de significância escolhido.
É correto APENAS o que se conclui em:
a) I
b) III
c) I e II
d) I e III
e) II e III
Resolução
Com base em toda aquela discussão sobre o teste F e na sua capacidade de ser
utilizado para testar se as médias de uma determinada população são iguais,
vejamos:
a) Verdadeiro. É exatamente isso. Nós vamos comparar a dispersão das médias
amostrais, no nosso exemplo, DM entre os setores, e a variação dentro da amostra,
DM dentro do setor.
b) Verdadeiro. A hipótese nula se refere à igualdade de variâncias dos Quadrados
Médios calculados na ANOVA. Assim, tal hipótese é equivalente a estabelecer que
as médias dos setores sejam iguais, no nosso exemplo. A hipótese alternativa, por
conseqüência, é o seu oposto.
c) Falso. Sejam espertos, você nem precisa calcular nada, o teste F tem seus graus
de liberdade determinados pelo número de graus de liberdade do numerador e do
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 22 de 43
denominador do teste, respectivamente. O teste F, no caso, deveria ser calculado
com base em SQT e SQR, que, na questão, é representado pelas expressões fator
e erro, respectivamente. Assim, o teste F deve ser calculado com base nos
seguintes graus de liberdade: (2,27).
Exercício 4
Vamos lá galera, utilizando os dados do exercício (1), construa a tabela ANOVA para aquele caso.
Resolução
Com base na tabela do exercício (1), vamos definir SQT:
. Já para o caso de SQE:
( )
Assim, pode-se obter SQR:
Os graus de liberdade poder ser retirados diretamente do número de variáveis
explicativas (k = 1) e do número de observações na amostra (N = 20). Assim, a
tabela ANOVA fica da seguinte forma:
Soma dos Quadrados Graus de Liberdade Quadrados Médios Teste F
30893,12 1
30893,12
896,75
620,08 18
34,45
31513,2 19
1658,59
Como o valor tabelado de F com 1 grau de liberdade no numerador e 18 no
denominador é igual a 4,41, rejeita-se a hipótese nula de que a Variância Explicada
é igual à Variância dos resíduos (dado que 896,75 > 4,41).
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 23 de 43
Voltando à aula!
Antes de encerrarmos o assunto sobre o teste F, temos
de ressaltar uma coisa importante. A teoria estatística por detrás da derivação do
teste exige que a variável y seja normalmente distribuída.
Todo mundo se lembra da distribuição normal da aula de estatística, certo? Trata-se
de uma distribuição de probabilidade, que associa determinado valor a determinada
probabilidade da seguinte forma:
Já que y é composto de uma parte fixa (reta) e de uma parte aleatória (erro), a
variância da variável explicada é igual à variância do erro. Assim, a hipótese de
normalidade de y é equivalente a se afirmar que o erro tem de ser normalmente
distribuído. Portanto, esta será nossa segunda hipótese sobre o modelo de
regressão.
Um exercício para testar o seu conhecimento.
2º Hipótese sobre o modelo de regressão
Os erros são normalmente distribuídos
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 24 de 43
Exercício 5.
(FCC - ANALISTA BACEN 2005) Uma empresa com a finalidade de determinar a relação entre os gastos anuais com propaganda (X), em R$ 1000,00, e o lucro bruto anual (Y), em 1000,00, optou por utilizar o modelo linear simples Y(i) = a + bX(i) + e(i), em que Y(i) é o valor do lucro bruto auferido no ano (i), X(i) é o valor do gasto com propaganda no ano (i) e e(i) o erro aleatório com as respectivas hipóteses consideradas para a regressão linear simples.
Considerou, para o estudo, as seguintes informações referentes às observações dos últimos 10 anos da empresa:
Montando o quadro de análise de variância (ANOVA), tem-se que:
a) a variação total apresenta um valor de 62,5.
b) a variação explicada, fonte de variação devido à regressão, apresenta um valor igual a 80.
c) Dividindo a variação residual pela variação total, obtemos o coeficiente de determinação (R²).
d) o valor da estatística F necessária para o teste da existência da regressão é igual ao quociente da divisão da variação explicada pela variação residual.
e) a variação residual apresenta um valor igual a 17,5.
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 25 de 43
Resolução
Vamos começar definindo SQT, SQE e SQR:
( )
Assim, chega-se ao gabarito (e). Sabe-se que a alternativa (c) está incorreta porque
o R² surge da divisão da variação explicada pela total, enquanto que a alternativa
(d) advém da divisão dos quadrados médios explicados e dos resíduos e não
somente da variação.
4. Teste de hipóteses sobre os coeficientes
E ai pessoal? Ainda estão aí? Bom para acordar uma dica de concurseiro.
Bom, vamos lá!
Na última seção nós vimos como o teste F avalia a hipótese conjunta de que todos
os coeficientes têm valor igual a zero. Agora vamos avaliar a significância estatística
dos coeficientes, um por um. Com efeito, vamos avaliar a significância estatística de
b isoladamente, tal como na equação (2)
Dica de um Concurseiro Lembrem-se, a quantidade de horas estudadas não é tão importante quanto a regularidade de estudo. Você precisa se condicionar, acostumar seu cérebro com as informações. O que eu quero dizer é: não adianta estudar 12 horas em um dia e depois ficar 2 semanas sem estudar. Você vai perder o ritmo. Tente ter alguma regularidade nos seus estudos. Crie uma rotina. Viva, coma e respire concurso público. Não estou dizendo que uma boa rachada não ajuda, só estou pregando a necessidade de uma regularidade no planejamento de seus estudos. Isso é o básico da teoria da Administração: primeiro planejar, depois executar. Isso serve para concursos.
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 26 de 43
- “Peraí professor, mas você acabou de ensinar a aplicação do teste F na regressão
simples e disse que ele avalia a hipótese nula de que todos os coeficientes são
iguais a zero, ou seja, b é igual a zero. Então qual a diferença deste teste de
hipóteses para o teste F?”
Se você pensou isso, parabéns! Já está a caminho de ser um grande analista do
BACEN.
Pois é, realmente, no caso da regressão linear simples não há diferença. Mas, a
regressão simples não é a única forma de regressão possível. Nós estudaremos a
partir da próxima aula a regressão múltipla, que, no caso, depende de mais de um x.
Por exemplo:
Assim, por exemplo, as vendas de uma empresa podem ser função não somente
dos gastos em propaganda, mas também do investimento em treinamento de
pessoal, da parcela do mercado dominada por ela, etc. Este é um caso de
Regressão Linear Múltipla.
Neste caso, é fácil perceber que o resultado do teste F não é equivalente ao
encontrado nos testes de hipótese sobre b. O teste de hipóteses sobre os
coeficientes analisa a significância estatística de cada coeficiente isoladamente,
enquanto que o teste F analisa a significância estatística conjunta de todos os coeficientes ao mesmo tempo.
Então meus amigos, agora que vocês entenderam o porquê do teste de hipóteses,
além do teste F, vamos entender como operacionalizá-lo.
Novamente, vamos nos lembrar das aulas de estatística. Mas, vamos dar uma
pincelada de forma genérica primeiro.
A idéia básica do teste de hipóteses é afirmar se a ocorrência de um evento tem
uma probabilidade estatística significante, dado um valor de significância, ou seja,
um valor que seria considerado “muita coincidência”.
Vamos para um exemplo prático de nossa aula. Com base na nossa amostra e na
regressão estimada, será que os gastos em propaganda realmente afetam as
vendas da empresa? Isso seria equivalente a estipular duas hipóteses, uma
hipótese nula ( ) e outra alternativa ( ) de tal forma que:
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 27 de 43
A estatística de teste deve ser calculada da seguinte forma:
Sendo s o valor estimado para o desvio padrão do parâmetro, que, por se tratar de
uma amostra, é desconhecida.2
A estimativa para a variância de b é dada por:
Ao calcular a estatística de teste, cabe compará-la com o valor tabelado da
distribuição t de Student, distribuição esta que é utilizada para os casos em que a
variância populacional não é conhecida. Assim, é preciso fazer o cálculo acima e
consultar tabela t com N-k-1 graus de liberdade e com a significância estatística que
você achar conveniente.3 Olhe o gráfico abaixo.
2 Lembrem-se, o desvio padrão é igual à raiz quadrada da variância. 3 A consulta na tabela irá depender dos graus de liberdade dos quadrados médios dos resíduos e da significância estatística que o pesquisador achar relevante, como 5%, por exemplo, o que se escreve como t(N-k-1, 5%).
( )
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 28 de 43
Caso o valor calculado seja inferior ao valor tabelado, isto significa que não é
possível rejeitar a hipótese nula de que o coeficiente da reta é igual a zero,
situando-se dentro da área branca do gráfico acima. Olha pessoal, o que se está
dizendo com isso é que, dado um valor considerado improvável (área cinza), a
estatística nos permite dizer se este valor está dentro destes padrões esperados.
Caso o valor calculado supere o valor tabelado (área cinza gráfico), rejeita-se a
hipótese nula de que o coeficiente é igual a zero. Ou seja, como aquele “cantinho” é
improvável no caso de a hipótese nula ser verdadeira e como a estatística de teste
nos diz que o valor encontrado está lá, a hipótese nula deve estar errada.
Entenderam?
A idéia básica deste teste de hipóteses sobre os parâmetros da regressão é avaliar
se estes últimos apresentam significância estatística. Se o teste de hipóteses indicar
que o parâmetro da equação (2) tem valor igual a zero, deve-se pensar em outra
forma funcional, com outra(s) variável(is) explicativa(s), para explicar a variável y.
Em outras palavras, uma conclusão deste tipo indica que os gastos em propaganda
não afetam as vendas, devendo-se excluir tal variável.
Vamos lembrar a aula de estatística de novo? Há uma coisa importante demais para
se saber. Respondam-me: o que é o p-valor? Bom, vocês têm que me responder
o seguinte:
- Professor, eu aprendi tudo no curso de estatística do “Estratégia Concursos”! O p-
valor é o menor nível de significância ao qual a hipótese nula pode ser rejeitada.
O que é isso?
Vejamos, se você obtém um valor de 0,04 para seu p-valor, isso significa que a
hipótese nula pode ser rejeitada a 4% de significância. Mas, se você escolheu 5%
como seu nível de significância, ou seja, você definiu que 5% é muita coincidência,
você deve rejeitar a hipótese nula. Entenderam? Dêem uma pensada, olhe seus
materiais de estatística, matutem! Matutar é parte do estudar!
É isso aí pessoal. Vamos fazer exercícios?
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 29 de 43
(ESAF – Agente Fiscal de Tributos Estaduais – SEFAZ PI) Um investigador toma uma amostra de 10 carregamentos levados a efeito em caminhões de uma firma de transporte. Para cada carregamento (i) anota a distância percorrida pelo caminhão em 1.000 Km (X(i)) e o tempo de entrega do carregamento em dias (Y(i)). Neste contexto postula que o modelo de regressão linear
Y(i) = α + βX(i) + ε(i), i = 1, 2...10
se ajusta a suas observações, onde α e β são parâmetros desconhecidos e os ε(i) são componentes estocásticas (resíduos) não diretamente observáveis, não correlacionadas, com média zero e variância σ² > 0.
Foram encontradas as estatísticas seguintes no ajuste do modelo de regressão linear:
X(i) = 8;
X(i)² = 12
X(i)*Y(i) = 26
Y(i) = 29
Y(i)² = 100
Com base nessas informações responda:
Exercício 6
Assinale a opção que corresponde à estimativa do aumento esperado no tempo de entrega decorrente da adição de 1.000km na distância percorrida.
a) 0,5 dias
b) 1,0 dias
c) 3,0 dias
d) 5,0 dias
e) 4,5 dias
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 30 de 43
Resolução
Novamente pessoal, vamos se lembrar da fórmula que define o parâmetro b.
Sabendo-se que:
( )
Assim, vamos estimar o parâmetro:
Dado que o X é medido em 1.000 km, o aumento previsto é de uma unidade, o que
gera um aumento no tempo de entrega de 0,5 dias.
Exercício 7
Assinale a opção que corresponde à estimativa de mínimos quadrados do parâmetro σ².
a) 1,77
b) 1,81
c) 0,40
d) 1,22
e) 1,13
Resolução
Mesma coisa que fizemos anteriormente, que é determinar o quadrado médio do
resíduo. Isso será feito da seguinte forma:
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 31 de 43
( )
( ) (
)
Portanto, SQR = SQT – SQE = 14,5.
Assim:
Exercício 8
(IBGE 2002 – Analista Socioeconômico) Numa regressão linear simples, o coeficiente de determinação representa:
a) a média da soma dos quadrados dos desvios
b) a soma dos quadrados dos resíduos
c) a raiz quadrada do coeficiente de correlação amostral
d) a variância dos dados
e) a porcentagem da variação total dos dados que é explicada pela regressão
Resolução
Bom pessoal, basta ler a definição do R² que nós chegaremos facilmente à
alternativa (e). Com o que nós já sabemos, dá para responder tranquilamente.
Entretanto, quero destacar a alternativa (c). Vocês já sabem que:
Coeficiente de determinação = (coeficiente de correlação amostral)²
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 32 de 43
Exercício 9
(SUSEP 2010 – Atuária) A partir de uma amostra aleatória [x(1), y(1)], [x(2), y(2)]...[x(20), y(20)] foram obtidas as estatísticas:
Média de X = 12,5
Média de Y = 19
Variância de X = 30
Variância de Y = 54
Covariância entre X e Y = 36
Calcule a reta de regressão estimada de Y contra X.
a) Y = 19 + 0,667*X
b) Y = 12,5 + 1,2*X
c) Y = 4 + 1,2 X
d) Y = 19 + 1,2 X
e) Y = 80 + 22,8X
Resolução
Vamos lá!
( )
( )
Com base neste resultado:
( ) ( )
Assim:
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 33 de 43
Exercício 10
(SUSEP 2010 – Atuária) Com os dados da questão anterior, determine o valor da estatística F para testar a hipótese nula de que o coeficiente angular da reta do modelo de regressão linear simples de Y contra X é igual a zero.
a) 144
b) 18
c) 36
d) 72
e) 48
Resolução
Bom, essa é complicada. Agora vamos ter que para pensar um pouquinho. Vamos
nos relembrar de como é calculada a estatística F:
Se nós dividirmos o numerador e o denominador pelo mesmo número, o total da
fração permanece a mesma. Assim, vamos dividir os dois membros por SQT:
(
)
(
)
(
)
( )
( )
Viram? Esta é uma forma muito importante de se definir o cálculo do R². Decorem!
Agora fica fácil.
O SQT da regressão é a própria variância de y, enquanto que ( ).
Assim:
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 34 de 43
( ) (
)
Calculando a estatística F, chega-se a:
Exercício 11
(ESAF – AFRFB 2009) Na análise de regressão linear simples, as estimativas
e dos parâmetros e da reta de regressão podem ser obtidas pelo método de Mínimos Quadrados. Nesse caso, os valores dessas estimativas
são obtidos através de uma amostra de n pares de valores com (i = 1,
2,....,n), obtendo-se: , onde é a estimativa de .
Para cada par de valores com (i = 1, 2,...,n) pode-se estabelecer o desvio
ou resíduo - aqui denotado por - entre a reta de regressão e sua
estimativa . Sabe-se que o Método de Mínimos Quadrados consiste em
adotar como estimativas dos parâmetros e os valores que minimizam a soma dos quadrados dos desvios . Desse modo, o Método de Mínimos Quadrados consiste em minimizar a expressão dada por:
a)
b)
c)
d)
e)
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 35 de 43
Resolução Pessoal, o que faz o método do MQO?
Isso mesmo! Ele minimiza a soma dos quadrados dos resíduos. Portanto, é fácil
perceber que a expressão que mostra isso, dada a notação usada na questão, é:
[ ( )] ( )
O gabarito é (a), mas está incorreto, pois deveria haver um sinal de “+” antes de .
Portanto, foi anulada.
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 36 de 43
Lista das questões Apresentadas com Gabarito
Exercício 2
(FCC - ANALISTA BACEN 2005) Uma empresa com a finalidade de determinar a relação entre os gastos anuais com propaganda (X), em R$ 1000,00, e o lucro bruto anual (Y), em 1000,00, optou por utilizar o modelo linear simples Y(i) = a + bX(i) + e(i), em que Y(i) é o valor do lucro bruto auferido no ano (i), X(i) é o valor do gasto com propaganda no ano (i) e e(i) o erro aleatório com as respectivas hipóteses consideradas para a regressão linear simples.
Considerou, para o estudo, as seguintes informações referentes às observações dos últimos 10 anos da empresa:
Utilizando a equação da reta obtida pelo método dos mínimos quadrados, tem-se que, caso haja um gasto anual com propaganda de 80 mil reais, a previsão do lucro bruto anual, em mil reais, será de:
a) 158
b) 128,4
c) 121
d) 102,5
e) 84
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 37 de 43
Exercício 3.
(CESGANRIO – BACEN/2010)
Fonte de Variação
Soma dos Quadrados
Graus de Liberdade
Média de Quadrados
F
Fator 6752,0 2
Erro 30178,0
Total 36930,0 29
Analisando a tabela ANOVA acima, considere as conclusões a seguir:
I – A análise de variância (ANOVA) teste se várias populações têm a mesma média; para tanto, são comparadas a dispersão das médias amostrais e a variação existente dentro da amostra
II – ANOVA indica que:
III – A estatística F, calculada com a informação da tabela acima, é acima 2,651 e deve ser comparada com o valor tabelado F(2,29) para um grau de significância escolhido.
É correto APENAS o que se conclui em:
a) I
b) III
c) I e II
d) I e III
e) II e III
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 38 de 43
Exercício 5.
(FCC - ANALISTA BACEN 2005) Uma empresa com a finalidade de determinar a relação entre os gastos anuais com propaganda (X), em R$ 1000,00, e o lucro bruto anual (Y), em 1000,00, optou por utilizar o modelo linear simples Y(i) = a + bX(i) + e(i), em que Y(i) é o valor do lucro bruto auferido no ano (i), X(i) é o valor do gasto com propaganda no ano (i) e e(i) o erro aleatório com as respectivas hipóteses consideradas para a regressão linear simples.
Considerou, para o estudo, as seguintes informações referentes às observações dos últimos 10 anos da empresa:
Montando o quadro de análise de variância (ANOVA), tem-se que:
a) a variação total apresenta um valor de 62,5.
b) a variação explicada, fonte de variação devido à regressão, apresenta um valor igual a 80.
c) Dividindo a variação residual pela variação total, obtemos o coeficiente de determinação (R²).
d) o valor da estatística F necessária para o teste da existência da regressão é igual ao quociente da divisão da variação explicada pela variação residual.
e) a variação residual apresenta um valor igual a 17,5.
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 39 de 43
(ESAF – Agente Fiscal de Tributos Estaduais – SEFAZ PI) Um investigador toma uma amostra de 10 carregamentos levados a efeito em caminhões de uma firma de transporte. Para cada carregamento (i) anota a distância percorrida pelo caminhão em 1.000 Km (X(i)) e o tempo de entrega do carregamento em dias (Y(i)). Neste contexto postula que o modelo de regressão linear
Y(i) = α + βX(i) + ε(i), i = 1, 2...10
se ajusta a suas observações, onde α e β são parâmetros desconhecidos e os ε(i) são componentes estocásticas (resíduos) não diretamente observáveis, não correlacionadas, com média zero e variância σ² > 0.
Foram encontradas as estatísticas seguintes no ajuste do modelo de regressão linear:
X(i) = 8;
X(i)² = 12
X(i)*Y(i) = 26
Y(i) = 29
Y(i)² = 100
Com base nessas informações responda:
Exercício 6
Assinale a opção que corresponde à estimativa do aumento esperado no tempo de entrega decorrente da adição de 1.000km na distância percorrida.
a) 0,5 dias
b) 1,0 dias
c) 3,0 dias
d) 5,0 dias
e) 4,5 dias
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 40 de 43
Exercício 7
Assinale a opção que corresponde à estimativa de mínimos quadrados do parâmetro σ².
a) 1,77
b) 1,81
c) 0,40
d) 1,22
e) 1,13
Exercício 8
(IBGE 2002 – Analista Socioeconômico) Numa regressão linear simples, o coeficiente de determinação representa:
a) a média da soma dos quadrados dos desvios
b) a soma dos quadrados dos resíduos
c) a raiz quadrada do coeficiente de correlação amostral
d) a variância dos dados
e) a porcentagem da variação total dos dados que é explicada pela regressão
Exercício 9
(SUSEP 2010 – Atuária) A partir de uma amostra aleatória [x(1), y(1)], [x(2), y(2)]...[x(20), y(20)] foram obtidas as estatísticas:
Média de X = 12,5
Média de Y = 19
Variância de X = 30
Variância de Y = 54
Covariância entre X e Y = 36
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 41 de 43
Calcule a reta de regressão estimada de Y contra X.
a) Y = 19 + 0,667*X
b) Y = 12,5 + 1,2*X
c) Y = 4 + 1,2 X
d) Y = 19 + 1,2 X
e) Y = 80 + 22,8X
Exercício 10
(SUSEP 2010 – Atuária) Com os dados da questão anterior, determine o valor da estatística F para testar a hipótese nula de que o coeficiente angular da reta do modelo de regressão linear simples de Y contra X é igual a zero.
a) 144
b) 18
c) 36
d) 72
e) 48
Exercício 11
(ESAF – AFRFB 2009) Na análise de regressão linear simples, as estimativas
e dos parâmetros e da reta de regressão podem ser obtidas pelo método de Mínimos Quadrados. Nesse caso, os valores dessas estimativas
são obtidos através de uma amostra de n pares de valores com (i = 1,
2,....,n), obtendo-se: , onde é a estimativa de .
Para cada par de valores com (i = 1, 2,...,n) pode-se estabelecer o desvio
ou resíduo - aqui denotado por - entre a reta de regressão e sua
estimativa . Sabe-se que o Método de Mínimos Quadrados consiste em
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 42 de 43
adotar como estimativas dos parâmetros e os valores que minimizam a soma dos quadrados dos desvios . Desse modo, o Método de Mínimos Quadrados consiste em minimizar a expressão dada por:
a)
b)
c)
d)
e)
Econometria para o BACEN
Teoria e exercícios comentados Prof. Jeronymo Marcondes – Aula 00
Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 43 de 43
Gabarito
2 - d
3 - c
5 - e
6 - a
7 - b
8 - e
9 - c
10 - d
11 - a
É isso aí pessoal.
Logo estaremos de volta. Pratiquem! Este é o caminho.
Precisando é só chamar. Vou fazer o possível para atender rapidamente às suas