AULA 9 – Revisão Econometria DISCIPLINA: Econometria PROFESSOR: Bruno Moreira CURSO: Tecnólogo em Gestão Financeira.

Post on 22-Apr-2015

115 Views

Category:

Documents

4 Downloads

Preview:

Click to see full reader

Transcript

AULA 9 – Revisão Econometria

DISCIPLINA: EconometriaPROFESSOR: Bruno MoreiraCURSO: Tecnólogo em Gestão Financeira

Para Gujarati (2000), econometria visa essencialmente, a uma conjunção da

teoria econômica com medidas concretas, como uma ponte entre a teoria e as

técnicas de inferência estatística.

•O que é Econometria?

Construção de um Modelo Econométrico

Economia Escassez de dados para testar as hipóteses;Erros de mensuração;Revisões dos dados.

Finanças Base de dados muito grande - esforço maior para analisá-los;Dados com muito “ruído”;Em geral não são normalmente distribuídos, embora as metodologias assim os considerem.

Características da Econometria “Econômica” e das “Finanças”

Séries temporais;

Cross-section (corte transversal);

Painel.

Exemplo de dados econométricos

Séries temporais consistem em um conjunto de valores observados em diferentes pontos ao longo de um determinado período de tempo.

Séries temporais

Cross-section (corte trasnversal) consiste em uma amostra de dados coletados em um determinado ponto no tempo.

Cross-section (corte trasnversal)

Painel consiste em uma série de tempo para cada membro do corte transversal do conjunto de dados.

Painel

Regressão : Conceitos

O que é uma regressão?

Regressão pode ser entendida como o estudo da dependência de uma variável em relação a uma ou mais variáveis com o objetivo de estimar e/ou prever a média ou o valor médio da dependente em termos dos valores

fixos das variáveis que a explica.

Diferença entre Regressão e Causação

Regressão X Causação

Uma relação estatística, por si só, não pode logicamente implicar em uma causação.

Para atribuir causalidade, deve-se recorrer a considerações teóricas.

Diferença entre Regressão e Correlação

Regressão X Correlação

Regressão e Correlação são conceitos intimamente relacionados, mas conceitualmente distintos.

O objetivo da correlação é medir o grau ou intensidade de associação linear entre as variáveis.

Na regressão objetivamos prever o valor médio de uma variável com base em valores fixados de outras variáveis.

Modelo de Regressão Linear Simples

Esta equação define o Modelo de Regressão Linear Simples

Modelo de Regressão Linear Simples

Em que:

u = Termo de erro ou termo estocástico é: uma variável estocástica ou aleatória mas não observável ; representa todos os fatores desconhecidos que possam

influenciar uma relação económica.

Y XVariável dependente Variável independenteVariável explicada Variável explicativaRegressando Regressor

Termo de erro

Razões principais que justificam a presença do termo de erro nos modelos econométricos:

(a) no termo de erro incluímos fatores desconhecidos;

(b) fatores conhecidos mas não quantificáveis (gostos, preferências, risco, incerteza);

(c) os chamados erros de especificação: - especificação matemática imprópria - inclusão de variáveis irrelevantes

- exclusão de variáveis relevantes

(d) erros de medição ou erros nas observações devido as simplificações, arredondamentos e transformações dos dados.

Hipóteses Adjacentes ao Modelo de Regressão Linear Simples

Considerando:

Hipótese 1 → E(u) = 0A probabilidade do erro ser x unidades

acima da reta é a mesma de ser x unidades abaixo.

Hipótese 2 →E(u/x) = 0O valor médio de u não depende do valor de x.

Função de Regressão Populacional

Assim, considerando o valor esperado da equação que define o Modelo de Regressão Linear Simples condicionado a x, e levando em consideração a

hipótese 2 temos:

Que é a nossa Função de Regressão Populacional

Função de Regressão Amostral

Por sua vez, quando não temos a disposição toda a população estudada podemos analisar apenas uma pequena parcela deste total, a amostra, o que nos dará a Função de Regressão Amostral

(FRA).

Que também pode ser escrita da seguinte forma:

* Atenção para a diferença entre as duas.

Regressão : Conceitos

O desafio é, portanto, estimar a FRP a partir da FRA.

Aqui enfrentaremos alguns problemas!!!

Pois é possível termos diversas FRA possíveis. Por causa da flutuação das amostras é difícil estimar a FRP de

maneira acurada.

Para n amostras é possível termos n FRAs.

Mínimos Quadrados Ordinários

Para resolvermos o problema e conseguirmos obter a FRA que mais aproxima-se da FRP podemos utilizar do

método

Mínimos Quadrados Ordinários

Sob certas hipóteses restritivas, o MQO tem algumas propriedades estatísticas muito atraentes, fazendo com que seja um dos métodos mais utilizados de regressão.

Mínimos Quadrados Ordinários

O método de MQO pode ser apresentado relembrando a seguinte forma:

FRP

Como não é diretamente observável, a estimamos a partir da FRA:

Mínimos Quadrados Ordinários

Mas como estimamos a FRA propriamente dita?

Primeiro vamos expressar

Da seguinte forma:

Que mostra apenas que os resíduos são simplesmente as diferenças entre os valores reais e estimados.

Mínimos Quadrados Ordinários

Então, para n pares de observação Y e X, queremos determinar a FRA de tal modo que seja tão próxima

quanto possível do Y real. Para tanto podemos adotar o seguinte critério:

Minimizando o quadrado dos erros. Ao elevarmos os erros ao quadrados implicitamente estaremos dando maior peso aos que se encontram

Mínimos Quadrados Ordinários

Assim, como foi visto, a soma dos resíduos ao quadrado é uma função dos estimadores

Pois, o método MQO escolhe os estimadores de tal

maneira que, para uma dada amostra, é mínimo possível.

Em outras palavras, para uma dada amostra, o método MQO nos fornece estimativas únicas dos estimadores que dão menor valor

possível de

O MODELO CLÁSSICO DE REGRESSÃO LINEAR (MCRL)

A partir de algumas hipóteses feitas com relação à interação entre estas variáveis é possível

trabalharmos com o:

O MODELO CLÁSSICO DE REGRESSÃO LINEAR (MCRL)

Assim, o MCRL formula 10 hipóteses a respeito do comportamento das variáveis Y e X e os coeficientes

β, bem como da interação entre eles.

Modelo Clássico de Regressão Linear

Hipótese 1: Linearidade nos parâmetros

Modelo Clássico de Regressão Linear

Hipótese 2: Os valores de X são fixados em amostra repetida

Modelo Clássico de Regressão Linear

Hipótese 2: Os valores de X são fixados em amostra repetida

No nosso exemplo, escolhendo um valor de X (por exemplo US$ 80,00) teremos vários valores de Y.

Isso implica que nossa análise de regressão é uma regressão condicional (condicional aos vários valores do regressor).

Modelo Clássico de Regressão Linear

Hipótese 3: Valor médio zero da perturbação ui

Dado o valor de X, o valor médio ou esperado do termo de erro estocástico ui é zero.

Modelo Clássico de Regressão Linear

Hipótese 3: Valor médio zero da perturbação ui

Isso significa que, os fatores não incluídos explicitamente no modelo (incluídos portanto, em u),

não afetam sistematicamente o valor médio de Y, pois os valores positivos de u se anulam com os valores

negativos.

De modo que a sua média, ou o efeito médio sobre Y é nulo.

Modelo Clássico de Regressão Linear

Hipótese 4: Homocedasticidade ou variância igual de ui

Dado o valor de X, a variância de ui é a mesma para todas as observações. Ou seja, as variâncias condicionais de ui são

idênticas.

por causa da hipótese 3

Modelo Clássico de Regressão Linear

Hipótese 4: Homocedasticidade ou variância igual de ui

A variância de ui para cada Xi é algum número constante positivo igual a σ2 .

De outra forma, a população dos Y dado X têm igual dispersão ou variância.

Modelo Clássico de Regressão Linear

Hipótese 4: Homocedasticidade ou variância igual de ui

Modelo Clássico de Regressão Linear

Hipótese 4: Homocedasticidade ou variância igual de ui

Se a dispersão varia para os diversos valores fixados de X temos uma situação de heterocedasticidade.

Modelo Clássico de Regressão Linear

Hipótese 5: Nenhuma autocorrelação entre as perturbações ui

Dado dois valores de X quaisquer, Xi e Xj, a correlação entre quaisquer dois valores ui e uj (i≠j) é zero.

Modelo Clássico de Regressão Linear

Hipótese 5: Nenhuma autocorrelação entre as perturbações ui

Não há correlação serial entre os erros.

Por exemplo, se houvesse uma correlação entre ut e ut-1, Yt não dependeria apenas de X, mas de ut-1, pois este também

explica ut.

Modelo Clássico de Regressão Linear

Hipótese 6: Covariância zero entre ui e Xi ou E(uiXi) = 0

Isso significa que quando expressamos uma FRP, X e u exercem influência separada (independente) e cumulativa em Y.

Modelo Clássico de Regressão Linear

Hipótese 7: O número de observações n deve ser maior que o número de parâmetros

Ou seja, o número de observações deve ser maior que o de variáveis explicativas.

Modelo Clássico de Regressão Linear

Hipótese 8: Variabilidade nos valores X

Os valores de X em uma dada amostra não podem ser todos iguais.

Se todos os valores fossem iguais Xi = X‾

Modelo Clássico de Regressão Linear

Hipótese 8: Variabilidade nos valores X

Isso tornaria impossível o cálculo dos coeficientes

Modelo Clássico de Regressão Linear

Hipótese 9: Não há viés ou erro de especificação no modelo

Parte do princípio de que o modelo foi construído a partir de uma fundamentação teórica.

Modelo Clássico de Regressão Linear

Hipótese 9: Não há viés ou erro de especificação no modelo

Parte do princípio de que o modelo foi construído a partir de uma fundamentação teórica.

Modelo Clássico de Regressão Linear

***Hipótese 10: Não há multicolinearidade perfeita entre as variáveis explicativas

Não há relações lineares perfeitas entre as variáveis

Nenhuma das variáveis explicativas pode ser escrita como

combinação linear das demais.

Modelo Clássico de Regressão Linear

***Hipótese 10: Não há multicolinearidade perfeita entre as variáveis explicativas

Modelo Clássico de Regressão Linear

***Hipótese 10: Não há multicolinearidade perfeita entre as variáveis explicativas

Exemplo: Seja o modelo

Em que Y = consumo; X2 = renda; X3= riqueza

Melhor Estimador Linear Não-Viesado

No entanto, podemos admitir que, sob as hipóteses do MCRL as estimativas por mínimos quadrados

possuem algumas propriedades ótimas.

Estas propriedades estão descritas no Teorema de Gauss-Markov.

E condicionam os estimadores a ser o Melhor Estimador Linear Não-Viesado (MELNV).

Melhor Estimador Linear Não-Viesado

Um estimador, digamos o , será considerado um MELNV caso sejam válidas as seguintes condições:

1. É linear, isto é, uma função linear de uma variável aleatória, tal como a variável dependente Y no modelo de regressão.

2. É não viesado, isto é, seu valor médio esperado é igual ao valor verdadeiro β2.

3. Tem mínima variância na classe de todos os estimadores lineares não viesados.

Melhor Estimador Linear Não-Viesado

3. Tem mínima variância na classe de todos os estimadores lineares não viesados.

Um estimador não-viesado com a menor variância é conhecido como um estimador eficiente.

Teorema de Gauss-Markov

No contexto da regressão pode-se provar que os estimadores por MQO são MELNV.

Esta é a essência do Teorema de Gauss-Markov.

Teorema de Gauss-Markov: dadas as hipóteses do Modelo Clássico de Regressão Linear, os estimadores por mínimos quadrados, na classe dos estimadores lineares não viesados, têm mínima variância, isto é, são MELNV.

O Coeficiente de Determinação r2

Depois de estimados os coeficientes de nossa regressão, como verificar o “grau de ajuste” (o quão bem a reta de regressão

amostral se ajusta aos dados) do modelo estimado?

Através do Coeficiente de Determinação r2 ou (R2 para regressões múltiplas)

Que é uma medida sintética que diz o quão bem a reta de regressão amostral se ajusta aos dados.

Hipótese da Normalidade

Mas, além de averiguar o “grau de ajuste” da regressão, podemos verificar se cada um dos coeficientes obtidos é estatisticamente significante.

Isso é possível através do Teste de Hipótese. Para tanto, mais uma hipótese desse ser inserida ao nosso contexto.

A Hipótese da Normalidade dos erros que resulta no:

Modelo Clássico de Regressão Linear Normal

50

Modelo Clássico de Regressão Linear Normal

O MCRLN assume, então, que cada termo de erro ui é distribuído normalmente com:

Ou simplesmente:

51

Modelo Clássico de Regressão Linear Normal

Considerando que, se duas variáveis normalmente distribuídas possuem covariância igual a zero elas

são ditas independentes, podemos dizer que:

Em que NID significa:

Normalmente e independentemente distribuído. 52

Hipótese da Normalidade

Mas por que assumir que os erros são normalmente distribuídos?

Ou ainda, por que a distribuição normal?

53

Hipótese da Normalidade

1 – Sabemos que o termo de erro representa a influência de uma série de variáveis independentes que não estão explicitamente

introduzidas na regressão.

Pela Teoria do Limite Central sabemos ainda que se há um grande número de variáveis aleatórias independentes e identicamente distribuídas, o seu somatório tende a uma distribuição normal a

medida que o número destas variáveis aumenta.

54

Hipótese da Normalidade

2 – Assumindo a hipótese da normalidade dos erros a distribuição de probabilidade dos estimadores do MQO também se torna mais

simples de calcular.

Pelas propriedades da distribuição linear “toda função linear de variáveis normalmente distribuídas é também normalmente

distribuída”.

55

Hipótese da Normalidade

3 - A própria distribuição normal é mais simples de se trabalhar pois utiliza-se de apenas dois parâmetros:

Normal (média, variância)

56

Hipótese da Normalidade

4 – Quando se trabalha com amostras relativamente pequenas, a hipótese da normalidade nos permite não apenas calcular a

distribuição de probabilidade dos estimadores por MQO, mas também, que se use os testes estatísticos para os testes de

hipótese.

57

Hipótese da Normalidade

Hipóteses dos estimadores por MQO sob a hipótese da Normalidade

1. São não-viesados;

2. Possui variância mínima;

3. São consistentes, isto é, à medida que a amostra aumenta eles convergem para os valores verdadeiros da população.

58

Hipótese da Normalidade

4 – os estimadores podem ser calculados da seguinte forma:

59

Hipótese da Normalidade

5 – Sob a hipótese da normalidade os estimadores terão variância mínima entre todos os estimadores não viesados,

lineares ou não.

60

Teoria da Estimação

Depois de assumirmos que os erros se distribuem normalmente, e consequentemente os estimadores da FRA, é possível agora testá-los para avaliar o quão próximos estão dos

reais coeficientes.

OU seja, se os betas encontrados são confiáveis ou não.

Esta parte da análise econométrica é conhecida como Teoria da Estimação.

Que consiste em duas partes:

Estimativa de ponto;

Estimativa de intervalo.

61

Estimativa de ponto

Estimativa de ponto

A Estimativa de ponto é o que temos feito até o momento. Calcular uma única estimativa (um valor) para um determinado parâmetro populacional que nos informará os valores de:

Outros exemplos de estimativa de ponto são a média amostral, a variância amostral etc.

62

Estimativa de ponto

Entretanto, sabemos que para cada nova FRA poderemos ter outros valores das estimativas de ponto, inclusive para os estimadores.

Assim, torna-se interessante não apenas trabalharmos com pontos isolados, mas com um verdadeiro intervalo de pontos aos quais os

valores dos coeficientes poderiam assumir.

Para isso trabalharemos com a Estimativa de Intervalo.

63

Estimativa de Intervalo

Estimativa de Intervalo estabelece uma faixa de valores dentro da qual um parâmetro populacional provavelmente se encontrará.

Este intervalo dentro do qual um parâmetro populacional é esperado ocorrer é chamado de Intervalo de Confiança (IC).

64

Estimativa de Intervalo

Matematicamente o Intervalo de Confiança pode ser representado da seguinte maneira:

Em que 1:1 – α = nível de confiança;α = nível de significância.

65

Estimativa de Intervalo

1 – α →Nível de confiança: é a probabilidade de que o intervalo encontrado contenha o valor real do parâmetro analisado;

α → Nível de significância: é a probabilidade de que o intervalo encontrado NÃO contenha o valor real do parâmetro analisado.

66

Estimativa de Intervalo

67

Cálculo do Intervalo de Confiança

Cálculo do IC:

Considerando que os erros seguem uma distribuição normal podemos dizer que os próprios estimadores também seguem esta

distribuição.

Então é possível trabalharmos com a estatística:

68

Cálculo do Intervalo de Confiança

Entretanto, toda vez que o desvio-padrão populacional não for conhecido devemos trabalhar com a estatística t-student.

Dado as características estatísticas da distribuição Z ela pode ser reescrita da seguinte forma:***:

Prova no Apêndice 5A.

69

Cálculo do Intervalo de Confiança

Então, é possível estabelecer o Intervalo de Confiança para o estimador utilizando a estatística t-student ao invés da normal.

70

Cálculo do Intervalo de Confiança

Que por sua vez pode ser matematicamente expresso da seguinte forma:

Ou considerando os graus de liberdade:

71

Cálculo do Intervalo de Confiança

Exemplo:

A estimação de um modelo que testava a influência da renda no consumo resultou nos seguintes valores:

E considerando um α (Nível de significância) de 5%, calcule os limites do intervalo de confiança para .

72

Cálculo do Intervalo de Confiança

73

Cálculo do Intervalo de Confiança

74

Cálculo do Intervalo de Confiança

75

Cálculo do Intervalo de Confiança

Mas, notem que isso é diferente de dizer que a probabilidade é de 95% por cento que o intervalo específico (0,4268-0,5914) contenha o β2 verdade.

Como o intervalo agora é fixo e não aleatório, portanto, β2 ou reside nele ou não: a probabilidade de que o especificado intervalo

fixo inclua o β2 verdadeira é, então, 1 ou 0.

76

Testes de Hipóteses - Conceitos

Também é possível testar se os dados que obtivemos para uma população são corroborados pela evidência de uma amostra.

Esta é a base de Testes de Hipóteses.

Em outras palavras o testes de hipóteses procura averiguar se uma dada observação encontrada é compatível com a hipótese testada.

Onde a palavra “compatível”significa “suficientemente” próxima do valor hipotético de modo que podemos não rejeitar a hipótese levantada.

77

Testes de Hipóteses - Passos

Para testarmos se uma hipótese é verdadeira ou não Tavares (2011) define os seguintes passos:

1) Definir a hipótese nula (H0) e a hipótese alternativa (H1);

Hipótese nula (H0): especifica um valor para o parâmetro que queremos testar. Representa uma crença que mantemos até que a evidência seja refutada ou aceita.

Hipótese alternativa (H1): confronta a hipótese nula.

78

Testes de Hipóteses - Passos

2) Definir o nível de significância (α).

3) Definir a distribuição amostral a ser utilizada (parcela da população que será analisada).

4) Definir os limites da região de rejeição e aceitação (o Intervalo de Confiança)

5) Calcular a estatística da distribuição escolhida a partir dos valores amostrais obtidos.

79

Testes de Hipóteses - Passos

Exemplo:

O IBGE divulgou que em 2009 o PIB per capita da cidade de Formiga foi de aproximadamente R$ 10.500,00. Em uma pesquisa realizada na cidade com uma amostra de

121 pessoas, encontrou-se um PIB per capita de R$11.000,00 com desvio-padrão de R$1.500,00. Ao nível

de significância de 5% é possível dizer que a média amostral é igual a média populacional?

80

Testes de Hipóteses - Passos

1 - Formulando nossas hipóteses.

Ho: μ = R$ 10.500,00

H1: μ > R$ 10.500,00 (teste unicaudal à direita) – o retorno médio é superior a R$ 10.500,00;H1: μ < R$ 10.500,00 (teste unicaudal à esquerda) – o retorno médio é inferior a R$ 10.500,00;H1: μ ≠ R$ 10.500,00 (teste bicaudal) – o retorno médio é diferente de R$ 10.500,00.

81

Testes de Hipóteses - Passos

2 - Definir o nível de significância.

O nível de significância de um teste é dado pela probabilidadede se cometer erro do tipo I (ocorre quando você rejeita a hipóteseHo e esta hipótese é verdadeira). Com o valor desta probabilidadefixada, você pode determinar o chamado valor crítico, que separa a

chamada região de rejeição da hipótese Ho da região de aceitação dahipótese Ho.

Definido em 5%.

82

Testes de Hipóteses - Passos

O fato de estarmos usando resultados amostrais para fazermos inferência sobre uma população pode nos conduzir a erros. A estes erros damos os nomes:

Erro tipo I: rejeitar H0 quando ela é verdadeira. Sua probabilidade é dada por α, denominado nível de significância.

Erro tipo II: aceitar H0 quando ela é falsa. Sua probabilidade é dada por β e relaciona-se com o chamado Poder do teste (1- β).

83

Testes de Hipóteses - Passos

3 - Definir a distribuição amostral a ser utilizada.

A estatística a ser utilizada no teste será definida em função dadistribuição amostral a qual os dados seguem.

Se quiser fazer um teste de hipótese para uma média ou diferença entre médias, utilize a distribuição de Z (variância conhecida) ou t de Student (variância desconhecida da população).

Se quiser comparar a variância de duas populações, então deverá trabalhar com a distribuição F, ou seja, da razão de duas variâncias.

84

Testes de Hipóteses - Passos

4 - Definir os limites da região de rejeição

Os limites entre as regiões de rejeição e aceitação da hipótese Ho, você definirá em função :

Do tipo de hipótese H1; Do valor de (nível de significância); Da distribuição amostral utilizada.

85

Testes de Hipóteses - Passos

4 - Definir os limites da região de rejeição

86

Testes de Hipóteses - Passos

4 - Definir os limites da região de rejeição

Então localizamos o intervalo de confiança para nossa amostra com α =5% e graus de liberdade = 120 na tabela t-student.

Pela tabela t-student : IC = + ou - 1,980

87

Testes de Hipóteses - Passos

4 - Definir os limites da região de rejeição

88

Testes de Hipóteses - Passos

5 – Calcular a estatística da distribuição escolhida a partir dos valores amostrais obtidos.

Para tanto calculamos a estatistica t de nossa amostra:

t =

89

Testes de Hipóteses - Passos

5 – Calcular a estatística da distribuição escolhida a partir dos valores amostrais obtidos.

90

Testes de Hipóteses - Passos

5 – Calcular a estatística da distribuição escolhida a partir dos valores amostrais obtidos.

OU ainda podemos calcular a Região Crítica:

91

Testes de Hipóteses - Passos

5 – Calcular a estatística da distribuição escolhida a partir dos valores amostrais obtidos.

92

Testes de Hipóteses - Passos

6 – Tomar decisão

Como em nosso exemplo a estatística t ficou dentro do intervalo de confiança (o valor do estimador ficou dentro da região de aceitação) dizemos que não é possível rejeitar a hipótese nula.

93

Valor p

Uma estatística importante calculada nas regressões é o valor p (p-value).

O valor p pode ser entendido como o nível de significância observado ou exato. É o nível mínimo de significância ao qual a hipótese nula pode ser rejeitada. Em

outras palavras, a probabilidade exata de se cometer o erro tipo I.

Se o valor do p-valor for menor que o nível de significância estipulado, assume-se o erro tipo I e rejeita-se a hipótese nula.

Valor p < α → rejeita-se HoAo contrário, se o p-valor for maior, não é assumido o erro tipo I e não se rejeita a hipótese nula.

Valor p > α → não rejeita-se Ho

94

Análise Output da regressão

Considere um modelo onde desejamos explicar o lucro por ação (LPA) de uma empresa através de algumas variáveis representadas por dados contábeis e medidas de mercado.

Neste caso, as variáveis independentes escolhidas foram:

Liquidez geral (liq_gera): Ativo Circulante + Realizável a Longo Prazo) / (Passivo Circulante + Passivo Não Circulante;

Presença em bolsa (presen): % de participação em transações na bolsa no período analisado;

Volatilidade (vol): variância ou mensuração do grau de risco de cada ativo;

95

Análise Output da regressão

Lembrando que, para construirmos nosso modelo, temos que ter em mente o quadro visto:

Pois, na maioria dos casos, o modelo deve ser construído com base em uma teoria anterior.

96

Análise Output da regressão

Assim, nossa hipótese é que o lucro por ação é explicado pela Liquidez geral, pela Presença em bolsa e pela Volatilidade.

Matematicamente falando: LPA = f(liq_gera; presen; vol)

Econometricamente falando:

LPA = β0 + β1 liq_gera+ β2 presen + β3 vol + ui

97

Análise Output da regressão

Portanto, estimando nosso modelo (através do STATA) temos o seguinte output

LPA = β0 + β1 liq_gera+ β2 presen + β3 vol + ui

98

Análise Output da regressão

Em que:

99

Análise Output da regressão

Assim, o modelo estimado foi:

LPA = -0,843708 - 0,386184 liq_gera + 0,282046 presen -0,027831 vol

100

Análise Output da regressão

Entretanto, considerando as estatísticas t e o valor p da regressão:

Como:Valor p > α → não rejeita-se Ho (neste caso, testa-se se o coeficiente é igual a 0)

É possível observar que para os coeficientes, liq_gera, presen e _const, não rejeitamos a hipótese nula de que eles são estatisticamente iguais a zero.

Nesse caso, nosso modelo pouco explicou o lucro por ação.101

Análise Output da regressão

O que, de fato, também é apresentado pelo R2 muito baixo:

A grosso modo, apenas cerca de 5% do lucro por ação é explicado pelas variáveis apresentadas.

102

Análise Output da regressão

Sabendo disso podemos tentar testar outra hipótese:

LPA = β0 + β1 vol + ui

OU seja, testar se o LPA pode ser explicado apenas pela volatilidade das ações.

103

Análise Output da regressão

Assim, o resultado deste novo modelo: LPA = β0 + β1 vol + ui

104

Análise Output da regressão

Que por sua vez nos apresenta que:

LPA = 1,927125 - 0,0277792 vol

Com um R2 = 0,0508

Mas com todas aos valores p estatisticamente significante, ou seja, menores do que α=0,05, rejeitando a

hipótese nula de que os coeficientes sejam igual a zero.105

Análise Output da regressão

Com base na teoria que vimos até aqui, comparando os dois modelos, como o R2 se mostram praticamente nos mesmos níveis (0,0509 para o modelo completo e 0,0508 para o modelo restrito), optaríamos pelo segundo modelo, pois, todos os coeficientes são estatisticamente diferentes de zero.

106

Análise Output da regressão

A tomada de decisão entre dois modelos inicia-se desta forma, mais a frente veremos outros testes a serem aplicados.

Mas de qualquer forma, temos que ter em mente a teoria econômica por trás do modelo. Vejamos se nosso modelo economicamente está correto:

107

Análise Output da regressão

Nosso modelo está descrito da seguinte forma:

LPA = 1,927125 - 0,0277792 vol

Isso significa que o lucro por ação cai se a volatilidade aumenta (????)

Considerando que nos dados obtidos a volatilidade variou de 20 (mínima) até 260 (máxima) podemos construir um gráfico desta variação.

108

Análise Output da regressão

109

LPA beta 0 beta 1 Vol LPA beta 0 beta 1 Vol

1,371545 1,927125 0,027779 20 -2,23973 150

1,093755 30 -2,51752 160

0,815965 40 -2,79531 170

0,538175 50 -3,0731 180

0,260385 60 -3,35089 190

-0,01741 70 -3,62868 200

-0,2952 80 -3,90647 210

-0,57299 90 -4,18426 220

-0,85078 100 -4,46205 230

-1,12857 110 -4,73984 240

-1,40636 120 -5,01763 250

-1,68415 130 -5,29542 260

-1,96194 140

Análise Output da regressão

110

0 20 40 60 80 100120

140160

-2.5

-2

-1.5

-1

-0.5

0

0.5

1

1.5

2

Volatilidade

LPA

Análise Output da regressão

Com isso, nosso modelo nos diz que se a volatilidade for igual a 20 o lucro por ação será de cerca de 1,37, e caso a volatilidade suba para 260, este lucro será, na verdade, um prejuízo de cerca de -5,3.

Será????

Na verdade sabemos que o lucro por ação está num intervalo maior do que isso.

Além disso, alguns estudos apontam que o lucro por ação explica parte da volatilidade encontrada.

111

Análise Output da regressão

Resultado:

Mesmo nossos os coeficientes sendo estatisticamente diferentes de zero, nosso modelo cai devido à sua falta de fundamentação teórica e empírica.

Ou seja, este nosso modelo seria rejeitado.

112

top related