Top Banner
03/01/22 16:01 ESTATÍSTICA APLICADA I - Estatística Descritiva Estatística Aplicada Estatística Aplicada I I Universidade Federal do Pará Instituto de Tecnologia Campus de Belém Curso de Engenharia Mecânica Prof. Dr. Jorge Teófilo de Barros Lopes
242

Estatc3adstica cap-01

Jan 16, 2017

Download

Education

Damon Farias
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

Estatística AplicadaEstatística Aplicada II

Universidade Federal do ParáInstituto de Tecnologia

Campus de BelémCurso de Engenharia Mecânica

Prof. Dr. Jorge Teófilo de Barros Lopes

Page 2: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

Capítulo ICapítulo I

Universidade Federal do ParáInstituto de Tecnologia

Estatística DescritivaEstatística Descritiva

Campus de BelémCurso de Engenharia Mecânica

Page 3: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

Introdução Conceitos e definições Classificação dos dados Caracterização e apresentação dos dados Estatísticas amostrais Outras apresentações gráficas de dados Regressão linear

I - Estatística Descritiva

Page 4: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

I - Estatística Descritiva

Introdução Conceitos e definições Classificação dos dados Caracterização e apresentação dos dados Estatísticas amostrais Outras apresentações gráficas de dados Regressão linear

Page 5: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.1 Introdução

ESTATÍSTICA: É a disciplina que objetiva estudar os métodos científicos para a coleta, organização, resumo, apresentação e análise de dados, bem como obter conclusões válidas e tomar decisões razoáveis baseadas em tais análises.

Técnicas Estatísticas: São as várias técnicas por meio das quais é possível estudar conjuntos de dados e, a partir de uma amostra (se necessária), tirar conclusões válidas para conjuntos maiores (população).

Page 6: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.1 Introdução

De uma maneira geral, as técnicas estatísticas são utilizadas em três etapas principais do trabalho de pesquisa:

1. A coleta de dados, incluindo o planejamento do trabalho e da pesquisa;

2. A apresentação dos dados coletados; e

3. A análise dos dados coletados, com a formulação de conclusões e generalizações.

Page 7: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.1 Introdução

- Essa primeira etapa corresponde ao estabelecimento do método de coleta de dados (questionário ou teste ou ensaio de material) e elaboração dos questionamentos ou determinação das variáveis que serão estudadas, de acordo com o interesse do pesquisador; e o cálculo do tamanho da amostra, de acordo com a natureza da pesquisa, do tempo e do orçamento disponíveis.

COLETA DE DADOS

Page 8: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.1 Introdução

- A segunda etapa requer técnicas específicas para a transformação dos dados numéricos em tabelas ou gráficos (é a partir da organização dos dados coletados que se poderá elaborar a interpretação).

APRESENTAÇÃO DOS DADOS COLETADOS

ANÁLISE DOS DADOS COLETADOS

- Essa etapa é simultânea à anterior, pois durante a própria organização dos dados já é possível ir percebendo a tendência geral da pesquisa.

Page 9: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.1 Introdução

• No sentido de melhor esclarecer o significado da análise e interpretação dos dados, deve-se estabelecer uma distinção entre

ESTATÍSTICA DESCRITIVA

e

INFERÊNCIA ESTATÍSTICA

Page 10: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.1 Introdução

• Como o próprio nome sugere, constitui-se num conjunto de técnicas que objetivam descrever, analisar e interpretar os dados numéricos de uma população ou amostra.

Estatística Descritiva: Objetiva sintetizar e representar de uma forma compreensível a informação contida num conjunto de dados.

• Materializa-se na construção de tabelas e/ou gráficos ou no cálculo de medidas que representem convenientemente a informação contida nos dados.

• Adquire importância quando o volume de dados for significativo.

Page 11: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.1 Introdução

• Objetivo mais ambicioso que o da estatística descritiva.

Inferência Estatística: Baseada na análise de um conjunto limitado de dados (uma amostra), objetiva caracterizar o todo a partir do qual tais dados foram obtidos (a população).

• Os métodos e técnicas utilizados são mais sofisticados.

Page 12: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.1 Introdução

Figura 1.1- Diferença entre Estatística Descritiva e Inferência Estatística (Silva e Carvalho, 2006).

Page 13: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.1 Introdução

Figura 1.2- Diferença entre Estatística Descritiva e Inferência Estatística (Silva e Carvalho, 2006).

Page 14: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

I - Estatística Descritiva

Introdução Conceitos e definições Classificação dos dados Caracterização e apresentação dos dados Estatísticas amostrais Outras apresentações gráficas de dados Regressão linear

Page 15: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.2 Conceitos e Definições

População: É o conjunto de todos os elementos que contêm uma certa característica que se deseja estudar.

• Como é comum a todos os elementos, esta característica varia em quantidade ou qualidade.

• Uma população pode ter dimensão finita ou infinita.

Amostra: É um subconjunto de dados que pertencem à população. As amostras aleatórias são escolhidas por meio de processos (técnicas de amostragem) que garantem que o subconjunto obtido é representativo da população.

Page 16: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.2 Conceitos e Definições

Principais motivos para o estudo da amostra:

1. População infinita;

2. Custo em termos de tempo ou de dinheiro que um estudo em toda a população implicaria;

3. Obtenção de informação por meio de testes destrutivos, no âmbito industrial;

4. Impossibilidade de acesso a todos os elementos da população.

Page 17: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.2 Conceitos e Definições

Fases do método de análise estatística: • No âmbito da Estatística, o método de abordagem dos

problemas pode ser dividido em cinco fases:

1. Estabelecimento do objetivo da análise a efetuar (questões a serem resolvidas) e definição das populações correspondentes;

2. Concepção de um procedimento adequado para a seleção de uma ou mais amostras (escolha das técnicas de amostragem a utilizar).

3. Coleta de dados.

4. Análise dos dados (Estatística Descritiva).

5. Estabelecimento de inferências a respeito da população (Inferência Estatística)

Page 18: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.2 Conceitos e Definições

Fases do método de análise estatística:

Identificação do problema → Objetivo da análise

Planejamento da experiência → Técnicas de Amostragem

Coleta de dados

Análise exploratória dos dados → Estatística Descritiva

Análise e interpretação dos resultados → Inferência Estatística

Page 19: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

I - Estatística Descritiva

Introdução Conceitos e definições Classificação dos dados Caracterização e apresentação dos dados Estatísticas amostrais Outras apresentações gráficas de dados Regressão linear

Page 20: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.3 Classificação dos Dados

Iniciando o estudo:

• Isso é necessário, pois podem ocorrer registros que não se encaixam no padrão geral observado e, dessa forma, a sua veracidade deve ser averiguada, pois podem tratar-se de erros de observação, bem como do próprio registro ou provenientes de alterações do fenômeno em estudo.

• Não existe uma estratégia única para iniciar o estudo descritivo, embora uma primeira recomendação seja começar por uma exploração visual dos dados levantados.

Page 21: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.3 Classificação dos Dados

Iniciando o estudo:

• Embora estas análises já se encontrem disponíveis em vários softwares e calculadoras programáveis, para uma melhor interpretação das mesmas é conveniente conhecer as técnicas utilizadas.

• Para se ter uma ideia mais concreta sobre os dados levantados, deve-se recorrer às tabelas e/ou gráficos que podem representar, de maneira sintética, as informações sobre o comportamento de variáveis numéricas levantadas.

Page 22: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.3 Classificação dos Dados

Iniciando o estudo:

• Portanto, para se proceder um estudo descritivo, é importante:

- Ordenação dos dados – fase onde se começa a ter uma ideia a respeito de algumas medidas de posição (média, mediana, quartis etc.);

- Estatísticas amostrais – a partir de algumas medidas promove-se um resumo dos dados levantados, relativamente à posição, dispersão e forma;

- Agrupamento dos dados e representação gráfica – revela a forma possível para a população em estudo e permite escolher a classe de modelos que deve ser explorada nas análises mais sofisticadas.

Page 23: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.3 Classificação dos Dados

Dados brutos: Como primeiro resultado de uma pesquisa, obtêm-se dados brutos, ou seja, um conjunto de números ainda sem organização alguma.

Rol: Os dados brutos são então ordenados de forma crescente ou decrescente, com a indicação da frequência de cada um, dando origem ao chamado rol.

Tabulação dos dados: Depois de elaborar o rol é preciso determinar quantas faixas terá a tabela de frequência. A fórmula de Sturges é utilizada para estabelecer o número aproximado de classes

onde: n = número de elementos da amostra (tamanho da amostra) k = número de classes que a tabela de classes deverá conter.

nlog22,31k

Page 24: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.3 Classificação dos Dados

• Observações: - k deverá ser no mínimo 3 e no máximo 20;- Como a variável k é um número inteiro, ela

deverá ser aproximada para o maior inteiro (por exemplo, se k ≈ 6,4, usa-se k = 7).

Frequência de classes: O passo seguinte é subdividir os dados pelas classes ou categorias e determinar o número de indivíduos pertencentes a cada uma, resultando nas frequências de classes.

Apresentação final dos dados (tabela completa): Com base em todos os cálculos feitos anteriormente, pode-se fazer uma nova tabela com todas as frequências, as quais serão estudadas a posteriori.

Gráficos: A partir da tabela de frequências, faz-se o desenho gráfico, um recurso de visualização dos dados constantes na tabela.

Page 25: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.3 Classificação dos Dados

Os dados que constituem uma amostra podem ser de quatro tipos, assim distribuídos:

• Qualitativos- Nominal- Ordinal

• Quantitativos- Intervalar- Absoluto

Page 26: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.3 Classificação dos Dados

a) Dados nominais: Quando cada um deles for identificado pela atribuição de um nome que designa uma classe.

a) Exaustivas - qualquer dado pertence a uma das classes;b) Mutuamente exclusivas - cada dado pertence somente

a uma classe;c) Não ordenáveis - não existe nenhum critério relevante

que permita estabelecer preferência por qualquer classe em relação às restantes.

Neste caso, as classes devem ser:

- Exemplo: Classificação das pessoas pela cor do cabelo (preto, castanho, louro etc.).

Page 27: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.3 Classificação dos Dados

- Exemplo: Classificação de conceitos de avaliação na disciplina em insuficiente, regular, bom e excelente.

b) Dados ordinais: São semelhantes aos dados nominais; contudo, nessa escala existe a possibilidade de se estabelecer uma ordenação dos dados nas classes, segundo algum critério relevante.

Page 28: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.3 Classificação dos Dados

- Observação: Neste caso, pode-se atribuir um significado à diferença entre esses números, mas não à razão entre eles.Por exemplo, o registro de temperaturas em ºC, em determinadas horas de dias sucessivos. Se em três dias consecutivos a temperatura atingir 5ºC, 10°C e 20ºC, não faz sentido dizer que o terceiro dia esteve duas vezes mais quente que o segundo, pois se a temperatura fosse expressa em outra escala, a razão entre os valores registrados naqueles dias seria diferente.

c) Dados intervalares: No caso da escala intervalar, os dados são diferenciados e ordenados por números expressos em uma ordem cuja origem é arbitrária.

Page 29: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.3 Classificação dos Dados

d) Dados absolutos: Contrariamente ao que sucede com a escala intervalar, a escala absoluta tem origem fixa (nesta escala, o valor zero tem significado).

• Escala intervalar: temperatura de 0ºC não significa que não haja temperatura.

• Escala absoluta: peso de 0 kg significa que não existe peso.

• Em conseqüência ao fato da origem ser fixa, a razão entre os dados expressos numa escala absoluta passa a ter significado; uma pessoa com 60 kg tem o dobro do peso de uma com 30 kg.

- Exemplo: Pesos de pessoas expressos em kg.

- Observações:

Page 30: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.3 Classificação dos Dados

- Observação: Quando se trabalha com dados quantitativos, é necessário que se faça a distinção entre os dados discretos e os contínuos.

Os dados denominam-se discretos quando são valores de uma variável aleatória discreta, que é a aquela que assume valores em pontos da reta real (por exemplo, número de páginas em um livro: 1, 2, 3, 4, 5...).

Os dados são contínuos quando são valores de uma variável aleatória contínua, que é aquela que pode assumir qualquer valor em certo intervalo da reta real (por exemplo, o peso de funcionários de uma fábrica: 60,5 kg; 60,52 kg; ...)

Page 31: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

I - Estatística Descritiva

Introdução Conceitos e definições Classificação dos dados Caracterização e apresentação dos dados Estatísticas amostrais Outras apresentações gráficas de dados Regressão linear

Page 32: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Tabela de frequências:

• Devido à necessidade das categorias estarem ordenadas, somente se pode falar de frequências acumuladas quando os dados estão em escalas ordinais, intervalar ou absoluta.

• A representação tabular com todos os tipos de frequências é mostrada a seguir:

Page 33: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Tabela de frequências:

a) Frequência absoluta (ni): O número de dados contidos numa classe ou categoria qualquer i (i = 1,..., k) de um conjunto de dados designa-se por frequência absoluta da classe ou categoria i.

• Denotando-se por ni tal frequência e admitindo que as categorias especificadas contêm todos os dados, o número total de dados (n) é calculado por:

Page 34: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Tabela de frequências:

b) Frequência relativa (fi): O número total de dados que pertencem a uma classe ou categoria qualquer i, quando expressos como uma proporção do número total de dados, designa-se por frequência relativa da classe ou categoria i e é dada por:

• As frequências relativas são muitas vezes definidas em termos percentuais.

Page 35: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Tabela de frequências:

c) Frequência absoluta acumulada (Ni): Representa para cada classe ou categoria i, a frequência absoluta de dados que pertencem à classe ou às classes anteriores.

d) Frequência relativa acumulada (Fi): Representa para cada classe categoria i, a frequência relativa de dados que pertencem à classe ou às classes anteriores.

Page 36: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Tabela de frequências:

Page 37: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Gráficos estatísticos

• Uma vez elaborada a tabela de frequências, segue-se o desenho do gráfico, um recurso de visualização dos dados constantes na tabela.

• Os tipos de gráficos mais comuns são: histograma; polígono de frequência, setograma e ogiva de Galton.

Page 38: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Gráficos estatísticos

- Histograma: Este tipo de gráfico é utilizado para representar as frequências absolutas (ni) em relação à sua classe, e é assim construído:

1. No eixo das abscissas marcam-se, em escala, as classes dos dados;

2. No eixo das ordenadas, marcam-se as frequências das classes;

3. Faz-se a correspondência entre cada intervalo no eixo das classes com um valor no eixo das frequências, formando um desenho de colunas paralelas.

Page 39: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Gráficos estatísticos

1. No eixo das abscissas, coloca-se o ponto médio de cada intervalo de classe;

2. No eixo das ordenadas, permanecem as frequências absolutas das classes (ni) ;

3. Ligam-se os pontos médios por segmentos de reta;

4. Para completar o polígono, acrescenta-se um ponto médio com frequência zero em cada uma das extremidades da escala horizontal.

- Polígono de frequência: Utilizado para indicar o ponto médio ou representante de classe em suas respectivas frequências absolutas; normalmente, é construído sobre o histograma, da seguinte forma:

Page 40: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Gráficos estatísticos

- Histograma e Polígono de frequência:

Page 41: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Gráficos estatísticos

- Histograma

- Polígono de frequência:

Page 42: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Gráficos estatísticos

- Gráfico em setores (Setograma): Também conhecido como gráfico de pizza, é utilizado para representar valores relativos (%); é construído da seguinte forma:

1. Faz-se um círculo;

2. Cada setor é regido pela fórmula:

3. No círculo, distribui-se os valores das frequências percentuais

Page 43: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Gráficos estatísticos

- Ogiva de Galton: Este tipo de gráfico é utilizada para representar as frequências acumuladas de uma distribuição; é construído da seguinte forma:

1. No eixo das abscissas coloca-se as classes dos dados, tal como no histograma;

2. No eixo das ordenadas, escreve-se uma das frequências acumuladas, marcando o ponto com os limites superiores (Li) de cada classe; inicia-se com a frequência zero e com limite inferior da 1ª classe.

Page 44: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Gráficos estatísticos

- Ogiva de Galton:

Page 45: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Gráficos estatísticos

- Gráfico linear: É o tipo de gráfico que apresenta os dados estatísticos por meio de uma linha poligonal. Os pontos da polígono são obtidos pelas informações contidas em cada linha da tabela, e marcados no plano utilizando o sistema cartesiano. São utilizados para representar séries cronológicas.

Page 46: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Gráficos estatísticos

- Gráfico de colunas: É o tipo de gráfico que apresenta os dados estatísticos por meio de retângulos (colunas) dispostas em posições vertical. Todos os retângulos possuem a mesma base e a altura proporcional aos dados. Podem ser utilizados para representar qualquer série estatística.

Page 47: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Gráficos estatísticos

- Gráfico de colunas: Este tipo de gráfico é semelhante ao de colunas, onde os retângulos (barras) estão dispostos horizontalmente. É utilizado para legendas longas, em todas as séries.

Page 48: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Dados Qualitativos:

• Exemplo: Em uma amostra constituída de 120 peças, constatou-se que 100 não tinham qualquer defeito, 15 tinham defeitos recuperáveis e 5 apresentavam defeitos irrecuperáveis. Representar em uma tabela, e também graficamente, as frequências (absolutas e relativas) dos dados que constituem essa amostra:

Categoria de peças Frequência absoluta(ni)

Frequência relativa(fi)

Sem defeitosRecuperáveisirrecuperáveis

100155

83,3%12,5%4,2%

TOTAL 120 100%

Page 49: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Dados Qualitativos:

Gráfico em Setores

83,3%

12,5%4,2%

Sem defeitosRecuperáveisirrecuperáveis

Page 50: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Dados Quantitativos:

• Exemplo: Em um estudo realizado com o objetivo de caracterizar o comportamento dos clientes de um supermercado, analisou-se o número de ocupantes por veículo para 1000 veículos que entraram no estacionamento do referido supermercado, em um sábado. Os resultados encontram-se resumidos na tabela seguinte:

Page 51: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Dados Quantitativos:

Nº de ocupantes por veículo

(xi)

Frequência absoluta

(ni)

Frequência relativa

(fi)

Frequência absoluta

acumulada(Ni)

Frequência relativa acumulada

(Fi)

1234567

10314724819715210053

10,3%14,7%24,8%19,7%15,2%10,0%5,3%

103250498695847947

1000

10,3%25,0%49,8%69,5%84,7%94,7%100,0%

TOTAL 1000 100%

Page 52: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Dados Quantitativos:

0

50

100

150

200

250

300

n i

1 2 3 4 5 6 7

Nº ocupantes / veículo

Gráfico em colunas

Page 53: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

• Distribuições agrupadas: Essas distribuições são úteis quando existe um grande número de dados relativos a uma variável contínua, cujos valores observados são muito próximos uns dos outros.

- A frequência de cada classe é o número de observações que ela contém.

- No exemplo anterior, os dados observados correspondem a uma variável discreta; para o caso de dados relativos uma variável contínua existem algumas diferenças.

Dados Quantitativos:

Page 54: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

• Exemplo: O conjunto de dados baixo representa o peso, em gramas, do conteúdo de uma série de 100 garrafas que, no decurso de um teste, saíram de uma linha de enchimento automático:

302,25; 299,20; 300,24; 297,22; 298,35; 303,76; 298,65; 299,38; 300,36; 299,16; 300,86; 299,83; 302,52; 300,12; 301,81; 297,99; 299,23; 298,73; 303,07; 299,07; 297,83; ... ; 300,80

Dados Quantitativos:

Page 55: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

• No conjunto de dados mostrado não existe praticamente repetição de valores; logo, não é vantagem se utilizar os dados agrupados numa tabela de frequências, pois a mesma teria tantas linhas quanto o número de dados.

• No entanto, a tabela de frequências pode ser construída se os dados forem agrupados por classes:

Dados Quantitativos:

Page 56: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

ClassesFrequência

absoluta(ni)

Frequênciarelativa (%)

(fi)

Frequênciaabsoluta

acumulada (Ni)

Frequênciarelativa

acumulada (%)(Fi)

[297,00 ; 298,00[[298,00 ; 299,00[[299,00 ; 300,00[[300,00 ; 301,00[[301,00 ; 302,00[[302,00 ; 303,00[[303,00 ; 304,00[ [304,00 ; 305,00[[305,00 ; 306,00[

8 2128151110511

82128151110511

829577283939899

100

829577283939899

100

TOTAL 100 100%

Page 57: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados

Histograma

0

5

10

15

20

25

30

[297,00 ;298,00[

[298,00 ;299,00[

[299,00 ;300,00[

[300.00 ;301,00[

[301,00 ;302,00[

[302,00 ;303,00[

[303,00 ;304,00[

[304,00 ;305,00[

[305,00 ;306,00[

Peso (kg)

f i

Dados Quantitativos:

Page 58: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

I - Estatística Descritiva

Introdução Conceitos e definições Classificação dos dados Caracterização e apresentação dos dados Estatísticas amostrais Outras apresentações gráficas de dados Regressão linear

Page 59: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

Nas seções anteriores foi visto a sintetização de dos dados sob a forma de tabelas, gráficos e distribuição de frequências.

O cálculo de estatísticas amostrais é uma forma mais sintética de descrever um conjunto de dados, ou seja, possibilita representar um conjunto de dados relativos à observação de determinado fenômeno de forma reduzida.

As estatísticas amostrais são calculadas com base nos dados, a partir das quais é possível descrever globalmente o conjunto de valores que os referidos dados tomam.

Page 60: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a) Medidas de posição ou de tendência central:• Média aritmética, média geométrica, média harmônica,

mediana, quartis, decis, percentis e moda.

• Amplitude total, desvio médio, variância, desvio padrão, amplitude interquartílica e coeficiente de variação.

b) Medidas de dispersão:

• Medidas de assimetria e medidas de curtose.c) Medidas de forma:

As estatísticas amostrais ou medidas estatísticas são divididas em três grupos:

Page 61: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a) Medidas de posição:

• Essas medidas nos orientam quanto à posição da distribuição no eixo x (eixo dos números reais);

• Possibilitam comparações de séries de dados entre si pelo confronto desses números.

• São chamadas de medidas de tendência central, pelo fato de representarem os fenômenos pelos seus valores médios, em torno dos quais tendem a concentrar-se os dados.

Page 62: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.1) Média aritmética:

n

xx

n

1ii

(dados não agrupados)

a) Medidas de posição:

• Para um conjunto de n dados de xi (i = 1,2,..., n) a média aritmética simples ou média amostral, representada por é definida pela expressão:x

Page 63: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.1) Média aritmética:

87,2x15

4 1 1 31 25 5 7 3 2 3 31 2x

n

xx

n

1ii

2, 1, 3, 3, 2, 3, 7, 5, 5, 2, 1, 3, 1, 1, 4

• Exemplo: Determinar a média aritmética simples (média aritmética amostral) dos dados mostrados abaixo:

a) Medidas de posição:

Page 64: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.1) Média aritmética:

a) Medidas de posição:

• Quando os dados estiverem agrupados numa distribuição de frequência usa-se a média aritmética dos valores xi ponderadas pelas respectivas frequências absolutas ni, assim:

n

xnx

n

1iii

(dados agrupados)

Page 65: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.1) Média aritmética:

a) Medidas de posição:

• Exemplo (dados agrupados): Determinar a média aritmética simples (média aritmética amostral) da distribuição dada abaixo:

xi 1 2 3 4 5 7

ni 4 3 4 1 2 1

Page 66: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.1) Média aritmética:

87,2x1543

15)17(...)41(

n

nxx

n

1iii

a) Medidas de posição:

• Exemplo (dados agrupados): xi ni xini

123457

434121

46

124

107

Σ 15 43

Page 67: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.1) Média aritmética:

a) Medidas de posição

• No caso da variável ser contínua, visto que se perdeu os valores concretos do conjunto (ficaram afetos a uma determinada classe) não se pode calcular a média amostral diretamente dos valores dos dados.

Page 68: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.1) Média aritmética:

a) Medidas de posição:

• Deste modo, à cada classe vai ser atribuído um representante (xi), e a média amostral será calculada por meio desses representantes:

n

xnx

k

1iii

(dados agrupados em classes)

onde k é o número de classes do agrupamento, ni é a frequência absoluta da classe i e xi é o ponto médio da classe i, o qual é considerado como elemento representativo da classe.

Page 69: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.1) Média aritmética:

a) Medidas de posição:

• Exemplo (dados agrupados em classes): Determinar a média da distribuição a seguir, a qual representa o peso, em gramas, do conteúdo de uma série de 100 garrafas que, no decurso de um teste, saíram de uma linha de enchimento automático (exemplo anterior):

Page 70: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.1) Média aritmética:

a) Medidas de posição:

• Exemplo (dados agrupados em classes):

Classes ni xi xini

[297,00 ; 298,00[[298,00 ; 299,00[[299,00 ; 300,00[[300,00 ; 301,00[[301,00 ; 302,00[[302,00 ; 303,00[[303,00 ; 304,00[ [304,00 ; 305,00[[305,00 ; 306,00[

8 2128151110511

297,5298,5299,5300.5301,5302,5303,5304,5305,5

2380,06268,58386,04507,53316,53025,01517,5304,5305,5

Σ 100 30011,0

11,300x100

0,30011x

n

xnx

9

1iii

Page 71: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.1) Média aritmética (Ponderada)

a) Medidas de posição:

• Às vezes, associam-se os números x1, x2, ..., xk a certos fatores de ponderação ou pesos w1, w2, ... , wk que dependem do significado ou importância atribuída aos mesmos. Nesse caso

k21

kk2211

i

k

1iii

w...wwxw...xwxw

w

xwx

é denominada de média aritmética ponderada.

Page 72: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.1) Média aritmética (Ponderada)

a) Medidas de posição:

• Exemplo: Em um curso, a avaliação final tem peso 3 e as parciais peso 1; a nota média de um estudante que obtenha nota 8,5 na avaliação final e 7,0 e 9,0 nas provas parciais, será:

3,85

5,41311

)5,83()0,91()0,71(

w

xwx 3

1ii

3

1iii

Page 73: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.2) Média geométrica: A média geométrica G (ou ) de um conjunto de n números x1, x2, ..., xn é a raiz de ordem n do produto desses números:

a) Medidas de posição:

nn21 x...xxG

464842G 33

- Exemplo: A média geométrica dos números 2, 4 e 8:

Gx

Page 74: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.2) Média geométrica (dados agrupados): Se os elementos x1, x2, ..., xn ocorrem com as frequências n1, n2,..., nk, sendo n1+n2+...+nk = n a frequência total, a média geométrica G desses elementos será deduzida como:

a) Medidas de posição:

n nk

n2

n1n

vezesnkkk

vezesn222

vezesn111

k21

k21

x...xxxxxx...xxx...xxG

Page 75: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.3) Média harmônica: A média harmônica H (ou ) de um conjunto de n elementos x1, x2, ..., xn é a recíproca da média aritmética da recíproca dos elementos:

a) Medidas de posição:

n

1j j

n

1j j x1

n

x1

n1

1H

43,3

873

81

41

21

3

x1

nH n

1j j

- Exemplo: A média harmônica dos números 2, 4 e 8:

Hx

Page 76: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.4) Mediana: Para os dados colocados em ordem crescente, mediana (md, Me ou ) é o valor que divide a amostra,

ou população, em duas partes iguais. Assim:

a) Medidas de posição:

x~50% 100%0%

x~

Page 77: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.4) Mediana (série de elementos não agrupados):

a) Medidas de posição:

• Considerando que os dados que integram a amostra são colocados em ordem crescente, formando um vetor (x1, x2, ..., xn) - amostra ordenada -, a mediana amostral é definida como segue:

2

xxx~

xx~

22n

2n

21n n ímpar

n par

Page 78: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.4) Mediana (série de elementos não agrupados):

a) Medidas de posição:

• Exemplo: Para as distribuições abaixo, determinar as respectivas medianas:

8, 5, 15,11, 4, 1, 7, 2, 9

Ordenando:

1, 2, 4, 5, 7, 8, 9, 11,15

Como n é ímpar, então:

7xxx~ 52

1n

8, 5, 15,11, 4, 1, 7, 2, 9, 3

Ordenando:

1, 2, 3, 4, 5, 7, 8, 9, 11,15

Como n é par, então:

62

752

xx2

xxx~ 652

2n2n

Page 79: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.4) Mediana (variáveis discretas, dados agrupados em tabela de distribuição de frequência):

a) Medidas de posição:

• Exemplo: Para a distribuição abaixo, determinar a mediana:

xi ni Ni

1234

1352

149

11Σ 11

contém o 6º elemento

n = 11 (ímpar), logo será o elemento de ordem (n+1)/2, ou seja, (11+1)/2 = 6º elemento.

Da coluna da frequência acumulada crescente, encontra-se o valor xi correspondente à classe que contém a ordem calculada, assim: = 3.x~

x~

Page 80: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a) Medidas de posição:

• Exemplo: Para a distribuição abaixo, determinar a mediana:

xi ni Ni

8285878990

9121164

921323842

Σ 42 862

8785x~

22º

n = 42, é par, logo será a média entre os elemento de ordem n/2 e (n/2)+1, ou seja, 21º e 22º elementos.

Como no exemplo anterior, identificam-se os elementos de ordem 21 e 22 pela Ni, ou seja, 85 e 87, assim:

21º

x~

a.4) Mediana (variáveis discretas, dados agrupados em tabela de distribuição de frequência):

Page 81: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a) Medidas de posição:

• Exemplo: Para a distribuição abaixo, determinar a mediana:

xi ni Ni

8285878990

5101584

515303842

Σ 42

21º e 22º

n = 42, é par, logo será a média entre os elemento de ordem n/2 e (n/2)+1, ou seja, 21º e 22º elementos.

Como no exemplo anterior, identificam-se os elementos de ordem 21 e 22 pela Ni, ou seja, 87 e 87, assim:

872

8787x~

x~

a.4) Mediana (variáveis discretas, dados agrupados em tabela de distribuição de frequência):

Page 82: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a) Medidas de posição:

• Para variáveis contínuas, identifica-se a classe que contém a mediana (n/2), denominada classe Md (como a variável é contínua, não interessa se n é par ou ímpar); o valor aproximado para a mediana será calculado pela equação:

MdMd

1MdMd

Md

Md1Md

Md af

F5,0l

n

aN2n

lx~

onde: NMd-1 é a frequência absoluta acumulada da classe antes da classe mediana, n a dimensão da amostra e lMd , aMd e nMd são, respectivamente, o limite inferior, a amplitude e a frequência absoluta da classe mediana.

a.4) Mediana (variáveis contínuas com os dados divididos em classes, tabela de distribuição de frequência):

Page 83: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a) Medidas de posição:

• Exemplo: Dada a distribuição amostral, calcular a mediana:

Classes ni Ni

35 4545 5555 6565 7575 8585 95

512181463

51735495558

Σ 58

classe Md

a.4) Mediana (variáveis contínuas com os dados divididos em classes, tabela de distribuição de frequência):

Page 84: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a) Medidas de posição:

• Exemplo:

1º Passo: Calcula-se n/2; como n=58, então 58/2=29º.

2º Passo: Identifica-se a classe Md pela Ni (classe Md=3ª).

3º Passo: Aplica-se a fórmula: Neste caso li = 55, n = 58, Ni-1 = 17, ai = 10, ni = 18; logo:

67,6118

10172

58

55n

aN2n

lx~i

i1i

i

a.4) Mediana (variáveis contínuas com os dados divididos em classes, tabela de distribuição de frequência):

Page 85: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.5) Quartis:

a) Medidas de posição:

• Como já visto anteriormente, a mediana é a medida de posição que divide um conjunto de dados em duas partes iguais;

• Os quartis dividem um conjunto de dados em quatro partes iguais, assim:

50% 75%25%Q1 Q2 Q3

Page 86: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.5) Quartis:

a) Medidas de posição:

Q1 = 1º quartil, deixa 25% dos elementos;

Q2 = 2º quartil, coincide com a mediana, deixa 50% dos elementos;

Q3 = 3º quartil, deixa 75% dos elementos.

50% 75%25%Q1 Q2 Q3

Page 87: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.5) Quartis (série de elementos não agrupados):

a) Medidas de posição:

• A determinação de Qk (k = 1, 2 e 3), segue a fórmula:

4

1nkQk

• Exemplo: Determine o 1º e o 3º quartis da série 185, 196, 207, 305, 574, 597, 612. E da série 185, 196, 207, 305, 574, 597 ?

196elementoº24

171Q1

3,193elementoº75,14

161Q1

597elementoº64

173Q3

8,579elementoº25,54

163Q3

Page 88: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a) Medidas de posição:

• A determinação de Qk (k = 1, 2 e 3), segue os passos:

k

k

k

k QQ

1Q

Qk an

N4

kn

lQ

- 1º Passo: Calcula-se a ordem kn/4;

- 2º Passo: Identifica-se a classe Qk pela frequência acumulada N;

- 3º Passo: Aplica-se a fórmula:

a.5) Quartis (variáveis contínuas com os dados divididos em classes, tabela de distribuição de frequência):

Page 89: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a) Medidas de posição

• Exemplo: Dada a distribuição amostral, determinar Q1 e Q3:Classes ni Ni

35 4545 5555 6565 7575 8585 95

512181463

51735495558

Σ 58

classe Q1

classe Q3

a.5) Quartis (variáveis contínuas com os dados divididos em classes, tabela de distribuição de frequência):

Page 90: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a) Medidas de posição:

• Exemplo: Para Q1.

1º Passo: Calcula-se n/4; como n=58, então 58/4=14,5º.

2º Passo: Identifica-se a classe Q1 pela Ni (classe Q1 =2ª).

3º Passo: Aplica-se a fórmula: Neste caso lQ1 = 45, n = 58, NQ1-1 = 5, aQ1 = 10, nQ1 = 12; logo:

92,5210

1255,14

45an

N4n1

lQ1

1

1

1 QQ

1Q

Q1

a.5) Quartis (variáveis contínuas com os dados divididos em classes, tabela de distribuição de frequência):

Page 91: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a) Medidas de posição:

• Exemplo: Para Q3.

1º Passo: Calcula-se 3n/4; como n = 58, então 58/4 = 43,5º.

2º Passo: Identifica-se a classe Q3 pela NQ3 (classe Q3 = 4ª).

3º Passo: Aplica-se a fórmula: Neste caso lQ3 = 65, n = 58, NQ3-1 = 35, aQ3 = 10, nQ3 = 14; logo:

07,7110

14355,43

65an

N4n3

lQ3

3

3

3 QQ

1Q

Q3

a.5) Quartis (variáveis contínuas com os dados divididos em classes, tabela de distribuição de frequência):

Page 92: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a) Medidas de posição:

• Exemplo: Diante desses resultados, pode-se afirmar que, nesta distribuição, tem-se:

25% 25%25%25%52,92 61,67 71,0735 95

ou seja: O valor de 52,92 deixa 25% dos elementos; O valor de 61,67 deixa 50% dos elementos; O valor de 71,07 deixa 75% dos elementos.

a.5) Quartis (variáveis contínuas com os dados divididos em classes, tabela de distribuição de frequência):

Page 93: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.6) Decis:

a) Medidas de posição:

• Os decis dividem um conjunto de dados em dez partes iguais, assim:

D1

90%80%70%60%50%40%30%20%10%

D2 D3 D4 D5 D6 D7 D8 D9

Page 94: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.6) Decis:

a) Medidas de posição:

D1 = 1º decil, deixa 10% dos elementos da série;D2 = 2º decil, deixa 12% dos elementos da série;D5 = 5º decil, coincide com a mediana, deixa 50% dos

elementos da série;D6 = 6º decil, deixa 60% dos elementos da série;D7 = 7º decil, deixa 70% dos elementos da série;D8 = 8º decil, deixa 80% dos elementos da série;D9 = 9º decil, deixa 90% dos elementos da série.

Page 95: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.6) Decis (série de elementos não agrupados):

a) Medidas de posição:

• A determinação de Dk (k = 1, 2, ..., 9), segue a fórmula:

10

1nkDk

• Exemplo: Determine o 5º e o 6º decis da série 185, 196, 207, 305, 574, 597, 612.

305elementoº410

175D5

2,520elementoº8,410

176D6

Page 96: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a) Medidas de posição:

• A determinação de Dk (k = 1, 2, ..., 9), para o caso de variáveis contínuas com os dados divididos em classes, segue os passos:

k

k

k

k DD

1D

Dk an

N10kn

lD

- 1º Passo: Calcula-se a ordem kn/10;

- 2º Passo: Identifica-se a classe Dk pela frequência acumulada N;

- 3º Passo: Aplica-se a fórmula:

a.6) Decis (variáveis contínuas com os dados divididos em classes, tabela de distribuição de frequência):

Page 97: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.7) Percentis:

a) Medidas de posição:

• Os percentis dividem um conjunto de dados em cem partes iguais, assim:

P1

99%98%97%3% . . .2%1%

P2 P3 P50 P97 P98 P99

50% . . .

Page 98: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.7) Percentis:

a) Medidas de posição:

P1 = 1º percentil, deixa 1% dos elementos;P2 = 2º percentil, deixa 2% dos elementos.

P50 = 50º percentil, coincide com a mediana, deixa 50% dos elementos;

P99 = 99º percentil, deixa 99% dos elementos.

Page 99: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.7) Percentis (série de elementos não agrupados):

a) Medidas de posição:

• A determinação de Pk (k = 1, 2, ..., 99) para uma série de elementos não agrupados, segue a fórmula:

100

1nkPk

• Exemplo: Determine o 50º e o 60º percentis da série 185, 196, 207, 305, 574, 597, 612.

305elementoº4100

1750P50

2,520elementoº8,4100

1760D60

Page 100: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a) Medidas de posição:

• A determinação de Pk (k = 1, 2, ..., 99), para o caso de variáveis contínuas com os dados divididos em classes, segue os passos:

k

k

k

k PP

1P

Pk an

N100kn

lP

- 1º Passo: Calcula-se a ordem kn/100;

- 2º Passo: Identifica-se a classe Pk pela frequência acumulada N;

- 3º Passo: Aplica-se a fórmula:

a.7) Percentis (variáveis contínuas com os dados divididos em classes, tabela de distribuição de frequência):

Page 101: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.7) Exemplo (decil e percentil): Determinar o 4º decil e o 72º percentil da seguinte distribuição:

a) Medidas de posição:

Classes ni Ni

35 4545 5555 6565 7575 8585 95

512181463

51735495558

Σ 58

classe D4

classe P72

Cálculo de D4

34,551018

1710

584

55D

18n;10a

;58n;17N;55l

2,2310

58410kn

4

DD

1DD

o

44

44

1º Passo:

2º Passo:

3º Passo:

Page 102: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.7) Exemplo (decil e percentil): Determinar o 4º decil e o 72º percentil da seguinte distribuição:

a) Medidas de posição:

Classes ni Ni

35 4545 5555 6565 7575 8585 95

512181463

51735495558

Σ 58

classe D4

classe P72

Cálculo de P72

82,691014

35100

5872

65P

14n;10a

;58n;35N;65l

8,41100

5872100kn

72

PP

1PP

o

7272

7272

1º Passo:

2º Passo:

3º Passo:

Page 103: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.7) Exemplo (decil e percentil).

a) Medidas de posição:

• Portanto, na distribuição analisada, tem-se que:

- O valor 55,34 indica que 40% dos elementos da distribuição estão abaixo dele e os outros 60% acima.

- O valor 69,82 indica que 72% dos elementos da distribuição estão abaixo dele e os outros 28% acima.

Page 104: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.8) Moda

a) Medidas de posição:

• Moda (Mo) é a medida que indica o valor ou a gama de valores nos quais a concentração dos dados amostrais é máxima.

- Para variáveis discretas, a moda é o valor dos dados que ocorre com maior frequência;

- Para variáveis contínuas, a classe modal é o intervalo de classe com maior frequência.

Page 105: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.8) Moda

a) Medidas de posição:

• Assim, da representação gráfica dos dados, obtém-se imediatamente o valor que representa a moda ou a classe modal.

Page 106: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.8) Moda

a) Medidas de posição:

• Esta medida é especialmente útil para reduzir a informação de um conjunto de dados qualitativos, apresentados sob a forma de nomes ou categorias, para os quais não se pode calcular a média e por vezes a mediana (se não forem susceptíveis de ordenação).

Page 107: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.8) Moda (distribuições simples)

a) Medidas de posição:

• Para distribuições simples (sem agrupamento em classes), a identificação da moda é facilitada pela simples observação do elemento que apresenta maior frequência.

- Exemplo: Para a distribuição abaixo Mo = 248.

xi 243 245 248 251 307

ni 7 17 23 20 8

Page 108: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.8) Moda (dados agrupados)

a) Medidas de posição:

• Para dados agrupados em classe, existem diversas fórmulas para o cálculo da moda:

- Fórmula de Czuber: Após a identificação da classe modal, aplica-se a fórmula abaixo, onde

i21

1io alM

l = limite inferior da classe modal;Δ1= diferença entre a frequência absoluta da classe modal e a imediatamente anterior;Δ2 = diferença entre a frequência absoluta da classe modal e a imediatamente posterior; ai = amplitude da classe modal.

Page 109: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.8) Moda (dados agrupados)

a) Medidas de posição:

- Exemplo: Determinar a moda para a distribuição:

Classes ni

35 4545 5555 6565 7575 8585 95

512181463

- A classe com maior frequência absoluta é [55, 65[; logo, ela é a classe modal.

- Aplicando a fórmula de Czuber, tem-se:

61M

10)1418()1218(

121855M

alM

o

o

i21

1io

Page 110: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.8) Moda (dados agrupados)

a) Medidas de posição:

- Densidades de classes: Quando as amplitudes das classes são diferentes, deve-se calcular as densidades de classes para identificar a classe modal, as quais são obtidas por meio da relação ni/ai.

Page 111: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.8) Moda (dados agrupados)

a) Medidas de posição:

- Exemplo: Determinar a moda para a distribuição:

Salários (US$) ni ai ni/ai

80 180180 250250 300300 500

7014014060

1007050

200

0,72,02,80,3

12,26250)3,08,2()0,28,2(

0,28,2250alM i

21

1io

classe modal

Page 112: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

a.8) Moda (dados agrupados)

a) Medidas de posição:

- Fórmula de Pearson: Fornece uma boa aproximação quando a distribuição apresenta razoável simetria em relação à média. É dada pela relação:

x2x~3M o

ou seja, a moda é aproximadamente igual a diferença entre o triplo da mediana e o dobro da média

Page 113: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

Observações:

a) Medidas de posição:

1. Média versus Mediana:

Diferença entre estas duas medidas fica mais clara quando se considera o exemplo das notas obtidas por um aluno como sendo: 10, 13, 11, 15, 18, 16, 14, 15, 14; nesse caso, como pode ser comprovado, a média aritmética e a mediana são iguais a 14.

Se esse aluno elevar a nota mais baixa, passando de 10 para 14, a mediana ainda será o mesmo valor, mas o valor da média sofrerá um aumento, passando para 14,4.

Page 114: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

Observações:

a) Medidas de posição:

A média, ao contrário da mediana, é uma medida de posição muito pouco resistente, isto é, ela é muito influenciada por valores muito grandes ou muito pequenos, mesmo que estes valores surjam em pequeno número na amostra.

Estes valores são os responsáveis pela má utilização da média em muitas situações em que teria mais significado utilizar a mediana.

1. Média versus Mediana:

Page 115: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

Observações:

a) Medidas de posição:

Entretanto, a preferência de uma ou de outra dependerá do contexto em que forem utilizadas: se a distribuição é simétrica essas medidas coincidem; caso contrário, observar que a mediana não é tão sensível quanto a média, às observações que são muito maiores ou muito menores do que as restantes; além disso, a média reflete o valor de todas as observações.

1. Média versus Mediana:

Page 116: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

Observações:

a) Medidas de posição:

Representação das distribuições dos dados na forma de uma curva de frequência:

1. Média versus Mediana:

Page 117: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

Observações:

a) Medidas de posição:

A média geométrica de um conjunto de números positivos é menor ou igual à sua média aritmética, mas é maior ou igual à sua média harmônica:

xGH

O sinal de igualdade somente é válido quanto todos os números do conjunto de dados são idênticos.

2. Relação entre as médias aritmética, geométrica e harmônica:

Page 118: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

• São medidas estatísticas utilizadas para avaliar o grau de variabilidade ou dispersão, dos valores em torno da média.

• Servem para medir a representatividade da média

b) Medidas de dispersão

- Exemplo: Sejam as séries 20, 20, 20 e 15, 10, 20, 25, 30, como pode ser calculado, ambas possuem média aritmética igual a 20; entretanto, na primeira não existe dispersão, enquanto a segunda apresenta dispersão em torno da média 20; portanto, a média é muito mais representativa para a segunda série.

Page 119: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

- Exemplo: Para a série 10, 12, 15, 24, 25, 30, 36

R = 36 – 10 = 26

b.1) Amplitude total (ou amplitude amostral): É definida como sendo a diferença entre o maior e o menor dos valores da série, ou seja:

minmáx xxR

- Observação: É uma medida de dispersão muito limitada, pois depende apenas dos valores externos, o que a torna instável, não sendo afetada pela dispersão dos valores internos.

Page 120: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

b.2) Desvio médio: O desvio médio de um conjunto de n números x1, x2 , ... , xn é definido por:

nxx

n

xx

n

dD

n

1ii

n

1ii

M

onde

xx i

média aritmética dos números;valor absoluto do desvio de cada número em relação à média aritmética.

x

Page 121: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

b.2) Desvio médio (dados agrupados): Se x1, x2 , ... , xn ocorrerem com as frequências n1, n2, ... , nn, respectivamente, o desvio médio poderá ser indicado da seguinte forma:

nxxn

n

xxn

n

dnD i

n

1iii

n

1iii

M

Page 122: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

b.3) Variância: A variância de um conjunto de dados é definida como o quadrado do desvio padrão, evitando-se com isso que Σdi=0.

- Quando é necessário distinguir entre o desvio padrão de uma população e o de uma amostra dela extraída, adota-se frequentemente o símbolo σ para o primeiro e s para o último.

Page 123: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

b.3) Variância:

- Para o caso da variância populacional são adotadas as seguintes fórmulas:

N)Xx(

N

)Xx( 2

n

1i

2i

2

(dados não agrupados)

N)Xx(n

N

)Xx(n 2i

k

1i

2ii

2

(dados agrupados)

média populacional; X tamanho da população. N

Page 124: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

b.3) Variância:

- Para o caso da variância amostral são adotadas as seguintes fórmulas:

1n)xx(

1n

)xx(s

2

n

1i

2i

2

(dados não agrupados)

1n)xx(n

1n

)xx(ns

2i

k

1i

2ii

2

(dados agrupados)

média amostral; x tamanho da amostra. n

Page 125: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

b.3) Variância:

• Fórmulas práticas para os cálculos das variâncias:

N

xnxn

N1

2ii2

ii2

n

xnxn

1n1

s2

ii2ii

2

Page 126: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

b.4) Desvio padrão: Uma vez que a variância envolve a soma de quadrados, a unidade em que se exprime não é a mesma que a dos dados. Assim, para se conseguir uma medida da variabilidade ou dispersão com as mesmas unidades que os dados, toma-se a raiz quadrada da variância e obtém-se o desvio padrão.

2

2

ss

(desvio padrão populacional)

(desvio padrão amostral)

Page 127: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

b.4) Desvio padrão:

• O desvio padrão é uma medida que só pode assumir valores não negativos e quanto maior for, maior será a dispersão dos dados.

• Algumas propriedades do desvio padrão, que resultam imediatamente da definição, são:- o desvio padrão é sempre não negativo e será tanto maior,

quanta mais variabilidade houver entre os dados;- se s= 0, então não existe variabilidade, isto é, os dados são

todos iguais.

Page 128: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

b.4) Desvio padrão:

• Exemplo: Calcular o desvio médio, a variância e o desvio padrão da seguinte distribuição amostral:

xi 5 7 8 9 11

ni 2 3 5 4 2

xi ni nixi

578911

23542

1021403622

Σ 16 12906,8

16129

16

xn

n

xnx

5

1iii

k

1iii

- Média aritmética:

Page 129: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

b.4) Desvio padrão:

• Exemplo: Calcular o desvio médio, a variância e o desvio padrão da seguinte distribuição amostral:

2,116

24,19n

xxnD i

M

xi ni nixi |xi-x| = |di| ni|di|

578911

23542

1021403622

|5 – 8,06| = 3,06|7 – 8,06| = 1,06|8 – 8,06| = 0,06|9 – 8,06| = 0,94

|11 – 8,06| = 2,94

6,123,180,303,765,88

Σ 16 129 19,24

- Desvio médio:

Page 130: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

b.4) Desvio padrão:

• Exemplo: Calcular o desvio médio, a variância e o desvio padrão da seguinte distribuição amostral:

xi ni nixi nixi2

5789

11

23542

1021403622

50147320324242

Σ 16 129 1.083

- Variância:

86,216

)129(083.1

1161

s

nxn

xn1n

1s

22

2ii2

ii2

- Desvio padrão:69,186,2ss 2

Page 131: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

b.5) Amplitude interquartílica:

• A medida anterior tem a grande desvantagem de ser muito sensível à existência, na amostra, de uma observação muito grande ou muito pequena.

• Por esse motivo, define-se uma outra medida, a amplitude interquartílica.

Page 132: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

b.5) Amplitude interquartílica:

• Esta medida é, de certa forma, uma solução de compromisso, pois não é afetada, de um modo geral, pela existência de um pequeno número de valores demasiadamente grandes ou pequenos. É definida como sendo a diferença entre o 3º e 1º quartis; assim:

13Q QQD

Page 133: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

b.5) Amplitude interquartílica:

• Da definição de amplitude interquartílica, pode-se concluir que 50% dos elementos do meio da amostra estão contidos num intervalo com aquela amplitude. Esta medida é não negativa e será tanto maior quanto maior for a variabilidade nos dados.

• Ao contrário do que acontece com o desvio padrão, uma amplitude interquartílica nula não significa necessariamente, que os dados não apresentem variabilidade.

Page 134: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

b.5) Amplitude interquartílica:

• Alguns autores preferem calcular uma medida próxima da referida: a amplitude semi-interquartílica (ASI).

2QQ

ASI 13

Page 135: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

b.6) Coeficiente de variação:

• A variação ou dispersão real, determinada a partir do desvio padrão, ou qualquer outra medida de dispersão, é denominada dispersão absoluta; entretanto, uma variação ou dispersão, na medida de uma determinada distância, é inteiramente diferente quanto ao efeito, da mesma variação em uma distância menor.

Page 136: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

b.6) Coeficiente de variação:

• A medida desse efeito é proporcionada pela dispersão relativa, definida por:

MédiaabsolutaDispersão

relativaDispersão

Page 137: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

b.6) Coeficiente de variação:

• Se a dispersão absoluta é o desvio padrão e a média é a aritmética, a dispersão relativa é denominada coeficiente de variação ou de dispersão, dado por:

• coeficiente de variação é uma medida relativa de dispersão, útil para a comparação em termos relativos do grau de concentração em torno da média de séries distintas.

100xs

CVou100X

CV

Page 138: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

b.6) Coeficiente de variação:

• Exemplo: Em uma empresa, o salário médio dos homens é de $4.000,00, com desvio padrão de $1.500,00, e o das mulheres é em média de $3.000,00, com desvio padrão de $1.200,00. Então:

• Desses valores conclui-se, portanto, que o salário das mulheres apresentam maior dispersão que os dos homens

%0,4010030001200

100X

CV

%5,3710040001500

100X

CV

Para os homens:

Para as mulheres:

Page 139: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

b) Medidas de dispersão

b.6) Coeficiente de variação:

• Diz-se que a distribuição possui baixa, média ou alta variabilidade (dispersão) conforme os seguintes valores:

Baixa dispersão: CV ≤ 10%Média dispersão: 10% < CV < 20%Alta dispersão: CV ≥ 20%

• Alguns analistas consideram valores diferentes:

Baixa dispersão: CV ≤ 15%Média dispersão: 15% < CV < 30%Alta dispersão: CV ≥ 30%

Page 140: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

c) Medidas de forma

• Uma distribuição de frequência pode simétrica, assimétrica positiva ou assimétrica negativa.

c.1) Medidas de assimetria:• Denomina-se assimetria o grau de desvio ou

afastamento da simetria de uma distribuição.

Page 141: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

c) Medidas de forma

• Uma distribuição simétrica apresenta a igualdade entre as três medidas de posição, média aritmética, mediana e modo, ou:

xx~M o

xx~M o

• Em uma distribuição assimétrica positiva, ou assimétrica à direita, tem-se que:

• Em uma distribuição assimétrica negativa, ou assimétrica à esquerda, tem-se que:

oMx~x

c.1) Medidas de assimetria:

Page 142: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

c) Medidas de forma

• Existem várias fórmulas para o cálculo do coeficiente de assimetria, dentre elas duas são bastante utilizadas:

- 1º Coeficiente de Pearson:sMx

ASouMx

AS oo

- 2º Coeficiente de Pearson:13

31

QQx~2QQ

AS

• Se AS = 0, a distribuição é simétrica AS > 0, a distribuição é assimétrica positiva AS < 0. a distribuição é assimétrica negativa.

c.1) Medidas de assimetria:

Page 143: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

c) Medidas de forma

• Exemplo: Identificar o grau de assimetria da distribuição:

c.1) Medidas de assimetria:

Salários ($1.000,00) 30 50 50 100 100 150Empregados 80 50 30

Page 144: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

c) Medidas de forma

• Exemplo:

c.1) Medidas de assimetria:

Classes xi ni nixi nixi2 ni/ai Ni

30 50 50

100100

150

4075125

805030

320037503750

128.000281.250468.

750

80/20 = 450/50 = 130/50 =

0,6

80130160

Σ 160

10.700

878.000

Page 145: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

c) Medidas de forma

• Exemplo:

c.1) Medidas de assimetria:

6,04090

29040QQ

x~2QQAS96,31s

796,096,31

429,4185,66sMx

AS62,1021160

)700.10(000.878

1591

s

502080

)080(30x~429,4120

344

30M

905050

)80120(50Q62,1021

160)700.10(

000.878159

1s

402080

)040(30Q875,66

160700.10

x

13

31

o2

2

o

3

22

1

- Como AS > 0, então a distribuição é assimétrica positiva.

Page 146: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

c) Medidas de forma

• Denomina-se curtose o grau de achatamento de uma distribuição.

• Uma distribuição de frequência pode ser:

- Mesocúrtica: quando sua forma nem é achatada e nem delgada;

- Leptocúrtica: quando apresenta a forma delgada;- Platicúrdica: quando apresenta a forma achatada.

c.2) Medidas de curtose:

Page 147: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

c) Medidas de forma

c.2) Medidas de curtose:

Page 148: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

c) Medidas de forma

• Para medir o grau de curtose utiliza-se o coeficiente:

)PP(2QQ

K1090

13

onde Q3 = 3º quartil; P90 = 90º percentil; Q1 = 1º quartil; P10 = 10º percentil.

• Se K = 0,263 – a curva correspondente à distribuição é mesocúrtica; K > 0,263 – a curva é platicúrdica; K < 0,263 – a curva é leptocúrdica.

c.2) Medidas de curtose:

Page 149: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais

c) Medidas de forma

• Exemplo: Para a mesma distribuição do exemplo da assimetria, calcula-se ainda P10 e P90; logo:

c.2) Medidas de curtose:

355,0)34375,104(2

4090)PP(2

QQK

375,10450160

)130144(100P

342080

)016(30P

1090

13

90

10

- Como K > 0,273, então a distribuição é do tipo platicúrtica.

Page 150: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

Introdução Conceitos e definições Classificação dos dados Caracterização e apresentação dos dados Estatísticas amostrais Outras apresentações gráficas de dados Regressão linear

I - Estatística Descritiva

Page 151: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.6 Outras Apresentações Gráficas de Dados

• Além dos diagramas já estudados, existem outras formas bastante utilizadas internacionalmente para apresentar os dados amostrais. Um bom modo de obter uma apresentação visual eficiente de um conjunto de dados pode ser conseguido por meio de três tipos de gráficos: diagramas de pontos, diagramas de ramo e folhas, e diagramas de caixa.

• O diagrama de pontos é uma apresentação útil de dados, no caso de amostras pequenas (até cerca de 20 observações). Entretanto, quando o número de observações for moderadamente alto, o diagrama de ramo e folhas e o diagrama de caixa podem ser mais úteis.

• Questões como quantidades de dados abaixo de certo valor, tendência central (média ou mediana), dispersão (desvio-padrão), possibilidade de detectar outliers (pontos bastante diferentes do conjunto de dados) e o desvio da simetria, não são fáceis de responder, pois existem muitas observações, e a construção de um diagrama de pontos, usando esses dados, seria relativamente ineficiente .

Page 152: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

Diagrama de pontos

• Um diagrama de pontos é um gráfico estatístico que consiste em grupos de pontos de dados traçados em uma escala simples.

• São utilizados para dados contínuos, quantitativos e

univariados, e são muito úteis para exibir um pequeno conjunto de dados.

• Esse tipo de gráfico permite uma fácil visualização de duas características dos dados: a posição (meio) e a dispersão (espalhamento ou variabilidade)

1.6 Outras Apresentações Gráficas de Dados

Page 153: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

Diagrama de pontos

• Exemplo 01 (Montgomery, 2004, p.2-3): Um engenheiro está projetando um conector de náilon para ser usado em aplicação automotiva. Ele considera estabelecer como especificação do projeto uma espessura de 3/32 pol., mas está inseguro. Oito unidades do protótipo são produzidas e suas forças de remoção são medidas, resultando nos seguintes dados (em libras): 12,6; 12,9; 13,4; 12,3; 13,6; 13,5; 12,6 e 13,1. Construa um diagrama de pontos para esses dados.

1.6 Outras Apresentações Gráficas de Dados

12 14 15 13

Força de remoção

Page 154: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

Diagrama de pontos

• Exemplo 02: O engenheiro do exemplo anterior decide considerar um projeto alternativo com uma espessura maior da parede do conector, 1/8 pol. Oito protótipos desse projeto são construídos, sendo as medidas observadas da força de remoção, resultando nos seguintes dados (em libras): 12,9; 13,7; 12,8; 13,9; 14,2; 13,2; 13,5 e 13,1. Construa um diagrama de pontos para esses dados, sobrepondo-o ao anterior para uma melhor análise da influência da espessura da parede na força de remoção.

1.6 Outras Apresentações Gráficas de Dados

12 14 15 13,0 13,4 Força de remoção

3/32 pol.1/8 pol.

Page 155: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

Diagrama de ramo e folhas

• Esta forma de apresentação de dados tem sido frequentemente utilizada em trabalhos técnicos do mundo inteiro.

• Para construir o diagrama de ramo e folhas, dividimos o elemento amostral em duas partes: um ramo (stem), consistindo em um ou mais dígitos iniciais, e uma folha (leaf), consistindo nos dígitos restantes. Exemplo: O dado 458 é dividido em duas partes, a primeira parte 45, e a segunda parte 8.

• Geralmente, escolhe-se relativamente poucos ramos em comparação

ao número de observações (5 a 20 itens).

1.6 Outras Apresentações Gráficas de Dados

Page 156: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

Diagrama de ramo e folhas

• Exemplo (Montgomery, 2004, p.16): Considere o conjunto de dados abaixo, relativos à resistência a compressão de uma liga de alumínio.

105 221 183 186 121 181 180 143 97 154 153 174 120 168 167 141 245 228 174 199 181 158 176 110 163 131 154 115 160 208 158 133 207 180 190 193 194 133 156 123 134 178 76 167 184 135 229 146 218 157 101 171 165 172 158 169 199 151 142 163 145 171 148 158 160 175 149 87 160 237 150 135 196 201 200 176 150 170 118 149

O diagrama de ramo e folhas resultante é apresentado a seguir:

1.6 Outras Apresentações Gráficas de Dados

Page 157: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

Diagrama de ramo e folhas (dados brutos)Ramo Folha Frequência

7 8 9101112131415161718192021222324

6775 15 8 01 0 34 1 3 5 3 52 9 5 8 3 1 6 94 7 1 3 4 0 8 8 6 8 0 83 0 7 3 0 5 0 8 7 9 8 5 4 4 1 6 2 1 0 60 3 6 1 4 1 0 9 6 0 9 3 4 7 1 0 8 81 8 9 75

1 1 1 2 3 3 6 8121010 7 6 4 1 3 1 1

1.6 Outras Apresentações Gráficas de Dados

Page 158: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

Diagrama de ramo e folhas (dados ordenados)Ramo Folha Frequência

7 8 9101112131415161718192021222324

6771 50 5 80 1 31 3 3 4 5 51 2 3 5 6 8 9 90 0 1 3 4 4 6 7 8 8 8 80 0 0 3 3 5 7 7 8 90 1 1 2 4 4 5 6 6 8 0 0 1 1 3 4 60 3 4 6 9 9 0 1 7 8 81 8 9 75

1 1 1 2 3 3 6 8121010 7 6 4 1 3 1 1

1.6 Outras Apresentações Gráficas de Dados

Page 159: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

Diagrama de ramo e folhas

• Em alguns casos pode ser desejável construir mais intervalos ou ramos. Uma maneira de fazer isto seria dividir o ramo escolhido em dois ou mais novos ramos, conforme mostrado abaixo:

Ramo Folha

14L14U15L15U

1 2 3 5 6 8 9 90 0 1 3 4 4 6 7 8 8 8 8

Ramo Folha 14z14t14f14s14e15z15t15f15s15e

1 235

0 01 3 4 4 6 7 88 8 8

1.6 Outras Apresentações Gráficas de Dados

Page 160: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

Diagrama de ramo e folhas

Frequência acumulada Ramo Folha

1235811172537

(10)332316106521

7 8 9101112131415161718192021222324

6771 50 5 80 1 31 3 3 4 5 51 2 3 5 6 8 9 90 0 1 3 4 4 6 7 8 8 8 80 0 0 3 3 5 7 7 8 90 1 1 2 4 4 5 6 6 8 0 0 1 1 3 4 60 3 4 6 9 9 0 1 7 8 81 8 9 75

1.6 Outras Apresentações Gráficas de Dados

N = 80Min = 76Max = 245Média = 162,7Mediana = 161,5Q1 = 143,50Q3 = 181,00S2 = 33,77

Page 161: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

Diagrama de ramo e folhas

1.6 Outras Apresentações Gráficas de Dados

• Exercício (Montgomery, 2004, p.17): Os seguintes dados são os números de ciclos até a falha, de corpos de prova de alumínio, sujeitos a uma tensão alternada repetida, de 21.000 psi e 18 ciclos por segundo:

1115131015401502125813151085 79810208652130142111091481

15671883120312701015 8451674101611021605 7062215 785 885

1223 375226519101018145218902100159420231315126912601888

1782152217921000182019401120 910173011021578 75814161560

105517641330160815351781175015011238 9901468151217501642

Page 162: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

Diagrama de ramo e folhas

1.6 Outras Apresentações Gráficas de Dados

• (a) Construa um diagrama de ramo e folhas para esses dados. (b) Você acha que o corpo de prova “sobreviverá” além de 2.000 ciclos? Justifique a sua resposta. (c) Encontre a mediana e os quartis.

Profundidade Ramo Folha

1581017222933(5)322218117542

3 7 8 910111213141516171819202122

7506 58 85 9845 65 8510 9000 15 16 18 20 55 85 02 02 09 15 2003 23 38 58 60 69 7010 15 15 3016 21 52 68 8101 02 12 22 35 40 60 67 78 94 05 08 42 7430 50 50 64 81 82 9220 83 88 9010 402300 3015 65

b) Não. A probabilidade é muito pequena.c) M = 1436,5 Q1 = 1097,8 Q3 = 1735

a)

Page 163: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

Diagrama de caixa (box plot)

1.6 Outras Apresentações Gráficas de Dados

• Uma outra forma gráfica de apresentar os dados é o chamado diagrama de caixa (box plot) ou diagrama de caixa e linhas (box and whiskers), que permite descrever simultaneamente vários fatores importantes de uma série de dados, tais como a tendência central (média ou mediana), a dispersão (desvio-padrão), a possibilidade de detectar outliers (pontos bastante diferentes do conjunto de dados) e o desvio da simetria.

• Um diagrama de caixa apresenta três quartis, em uma caixa retangular, alinhados tanto horizontal como verticalmente; opcionalmente, pode apresentar a média.

Page 164: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

Diagrama de caixa (box plot)

1.6 Outras Apresentações Gráficas de Dados

• A caixa inclui a amplitude interquartil, com o canto esquerdo (ou inferior) no primeiro quartil, Q1, e o canto direito (ou superior) no terceiro quartil, Q3. Portanto, o comprimento da caixa é igual a amplitude interquartil , DQ = Q3 - Q1.

• Uma linha é desenhada através da caixa, no segundo quartil (que é o percentil 50 ou a mediana), Q2. A média, como já dito, é opcional.

• Uma linha (whisker) estende-se de cada extremidade da caixa. • A linha inferior (ou esquerda) começa no primeiro quartil indo até o

menor valor do conjunto de pontos dentro das amplitudes interquartis de 1,5, a partir do primeiro quartil.

Page 165: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

Diagrama de caixa (box plot)

1.6 Outras Apresentações Gráficas de Dados

• A linha superior (ou direita) começa no terceiro quartil indo até o maior do conjunto de pontos dentro das amplitudes interquartis de 1,5, a partir do terceiro quartil.

• Dados mais afastados dos que as linhas são plotados como pontos individuais. Um ponto além da linha, porém a menos de 3 amplitudes interquartis a partir da extremidade da caixa, é chamado de dispersos (outliers).

• Um ponto a mais de 3 amplitudes interquartis a partir da extremidade da caixa é chamado de um outlier extremo. Ocasionalmente, símbolos diferentes (círculos abertos e fechados, por exemplo) são usados para identificar os dois tipos de outlier.

Page 166: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

Diagrama de caixa (box plot)

1.6 Outras Apresentações Gráficas de Dados

Page 167: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

Diagrama de caixa (box plot)

1.6 Outras Apresentações Gráficas de Dados

• Exercício: Represente o diagrama de caixa para os dados da resistência à compressão do alumínio mostrados no exercício anterior.

N = 80Min = 76Max = 245Média = 162,7Mediana = 161,5Q1 = 143,50Q3 = 181,00

Page 168: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

Introdução Conceitos e definições Classificação dos dados Caracterização e apresentação dos dados Estatísticas amostrais Outras apresentações gráficas de dados Regressão linear

I - Estatística Descritiva

Page 169: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Introdução

• A análise de regressão é uma técnica estatística para investigar e modelar a relação entre variáveis, sendo uma das mais utilizadas na análise de dados.

• É denominada “linear” porque se considera que a relação da resposta às variáveis é uma função linear de alguns parâmetros.

• Os modelos de regressão que não são uma função linear dos parâmetros se chamam modelos de regressão não-linear.

Page 170: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Introdução

• A regressão linear pode ser simples ou múltipla.

• A regressão simples envolve duas variáveis (estimadores): uma variável dependente e uma variável independente.

• A regressão múltipla envolve três ou mais variáveis, ainda uma única variável dependente, porém duas ou mais variáveis independentes (explicativas).

Page 171: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Regressão Linear Simples Relação entre duas variáveis

• Em inúmeras ocasiões o estudo descritivo não se resume ao estudo de apenas uma variável; para se ter uma visão global do problema em estudo, muitas vezes é necessário a observação de duas ou mais variáveis.

• Nesse caso, em vez de uma amostra (x1, x2, ..., xn), passa-se a ter dados bivariados (xi, yi), i = 1, 2, ..., n.

• Um dos objetivos desse estudo é a relação existente entre as variáveis do par.

Page 172: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Correlação linear

• Para se ter uma ideia de como as duas variáveis se relacionam é comum representar graficamente esta relação por meio de um diagrama de dispersão. Esta representação consiste na marcação das observações em um sistema de eixos cartesianos.

• Se as variáveis fornecem um diagrama de dispersão em que os pontos se colocam ao redor de uma reta crescente ou decrescente, diz-se que essas variáveis estão linearmente correlacionadas.

Page 173: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Correlação linear

• Quanto menor a dispersão dos pontos em torno da reta, mais forte será a correlação.

• A correlação linear será positiva ou negativa caso a tendência da reta seja crescente ou decrescente.

• Se nenhuma tendência positiva ou negativa pode ser detectada, a explicação possível para os valores da segunda variável é sua média. Nesse caso, o eixo da dispersão será horizontal, contendo a média da segunda variável, e diz-se que as variáveis não são linearmente correlacionadas.

Page 174: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Correlação linear

y

x

Correlação linear forte

(positiva)

y

x

Correlação linear forte

(negativa)

y

x

Correlação linear fraca

(positiva)

Page 175: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Correlação linear

y

x

Variáveis não correlacionadas

y

x

Variáveis não correlacionadas

linearmente

y

x

Variáveis não correlacionadas

linearmente

y

Page 176: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Correlação linear• Exemplo: A tabela abaixo mostra os dados da temperatura do gás

combustível (ºF) e da respectiva taxa de calor (Btu/kwh) para uma turbina de combustão, para ser usada em refrigeração, construa o diagrama de dispersão para esses dados.

x 100 125 150 175 200 225 250 275

y 99,1 98,8 98,5 98,5 98,5 98,2 98,0 97,8

x 300 325 350 375 400 425 450 500

y 97,8 97,8 97,6 97,5 97,3 97,0 96,8 96,7

• Desse diagrama pode-se extrair que talvez exista uma correlação linear entre as variáveis; esta relação pode ser traduzida por meio de uma reta.

Page 177: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Coeficiente de correlação linear

• A determinação da correlação entre duas variáveis por meio de uma inspeção nos pares anotados ou no diagrama de dispersão correspondente é pouco precisa e subjetiva.

• Essa dificuldade pode ser contornada pelo uso de uma medida que caracterize a correlação linear e seja independente do observador que esteja examinando os dados.

Page 178: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Coeficiente de correlação linear

• Karl Pearson propôs o chamado coeficiente de correlação linear, o qual é dado pela relação:

2y

2x ss

)y,x(Covr

onde: Cov (x,y) é a covariância das variáveis x e y, e seu cálculo é dado por

1n)yy()xx(

)y,x(Cov

e sx2 e sy

2 são as variâncias da variáveis x e y.

Page 179: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Coeficiente de correlação linear

• Fazendo-se as devidas substituições e simplificações, obtém-se o coeficiente de correlação de forma mais simples:

yyxx

xy

ss

sr

nx

xs2

2xx

ny

ys2

2yy

onde:

nyx

xysxy

1r1

Page 180: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Coeficiente de correlação linear

• r = -1, indica correlação linear negativa perfeita; os pontos (x,y) estão sobre uma reta com coeficiente angular negativo.

• r = 0, indica que os pontos não estão correlacionados, nem apresentam tendência crescente ou decrescente.

• r = 1, indica correlação linear positiva perfeita; os pontos (x,y) estão sobre uma reta com coeficiente angular positivo.

Page 181: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Coeficiente de correlação linear

• Nos casos em que os pontos do diagrama de dispersão estão em uma reta vertical ou horizontal, o quociente que calcula o coeficiente de correlação não está definido, pois apresenta numerador e denominador nulos. Nesse caso, o coeficiente de correlação será considerado nulo.

r = 0, Cov (x,y) = 0, sy2 = 0

y

x

r = 0, pois Cov (x,y) = 0, sx2 = 0

y

x

Page 182: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Coeficiente de correlação linear

• A correlação entre duas variáveis pretende captar o fato dessas variáveis apresentarem a mesma tendência ao crescimento, ou tendências contrárias.

• O fato de duas variáveis evoluírem no mesmo sentido ou em sentidos opostos fornece uma ideia do que se pode esperar sobre um valor desconhecido da variável y para um particular valor de x.

Page 183: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Coeficiente de correlação linear

xy

• Se as variáveis x e y são positivamente correlacionadas, e se procura estimar o valor de y1 para certo valor x1 menor que a média , deve-se esperar o valor correspondente y1 menor que a média ; para um valor x2 maior que a média , deve-se esperar um valor y2 maior que a média , acompanhando a tendência do eixo crescente dos pontos.

x

y

y

x

y2

y1

x2x1 x

y

Page 184: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Coeficiente de correlação linear

• Os problemas que envolvem estimativas de valores desconhecidos a partir de valores históricos são chamados problemas de previsão ou predição.

• O conhecimento da correlação entre duas variáveis, embora possa fornecer uma pista para a previsão de um valor desconhecido de uma delas, nada informa a respeito da qualidade dessa previsão, ou seja, não se pode, em geral, com base apenas no conhecimento da correlação, transformar a incerteza da previsão em risco (isto só é possível quando a correlação é perfeita).

• Entretanto, o fato de duas variáveis serem correlacionadas levanta a possibilidade de uma relação causal entre elas, o que é importante em problemas de previsão.

Page 185: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Regressão linear simples

• Como visto anteriormente, uma previsão construída baseada nas informações obtidas da correlação nada diz a respeito da confiabilidade do valor previsto.

• Um método de previsão que permite a avaliação em termos de confiabilidade é a regressão linear, pois, satisfeitas determinadas condições, ela proporciona a transformação da incerteza em risco

Page 186: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Regressão linear simples – Modelo teórico

• Quando se verifica, quer por meio do gráfico de dispersão, quer pelo coeficiente de correlação linear, uma correlação forte entre duas variáveis, a relação entre essas variáveis pode ser descrita por meio de uma reta de regressão (a reta que melhor se ajusta aos dados).

• Essa reta serve de modelo matemático para expressar a relação linear entre duas variáveis.

Page 187: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Regressão linear simples – Modelo teórico

• Considere o relacionamento de duas variáveis x e y com as seguintes características:

x: é a variável cujos valores são controlados e, portanto, determinados; ela é conhecida por variável independente ou variável de decisão;

y: variável aleatória; é a variável que se quer prever; seu valor depende do valor atribuído a x, embora para cada valor de x se possa ter vários valores de y, devido a sua característica aleatória (variável dependente de x).

Page 188: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Regressão linear simples – Modelo teórico

• O modelo teórico define a verdadeira reta de regressão, cuja equação pode ser escrita como:

xy

y

O valor de y é dado por:

onde:

UxyouUyy

é a parte funcional de y (a parte do valor de y explicada pelo valor de x);

U é a parte aleatória de y, a qual é introduzida no valor de y por fatores imponderáveis.

Page 189: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Regressão linear simples – Modelo teórico

• Nessas condições, dado um valor para x, a previsão ou expectativa para o correspondente valor de y é:

• Entretanto, dificilmente se conhece a população dos valores de y para cada valor da variável controlada x. O que se conhece, geralmente, são alguns valores dos pares (x,y), ou seja, apenas uma amostra dessas variáveis.

• Portanto, com base nos dados amostrais, deve-se pensar como estimar os valores de α e β, o que pode ser feito de forma eficiente por meio do método dos mínimos quadrados.

xy

Page 190: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Método dos mínimos quadrados

• Um dos métodos mais utilizados para ajustar uma reta a um conjunto de dados é o Método dos Mínimos Quadrados (MMQ), o qual consiste em determinar a reta que minimiza a soma dos quadrados dos desvios (os chamados erros ou resíduos) entre os verdadeiros valores de y e os valores estimados a partir da reta de regressão que se pretende ajustar, ŷ.

ŷ = a + bx

Page 191: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Método dos mínimos quadrados

• Adota-se o quadrado das diferenças, pois como os pontos se situam acima e abaixo da reta estimada, as diferenças podem ser positivas ou negativas, e na soma podem anular-se, não refletindo o ajustamento.

• Sendo números positivos, esses quadrados refletem a qualidade do ajuste através de sua soma.

Page 192: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Método dos mínimos quadrados

• O modelo de regressão linear é a reta de regressão ŷi = a + bxi + εi

onde ŷ é o estimador de y; a e b os estimadores de α e β.

2ii

2ii

2i )]bxa(y[min)yy(minmin

• A reta estimada é obtida de tal modo que a soma dos quadrados dos desvios ou resíduos (εi = yi – ŷ) seja mínima, ou seja,

Page 193: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Método dos mínimos quadrados

• Como tal, para estimar os parâmetros do modelo, é necessário que as primeiras derivadas em relação a a e a b sejam nulas, e as segundas sejam maiores ou iguais a zero, assim:

0)bxay(b

0)bxay(a

2ii

2ii

xx

xy2

2ss

n

xx

n

yxxy

b,xbyn

xb

n

ya

As estimativas dos mínimos quadrados para os parâmetros α e β são:

Page 194: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Coeficiente de explicação

• Calculada a estimativa de mínimos quadrados para uma amostra dada, deve-se verificar a qualidade do ajuste dessa reta aos dados históricos.

• Uma forma de medir a qualidade do ajuste é verificar qual a porcentagem da variação dos valores de y em relação à sua média pode ser explicada pela regressão de y sobre x, o que dará origem ao coeficiente de explicação R2.

Page 195: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Coeficiente de explicação

• Do gráfico abaixo, onde ŷ = a + bx é a regressão de y sobre x, observa-se que o valor de yi correspondente a um valor xi pode ser composto de duas partes: a parte explicada pela média e a parte não explicada pela média.

y

y parte do valor de y explicada pela média

parte do valor de y explicada pela regressão yy

parte do valor de y não explicada pela média yyixxi

yi

ŷy

ŷ = a + bx

Page 196: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

• Interessa avaliar que porcentagem da parte não explicada pela média, , pode ser explicada pela regressão de y sobre x, isto é, por .

1.7 Regressão Linear

Coeficiente de explicação

yy yy i

2i yyVT

VE = variação explicada, a soma dos quadrados das variações em

relação à média. 2yyVE

• Designando: VT = variação total, soma dos quadrados das variações de y em

relação à sua média.

• No método dos mínimos quadrados, ao invés de somar essas diferenças, soma-se o quadrado delas para evitar que valores positivos e negativos se anulem.

Page 197: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Coeficiente de explicação

22

yy

xy22

2

2 rRss

bRou

ny

y

nyx

xybR

• O coeficiente de explicação R2 pode ser definido agora como sendo a porcentagem da variação total representada pela variação explicada.

2

i

22

yy

yyVTVE

R

Page 198: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Método dos mínimos quadrados

• Exemplo: No exemplo anterior, observou-se no diagrama de dispersão uma possível relação linear entre as variáveis.

a) Confirme essa relação por meio do coeficiente de correlação;

b) Encontre a reta de regressão pelo método dos mínimos quadrados.

Page 199: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Método dos mínimos quadrados• Cálculos:i x y x2 y2 xy

123456789

10111213141516

100125150175200225250275300325350375400425450500

99,198,898,598,598,598,298,097,897,897,897,697,597,397,096,896,7

100001562522500306254000050625625007562590000105625122500140625160000180625202500250000

9820,89761,49702,29702,29702,29643,29604,09564,89564,89564,89525,89506,29467,39409,09370,29350,9

9910,012350,014775,017237,519700,022095,024500,026895,029340,031785,034160,036562,538920,041225,043560,048350,0

Σ 4625 1565,9 1559375 153259,8 451365,0

977,0)99,0(R

99,0r16

)9,1565(8,15325916

)4625(1559375

169,15654625451365

r

ny

ynx

x

nyx

xyr

ss

sr

22

22

22

22

yyxx

xy

Page 200: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Método dos mínimos quadrados

• Cálculos:

- O valor da correlação e do coeficiente de explicação indicam uma forte correlação linear entre a temperatura do gás combustível e a taxa de calor. Pode-se, portanto, estimar, através do MMQ os parâmetros a e b e traçar a reta de regressão:

516,9916

4625)0057,0(

169,1565

nx

bn

ya

0057,0

164625

1559375

169,15654625451365

nx

x

nyx

xyb 22

2

- Sendo assim, a reta de regressão é: x0057,0516,99bxay

Page 201: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

• Para que se evite erros de previsão, a condição inicial para um estudo de regressão linear entre duas variáveis é que essas variáveis apresentem uma razoável correlação linear.

• Caso os valores de y para crescentes valores de x variem de modo aleatório, sem apresentar qualquer tendência, o valor que melhor explica y é, geralmente, a sua média; entretanto, em alguns casos, o diagrama de dispersão apresenta uma tendência não linear, isto é, uma curva bem definida, em torno da qual os pontos parecem agrupar-se.

Page 202: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

• Existe um grupo de funções que apresentam diagramas ajustáveis a muitas dessas tendências, e que possuem a qualidade de poder transformar-se em funções lineares com a aplicação de logaritmos ou por mudança de variável.

• A forma linear dessas funções transformadas pode então ser usada para estimar os parâmetros da curva ajustada àquela tendência, conforme será estudado a seguir.

Page 203: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

1. Função potência: y = a.xb, com x ≥ 0 e b ≥ 0

• Para este caso, a primeira e a segunda derivadas da função fornecem a forma da curva.

b > 1

CrescenteConcavidade para cimaContém a origem

x

y

0 < b < 1

CrescenteConcavidade para baixoContém a origem

x

y

Page 204: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

1. Função potência: y = a.xb, com x ≥ 0 e b ≥ 0

• Se x = 0, então y = 0.

• Para x > 0, aplicando o logaritmo, tem-se: ln y = ln a + b.ln x

• Fazendo Y = ln y, A = ln a e X = ln x, tem-se a forma linear:

Y = A + b.X

O diagrama de dispersão de (X = ln x, Y = ln y) e o coeficiente de correlação correspondente podem indicar a oportunidade e qualidade do ajuste.

Page 205: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

2. Função exponencial: y = abx, a > 0, b > 0, x ≥ 0

• Como no caso anterior, as derivadas fornecem a forma das curvas.

a b > 1

CrescenteConcavidade para cimax = 0 → y = a

x

y

0 < b < 1

DecrescenteConcavidade para cimax = 0 → y = a

x

y

a

Page 206: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

2. Função exponencial: y = abx, a > 0, b > 0, x ≥ 0

• Aplicando o logaritmo, tem-se: ln y = ln a + x.ln b

• Fazendo Y = ln y, A = ln a e B = ln b, tem-se a forma linear:

Y = A + B.x

O diagrama de dispersão de (x, Y=lny) e o coeficiente de correlação correspondente podem indicar a oportunidade e qualidade do ajuste.

Page 207: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

2. Função hiperbólica, tipo I: • A primeira e a segunda derivadas fornecem a forma das curvas.

0y,0a,0x,xb

ay

b > 0

DecrescenteConcavidade para cimaAssíntota em x = 0 e y = a

x

y

ax

CrescenteConcavidade para baixoAssíntota em y = a

ya b < 0

- b/a

Page 208: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

3. Função hiperbólica, tipo I: • Fazendo X = 1/x, obtém-se a forma linear:

y = a + b.X

O diagrama de dispersão de (X=1/x, y) e o coeficiente de correlação correspondente podem indicar a oportunidade e qualidade do ajuste.

0y,0a,0x,xb

ay

Page 209: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

4. Função hiperbólica, tipo II: • As derivadas da função indicam que a curva é decrescente e tem

concavidade voltada para cima, com assíntotas em y = 0. Para x =0, y = 1/a.

0x,0b,0a,bxa

1y

x

y

1/a

Page 210: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

4. Função hiperbólica, tipo II: • Fazendo Y = 1/y, obtém-se:

0x,0b,0a,bxa

1y

bxaYoubxa

1Y1

O diagrama de dispersão de (x, Y=1/y) e o coeficiente de correlação correspondente podem indicar a oportunidade e qualidade do ajuste.

Page 211: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

5. Função logaritmo: y = a + b.ln x, x > 0

• As derivadas indicam a forma da curva:

b < 0

DecrescenteConcavidade para cima

x

y

e-a/bx

CrescenteConcavidade para baixo

yb > 0

e- a/b

Page 212: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

5. Função logaritmo: y = a + b.ln x, x > 0

• Fazendo X = ln x, obtém-se a forma linear:

bXay

O diagrama de dispersão de (X=ln x, y) e o coeficiente de correlação correspondente podem indicar a oportunidade e qualidade do ajuste.

Page 213: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

• Exemplo: Um estudo sobre a oferta de mercado de um produto revelou as seguintes quantidades que os produtores estariam dispostos a oferecer a vários níveis de preços:

x = preço 10,00 10,50 11,00 11,50 12,00 12,50 13,00 13,50

y = oferta(em 1000 un.)

427 440 447 453 460 465 470 472

Page 214: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

a. Construa um diagrama de dispersão para os dados da tabela;b. Calcule o coeficiente de correlação linear das variáveis;c. O diagrama de dispersão sugere o uso de alguma forma linearizável

para ajustar os pontos?d. Construa o gráfico de dispersão da forma linear correspondente à

função escolhida em (c);e. Calcule o coeficiente de correlação dos pares em (d);f. Comente os resultados obtidos;g. Calcule a regressão de y sobre x para a função de maior correlação;h. Calcule o coeficiente de explicação para a função escolhida em (g);i. Calcule a oferta para um preço de 15,00.

Page 215: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

• Solução:a. Diagrama de dispersão

420425430435440445450455460465470475

9 9,5 10 10,5

11 11,5

12 12,5

13 13,5

14

x

y

Page 216: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

b. Coeficiente de correlação.

n x y x2 y2 xy

12345678

10,010,511,011,512,012,513,013,5

424440447453460465470472

100,00110,25121,00132,25144,00156,25160,00182,25

182329193600198809205209211600216225220900222284

4270,04620,04917,05209,55520,05812,56110,06372,0

Σ 94,0 3.634 1.115,00 1.652.456 42.831,0

Page 217: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

b. Coeficiente de correlação.

98,05,711.15,10

5,131r5,711.1

8)634.3(

456.652.1s

5,108

)94(115.1s5,131

8634.394

831.42s

2

yy

2

xxxy

c. A forma do diagrama de dispersão sugere a curva logarítmica por suas características.

y = a + b.ln x

Page 218: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

d. Diagrama de dispersão: a forma linear é y = a + b.X, com X = ln x.

X = ln x 2,30 2,35 2,40 2,44 2,48 2,53 2,56 2,60

y = oferta(em 1000 un.

427 440 447 453 460 465 470 472

420425430435440445450455460465470475

2 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3ln x

y

Page 219: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

e. Coeficiente de correlação.

n X=ln x y X2 y2 Xy

12345678

2,302,352,402,442,482,532,562,60

424440447453460465470472

5,292,525,765,956,156,406,556,77

182.329193.600198.809205.209211.600216.225220.900222.284

982,11.034,01.072,81.105,51.140,81.176,451.203,21.227,2

Σ 19,67 3.634 48,45 1.652.456 8.947,57

Page 220: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

e. Coeficiente de correlação.

9879,05,711.10771,0

3453,11r5,711.1

8)634.3(

456.652.1s

0771,08

)67,19(45,48s3453,11

8634.367,19

57,947.8s

2

yy

2

xxxy

f. A correlação obtida com a curva logarítmica é maior; portanto, essa função será escolhida para o processo de regressão.

Page 221: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

g. Cálculo da regressão linear:

xln.1505,1471907,92y

921907867,19

1505,1478634.3

nx

bn

ya

1505,1470771,03453,11

ss

bxx

xy

h. Cálculo do R2.976,0

5,711.13453,11

1505,147ss

bRyy

xy2

A regressão de y sobre x explica 97,6% das variações de y a partir de sua média; os outros 2,4% são atribuídos a fatores imponderáveis.

Page 222: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Funções linearizáveis

i.Projeção da oferta para um preço de 15,00:

A oferta esperada quando o preço for 15,00 é de 490,68 mil unidades.

Page 223: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Regressão Linear Múltipla Relação entre as variáveis

• A finalidade das variáveis independentes adicionais é melhorar a capacidade de predição em confronto com a regressão linear simples.

• Isto é, reduzir o coeficiente do intercepto, o qual, em regressão, significa a parte da variável dependente explicada por outras variáveis, que não a considerada no modelo.

Page 224: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Regressão Linear Múltipla

Relação entre as variáveis

• Mesmo quando interessa o efeito de apenas uma das variáveis, é aconselhável incluir as outras capazes de afetar Y (análise de regressão múltipla), por 2 razões:

− Para reduzir os resíduos estocásticos. Reduzindo-se a variância residual (erro padrão da estimativa);

− Para eliminar a tendenciosidade que poderia resultar se simplesmente ignorássemos uma variável que afeta Y substancialmente.

Page 225: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

• A regressão múltipla apresenta um funcionamento parecido com o da regressão simples, porém leva em consideração diversas variáveis explicativas influenciando ao mesmo tempo.

• Suponha que temos n observações (n>p) da variável resposta e das p variáveis explicativas. Assim,  yi é o valor da variável resposta na i-ésima observação, enquanto que xij é o valor da variável explicativa xj na i-ésima observação, j = 1, 2 …, p.

Modelo

Page 226: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

• Os dados da MRLM podem ser apresentados na forma da tabela abaixo:

Estimativa dos Parâmetros do Modelo

yi x1 x2 ... xp

y1 x11 x12 ... x1p

y2 x21 x22 ... x2p...

.

.

.

.

.

.

.

.

.

.

.

.

yn xn1 xn2 ... xnp

• Em que cada relação satisfaz:

Page 227: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

• O objetivo é minimizar o somatório do quadrado dos desvios de cada observação:

Método dos Mínimos Quadrados

• Derivando o L em função dos β´s :

Page 228: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Método dos Mínimos Quadrados

Page 229: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

• Os estimadores dos parâmetros do modelo podem ser encontrados a partir da notação matricial dos dados. Assim, considerando a entrada dos dados como mostrado na tabela, o MRLM pode ser escrito como:

Representação Matricial do Modelo

Page 230: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Representação Matricial do Modelo

Page 231: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

• Usando a técnica de derivação em termos matriciais:

Representação Matricial do Modelo

Page 232: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

• Os estimadores para os parâmetros βj são dados pelo vetor

Representação Matricial do Modelo

• Em geral a matriz (X´X) tem determinante diferente de zero (não singular) e, portanto, é invertível.

• O modelo de regressão linear ajustado e o vetor de resíduos são, respectivamente:

Page 233: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

• No sistema de equações anterior, fazendo-se

Modelo de Regressão com duas Variáveis Explicativas

Page 234: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

• Resolvendo-se o sistema:

Modelo de Regressão com duas Variáveis Explicativas

Page 235: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

• Onde:

Modelo de Regressão com duas Variáveis Explicativas

Page 236: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

• Considere a seguinte base de dados:

Exemplo:

i Consumo ($)y

Renda ($)x1

Taxa de juros (%)x2

12345678910

12211486134146107681177198

13912690

144163136616241

120

11,512,010,59,010,012,010,58,010,011,5

Page 237: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

• Aplicando-se a fórmula anterior tem-se:

Exemplo:

Page 238: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Exemplo:

• Logo,

• Interpretação: Tirando a parte do Consumo que não é influenciada pela Taxa de Juros, o incremento de $1,00 na Renda causa um acréscimo esperado de $0,6136 no Consumo; além disso, o incremento de 1 ponto percentual (0,01) na Taxa de juros causa um decréscimo esperado de $10,3441 no Consumo.

Page 239: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Exemplo no modelo não matricial:i y x1 x2 y.x1 y.x2 x1² x2² x1.x2 y²1 122 139 0,115 16958 14,03 19321 0,013225 15,985 14884

2 114 126 0,12 14364 13,68 15876 0,0144 15,12 12996

3 86 90 0,105 7740 9,03 8100 0,011025 9,45 7396

4 134 144 0,09 19296 12,06 20736 0,0081 12,96 17956

5 146 163 0,1 23798 14,6 26569 0,01 16,3 21316

6 107 136 0,12 14552 12,84 18496 0,0144 16,32 11449

7 68 61 0,105 4148 7,14 3721 0,011025 6,405 4624

8 117 62 0,08 7254 9,36 3844 0,0064 4,96 13689

9 71 41 0,1 2911 7,1 1681 0,01 4,1 5041

10 98 120 0,115 11760 11,27 14400 0,013225 13,8 9604

∑ 1063 1082 1,05 122781 111,11 132744 0,1118 115,4 118955

Page 240: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Exemplo:

Sy1 Sy2 S11 S22 S12 b1 b2 a7764,4 -0,505 15672 0,00155 1,79 0,6135934 -1034,41 148,52202

y = 148,52 + 0,6136.x1 – 1034,41.x2

Page 241: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear

Coeficiente de Explicação:

• Similarmente ao que foi feito para a RLS, o coeficiente de explicação R² é definido como sendo:

(variação explicada pela regressão/variação total)

Page 242: Estatc3adstica cap-01

01/05/23 20:51 ESTATÍSTICA APLICADA I - Estatística Descritiva

FIM

I - Estatística Descritiva