Top Banner
3-1 Adaptado de Levine Estatística Descritiva Prof. Helcio Rocha Estatística
37

Estatística Descritiva Prof. Helcio Rocha

Feb 24, 2016

Download

Documents

kipling

Estatística. Estatística Descritiva Prof. Helcio Rocha. Definições sumárias. Ao resumir e descrever variáveis numéricas , precisamos considerar :. Tendência central : extensão na qual os valores de dados se agrupam em torno de um valor central - PowerPoint PPT Presentation
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Estatística Descritiva Prof.  Helcio  Rocha

3-1Adaptado de Levine

Estatística DescritivaProf. Helcio Rocha

Estatística

Page 2: Estatística Descritiva Prof.  Helcio  Rocha

3-2

Definições sumárias

Tendência central: extensão na qual os valores de dados se agrupam em torno de um valor central

Variação: dispersão em relação a um valor central Formato: padrão da distribuição de valores, do mais

baixo para o mais alto

Ao resumir e descrever variáveis numéricas, precisamos considerar:

Page 3: Estatística Descritiva Prof.  Helcio  Rocha

3-3

Medidas de tendência central: A média

Obs: é afetada por valores extremos (outliers)

11 12 13 14 15 16 17 18 19 20

Média = 13

11 12 13 14 15 16 17 18 19 20

Média = 14

31565

55141312111

41

570

52041312111

Page 4: Estatística Descritiva Prof.  Helcio  Rocha

3-4

Medidas de tendência central: A mediana

Obs: NÃO É afetada por valores extremos (outliers)

Mediana = 13 Mediana = 13

11 12 13 14 15 16 17 18 19 20 11 12 13 14 15 16 17 18 19 20

Page 5: Estatística Descritiva Prof.  Helcio  Rocha

3-5

Medidas de tendência central: A moda

Observações: NÃO É afetada por valores extremos Aplicável também a dados categóricos Pode não haver moda Podem haver várias modas

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Moda = 9

0 1 2 3 4 5 6

Sem Moda

Page 6: Estatística Descritiva Prof.  Helcio  Rocha

3-6

Medidas de tendência central: Qual utilizar?

A média é geralmente utilizada, a não ser quando existem outliers.

A mediana tem uso frequente, por não ser afetada por outliers.

Em algumas situações, recomenda-se relatar ambas medidas.

Page 7: Estatística Descritiva Prof.  Helcio  Rocha

3-7

Mesmo centro, diferentes dispersões

Medidas de variação

Variação

Desvio padrão

Coeficiente de variação

Amplitude Variância

Page 8: Estatística Descritiva Prof.  Helcio  Rocha

3-8

Medidas de variação: A amplitude

A medida mais simples de variação É afetada por outliers Ignora o modo como os dados estão distribuídos

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Amplitude = 13 - 1 = 12

Exemplo:

Page 9: Estatística Descritiva Prof.  Helcio  Rocha

3-9

Medidas de variação:A variância

1-n

)X(XS

n

1i

2i

2

N

μ)(Xσ

N

1i

2i

2

Variância populacional (é um parâmetro)

Variância amostral (é uma estatística)

Page 10: Estatística Descritiva Prof.  Helcio  Rocha

3-10

Medidas de variação:O desvio padrão

É a medida de variação mais empregada É a raiz quadrada da variância Possui a mesma unidade dos dados de origem

1-n

)X(XS

n

1i

2i

N

μ)(Xσ

N

1i

2i

Desvio padrão populacional (é um parâmetro)

Desvio padrão amostral (é uma estatística)

Page 11: Estatística Descritiva Prof.  Helcio  Rocha

3-11

Medidas de variação:O desvio padrão da amostra (exemplo)

Dados da amostra (Xi) 10 12 14 15 17 18 18 24

n = 8 Média = X = 16

4.30957

130

1816)(2416)(1416)(1216)(10

1n)X(24)X(14)X(12)X(10S

2222

2222

Page 12: Estatística Descritiva Prof.  Helcio  Rocha

3-12

Medidas de variação:Comparando desvios padrão

Média = 15.5 S = 3.338 11 12 13 14 15 16 17 18 19 20 21

11 12 13 14 15 16 17 18 19 20 21

Data B

Data A

Média = 15.5 S = 0.926

11 12 13 14 15 16 17 18 19 20 21

Média = 15.5 S = 4.570

Data C

Page 13: Estatística Descritiva Prof.  Helcio  Rocha

3-13

Medidas de variação:Comparando desvios padrão

Menor desvio padrão

Maior desvio padrão

Page 14: Estatística Descritiva Prof.  Helcio  Rocha

3-14

Medidas de variação:O coeficiente de variação

É uma medida relativa de variação Sempre em % Apresenta a variação relativa à média Permite comparar dois ou mais conjuntos de

dados que são mensurados em unidades diferentes

100%XSCV

Page 15: Estatística Descritiva Prof.  Helcio  Rocha

3-15

Medidas de variação:Comparando coeficientes de variação

Ação A: Preço médio do último ano = $50 Desvio padrão = $5

Ação B: Preço médio do último ano = $100 Desvio padrão = $5

Ambas ações possuem o mesmo DP, mas a B é menos variável em relação a seu preço

10%100%$50$5100%

XSCVA

5%100%$100

$5100%XSCVB

Page 16: Estatística Descritiva Prof.  Helcio  Rocha

3-16

Medidas de variação:Comparando coeficientes de variação

Stock A: Preço médio do último ano = $50 Desvio padrão = $5

Stock C: Preço médio do último ano = $8 Desvio padrão = $2

A ação C possui um DP bem menor, mas um CV bem maior

10%100%$50$5100%

XSCVA

25%100%$8$2

100%XS

CVC

Page 17: Estatística Descritiva Prof.  Helcio  Rocha

3-17

Localizando valores extremos:Uso do escore Z

Um valor é considerado outlier quando seu escore Z é inferior a – 3,0 ou superior a + 3,0

SXXZ

(Número de desvios padrão)

Page 18: Estatística Descritiva Prof.  Helcio  Rocha

3-18

Formato de uma distribuição:Assimetria

Média = Mediana Média < Mediana Média > Mediana

Assimétrico à direitaAssimetria > 0

Assimétrico à esquerdaAssimetria < 0

SimétricoAssimetria = 0

Page 19: Estatística Descritiva Prof.  Helcio  Rocha

3-19

Formato de uma distribuição:Curtose

É uma medida direta do afunilamento da curva (ou inversa do seu achatamento)

Formato mais afuniladoCurtose > 0

Distribuição normalCurtose = 0

Formato mais achatadoCurtose < 0

Page 20: Estatística Descritiva Prof.  Helcio  Rocha

3-20

Estatística descritiva usando o Excel

Page 21: Estatística Descritiva Prof.  Helcio  Rocha

3-21

Estatística descritiva usando o Excel1. Selecione Dados.2. Selecione Análise de

dados.3. Selecione Estatística

Descritiva. Clique OK.

Page 22: Estatística Descritiva Prof.  Helcio  Rocha

3-22

Estatística descritiva usando o Excel

4. Registre o intervalo de entrada.

5. Selecione a opção Resumo estatístico.

6. Click OK

Page 23: Estatística Descritiva Prof.  Helcio  Rocha

3-23

Quartis Dividem os dados ordenados em 4 segmentos,

com igual No. de dados em cada segmento

25%

Localizando os quartis:Q1 = (n+1)*(1/4)

Q2 = (n+1)*(1/2) (é a mediana)

Q3 = (n+1)*(3/4)

Q1 Q2 Q3

25% 25% 25%

Os quartis não são afetados por outliers

Page 24: Estatística Descritiva Prof.  Helcio  Rocha

3-24

(n = 9)Q1 na posição (9+1)*(1/4) = 2.5

então Q1 = (12+13)/2 = 12.5

Q2 na posição (9+1)*(1/2) = 5 então Q2 = mediana = 16

Q3 na posição (9+1)*(3/4) = 7.5então Q3 = (18+21)/2 = 19.5

Localizando quartis – 1o. exemplo

Dados ordenados: 11 12 13 16 16 17 18 21 22

Page 25: Estatística Descritiva Prof.  Helcio  Rocha

3-25

(n = 10)Q1 na posição (10+1)*(1/4) = 2.75 → arredonde para 3

então Q1 = 35

Q2 na posição (10+1)*(1/2) = 5.5 então Q2 = (39+40)/2 = 39.5

Q3 na posição (10+1)*(3/4) = 8.25 → arredonde para 8então Q3 = 44

Localizando quartis – 2o. exemplo

Dados ordenados: 29 31 35 39 39 40 43 44 44 52

Page 26: Estatística Descritiva Prof.  Helcio  Rocha

3-26

Os cinco números e o Boxplot

Os cinco números que proporcionam um método para se determinar o formato de uma distribuição :

Boxplot:

Xmenor -- Q1 -- Mediana -- Q3 -- Xmaior

Xmenor Q1 Mediana Q3 Xmaior

Page 27: Estatística Descritiva Prof.  Helcio  Rocha

Construindo o Boxplot no Excel

3-27

Mínimo -71o. quartil -3Mediana 23o. quartil 4Máximo 9

9-79

Resumo de Cinco Números

-10 -5 0 5 10

Box-Plot

Page 28: Estatística Descritiva Prof.  Helcio  Rocha

3-28

A curva de distribuição e o Boxplot

Assimétrica à esquerda

Simétrica

Q1 Q2 Q3 Q1 Q2 Q3Q1 Q2 Q3

Assimétrica à direita

Page 29: Estatística Descritiva Prof.  Helcio  Rocha

3-29

Amplitude interquartil (Q3 – Q1)

Mediana(Q2)

XmáxX

mín Q1 Q3

25% 25% 25% 25%

12 30 45 57 70

Amplitude interquartil = 57 – 30 = 27

Também conhecida como dispersão média

Obs: Assim como os quartis, também não é afetada por outliers

Page 30: Estatística Descritiva Prof.  Helcio  Rocha

3-30

Medindo a relação entre duas variáveis numéricas:A covariância

Mede a força de uma relação linear entre duas variáveis numéricas(X & Y)

Covariância da amostra

Não implica numa relação causa-efeito

1n

)YY)(XX()Y,X(cov

n

1iii

Page 31: Estatística Descritiva Prof.  Helcio  Rocha

3-31

Covariância entre duas variáveis

cov(X,Y) > 0 X e Y tendem a se mover na mesma direção

cov(X,Y) < 0 X e Y tendem a se mover em direções opostas

cov(X,Y) = 0 X e Y são independentes

Observar: cov pode assumir qualquer valor

Consequência: não é possível se determinar a força relativa da relação a partir do valor da covariância

Interpretando a Covariância

Page 32: Estatística Descritiva Prof.  Helcio  Rocha

3-32

Coeficiente de Correlação

Mede a força relativa de uma relação linear entre duas variáveis numéricas

É adimensional

YX SSY),(Xcovr

YX

Y),(Xcov

Coeficiente de correlação da amostra

Coeficiente de correlação da população

Page 33: Estatística Descritiva Prof.  Helcio  Rocha

3-33

Coeficientes de Correlação e gráficos de dispersão

Y

X

Y

X

Y

X

Y

X

r = -1 r = -.6

r = +.3r = +1

Y

Xr = 0

Page 34: Estatística Descritiva Prof.  Helcio  Rocha

3-34

Coeficiente de Correlação: função no Excel

Page 35: Estatística Descritiva Prof.  Helcio  Rocha

3-35

Coeficiente de Correlação: Análise de Dados no Excel

1. Selecione Dados2. Escolha Análise de Dados3. Selecione Correlação e

clique OK

Page 36: Estatística Descritiva Prof.  Helcio  Rocha

3-36

Coeficiente de Correlação: Análise de Dados no Excel (cont.)

4. Entre com os dados e selecione as opções adequadas

5. Clique em OK

Page 37: Estatística Descritiva Prof.  Helcio  Rocha

3-37

Interpretanto o Coeficiente de Correlação

r = 0.733 Há uma relação linear

positiva relativamente forte entre as notas do teste 1 e as do teste 2.

Scatter Plot of Test Scores

70

75

80

85

90

95

100

70 75 80 85 90 95 100

Test #1 Score

Test

#2

Scor

e