Top Banner
1.AULA 01 1.CONCEITOS FUNDAMENTAIS ESTATÍSTICA Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos nas tomadas de decisão. A estatística divide-se em dois ramos: ESTATÍSTICA DESCRITIVA É a parte da estatística que se preocupa com a coleta, organização e a descrição dos dados observados, porém sem tirar conclusões mais genéricas. ESTATÍSTICA INDUTIVA OU INFERENCIAL É a parte que em baseando-se em resultados obtidos de uma amostra, procura inferir ou tirar conclusões para o comportamento da população, dando a precisão dos resultados e com que probabilidade se pode confiar neles. POPULAÇÃO OU UNIVERSO É um conjunto de indivíduos ou objetos que apresentam pelo menos uma característica comum. AMOSTRA
23

Estatistica primeiras aulas.pdf

Nov 22, 2015

Download

Documents

Laura Somoza
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
  • 1.AULA 01

    1.CONCEITOS FUNDAMENTAIS

    ESTATSTICA

    Estatstica uma parte da Matemtica Aplicada que fornece mtodos para a coleta, organizao, descrio, anlise e interpretao de dados e para a utilizao dos mesmos nas tomadas de deciso.

    A estatstica divide-se em dois ramos:

    ESTATSTICA DESCRITIVA

    a parte da estatstica que se preocupa com a coleta, organizao e a descrio dos dados observados, porm sem tirar concluses mais genricas.

    ESTATSTICA INDUTIVA OU INFERENCIAL

    a parte que em baseando-se em resultados obtidos de uma amostra, procura inferir ou tirar concluses para o comportamento da populao, dando a preciso dos resultados e com que probabilidade se pode confiar neles.

    POPULAO OU UNIVERSO

    um conjunto de indivduos ou objetos que apresentam pelo menos uma caracterstica comum.

    AMOSTRA

  • um subconjunto finito de uma populao.

    FENMENO

    o nmero de resultados possveis. Assim, por exemplo: para o fenmeno nmero de filhos h um nmero de resultados possveis expresso atravs de nmeros naturais: 0, 1, 2, 3, ..., n

    VARIVEL

    , convenientemente, o conjunto de resultados possveis de um fenmeno.

    Quando seus valores so expressos por atributos: cor dos olhos, sexo), etc ela denominada qualitativa.

    Quando os seus valores so expressos em nmeros (salrios, idade dos alunos de uma escola, etc) ela denominada quantitativa. Uma varivel quantitativa que pode assumir, teoricamente, qualquer valor entre dois limites recebe o nome de varivel contnua; uma varivel que s pode assumir valores pertencentes a um conjunto enumervel recebe o nome de varivel discreta.

    Assim, o nmero de alunos de uma escola pode assumir qualquer um dos valores do conjunto N = ( 1, 2, 3, ...), mas nunca valores como2,34 ou 5,76. Logo uma varivel discreta. J o peso desses alunos uma varivel contnua, pois um aluno pode pesar 72 kg, como 72,5 kg, como 72,53 kg, etc, dependendo esse valor da preciso da medida.

    De modo geral, as medies do origem a variveis contnuas e as contagens ou enumeraes a varivel discretas.

    Quando uma varivel quantitativa discreta ela manipulada como se apresenta. Entretanto quando a varivel quantitativa contnua h sempre um limite para a preciso com a qual a mensurao pode ser feita, o que nos leva a concluir que o valor verdadeiro nunca conhecido. Na verdade, os valores observados so discretos e aproximados.

  • Convencionaremos que a preciso da medida ser automaticamente indicada pelo nmero de decimais com que se escrevem os valores da varivel.

    Assim, um valor 4,60 indica que a varivel em questo foi medida com a preciso de centsimos, no sendo exatamente o mesmo que 4,6, valor correspondente a uma preciso de dcimos.

    Para suprimir unidades inferiores s de determinada ordem recorremos a tcnica de ARREDONDAMENTO DE DADOS.

    1.ARREDONDAMENTO DE DADOS

    A tcnica de arredondamento de dados normatizada pelo Instituto Brasileiro de Geografia e Estatstica, IBGE atravs da resoluo 886/66, da seguinte maneira:

    Quando o primeiro algarismo a ser abandonado 0, 1, 2, 3, 4, fica inalterado o ltimo algarismo a permanecer.

    Ex. 53,24 passa a 53,2

    Quando o primeiro algarismo a ser abandonado 6, 7, 8, 9, aumenta-se uma unidade o algarismo a permanecer.

    Ex. 42,87 passa a 42,9

    88, 08 passa a 88,1

    Quando o primeiro algarismo a ser abandonado 5, h duas solues:

    %2. Se ao 5 seguir em qualquer casa um algarismo diferente de zero, aumenta-se uma unidade ao algarismo a permanecer.

    Ex. 2,352 passa a 2,4

    109,250003 passa a 109,3

    %2. Se o 5 for o ltimo algarismo ou se ao 5 s se seguirem zeros, o ltimo algarismo a permanecer s ser aumentado de uma unidade se for impar.

    Ex. 24,75 passa a 24,8

  • 24,65 passa a 24,6

    24,75000 passa a 24,8

    24,65000 passa a 24,6

    OBS

    No devemos nunca fazer arredondamentos sucessivos.

    EX. 17,3452 passa a 17,3 e no 17,35, a 17,4

    Se tivermos a necessidade de um novo arredondamento, voltamos sempre aos dados originais.

    1.

    PRECISO

    milsimo centsimo Dcimo unidade dezena centena milhar

    3.876,55239 3.876,552 3.876,55 3.876,6 3.877 3.880 3.900 4.000

    1.COMPENSAO

    Compensar suprimir ou adicionar unidades conforme a preciso a ser requerida do resultado.

    Supondo os dados abaixo, aos quais aplicamos as regras do arredondamento:

    25,32 25,3

    + 17,85 + 17,8

  • 10,44 10,4

    31,17 31,2

    84,78 84,8 84,7

    Se arredondarmos a soma original para uma casa decimal vemos que o resultado 84,8; a nova soma com as parcelas arredondadas difere em uma unidade. Entretanto para a apresentao dos resultados, necessrio que desaparea tal diferena, o que possvel com a tcnica da COMPENSAO, conservando o mesmo nmero de casas decimais.

    Praticamente, usamos descarregar a diferena na(s) maio(res) parcela(s). assim passamos a ter:

    25,3

    + 17,8

    10,4

    31,3

    84,8

    AULA 02

    APRESENTAO DOS DADOS

    A apresentao dos dados pode ser efetuada de duas formas, no

  • mutuamente excludentes. A primeira a apresentao tabular, necessria quando se deseja uma apresentao sistemtica dos dados; a outra forma a grfica, que se constitui em um importante complemento apresentao tabular, principalmente por permitir uma visualizao quase imediata das distribuies dos valores estudados.

    SRIES ESTATSTICAS

    Segundo o Conselho Nacional de Estatstica, a organizao dos dados denomina-se srie estatstica, e esta dever apresentar, o ttulo, o cabealho, o corpo e o rodap.

    Ttulo - conjunto de informaes, as mais completas possveis, respondendo s perguntas: O que?, Quando?, Onde?, localizado no topo da srie estatstica;

    Cabealho - parte superior da tabela que especifica o contedo das colunas ( as categorias, as modalidades da varivel);

    Corpo conjunto de linhas e colunas que contm informaes sobre a varivel em estudo;

    Rodap elementos complementares da tabela, que so a fonte, as notas, as chamadas.

    ELEMENTOS COMPONENTES DE UMA TABELA SRIE ESTATSTICA

    TABELA 1 - VENDA DE TRATORES BRASIL 2000 - 2001 Ttulo

    2000 2001 Cabealho

    TRATORES 12.595 14.892 Corpo

    COLHEITADEIRAS 2.003 2.010

  • Anfavea Fonte

    De acordo com a Resoluo 886 da Fundao IBGE, nas casas ou clulas devemos colocar:

    Um trao horizontal ( -) quando o valor zero, no s quanto natureza das coisas como quanto ao resultado do inqurito;

    Trs pontos (...) quando no temos os dados;

    Um ponto de interrogao (?) quando temos dvida quanto exatido de determinado valor;

    Zero (0) quando o valor muito pequeno para ser expresso pela unidade utilizada. Se os valores so expresso em numerais decimais, precisamos acrescentar parte decimal um nmero correspondente de zeros ( 0,0; 0,00; 0,000;...).

    TIPOS DE SRIES ESTATSTICAS

    Conforme o critrio de agrupamento, as sries classificam-se em 4 tipos: temporal ou cronolgica, geogrfica ou espacial, especfica ou categrica e distribuio de freqncias.

    SRIE CRONOLGICA

    a srie estatstica em que os dados so observados segundo poca de ocorrncia.

    TABELA 2 ARRECADAO MENSAL DE ICMS NO PARAN 1991

  • MESES ARRECADAO R$ MESES ARRECADAO R$

    JANEIRO 24.856 JULHO 48.931

    FEVEREIRO 27.093 AGOSTO 53.564

    MARO 30.912 SETEMBRO 60.310

    ABRIL 36.870 OUTUBRO 69.065

    MAIO 41.442 NOVEMBRO 83.857

    JUNHO 42.042 DEZEMBRO 90.336

    SEFA

    SRIE GEOGRFICA

    a srie em que os dados so observados segundo a localidade de ocorrncia.

    TABELA 3 - METALRGICA S/A VENDAS POR REGIO (2003)

    REGIO VENDAS (R$ 1000,00)

    SUL 6.900

    SUDESTE 7.700

    CENTRO-OESTE 6.500

    NORDESTE 5.800

    NORTE 4.200

  • TOTAL 31.500

    Dados fictcios

    SRIE ESPECFICA

    a srie em que os dados so observados segundo modalidades diferentes de ocorrncia.

    TABELA 4 - VENDA DE TRATORES/ COLHEITADEIRAS BRASIL 2000/2001

    TIPO UNIDADES (2.000) UNIDADES(2.000)

    TRATORES 12.595 14.892

    COLHEITADEIRAS 2.003 2.010

    Anfavea

    DISTRIBUIO DE FREQNCIAS

    o mtodo de agrupamento de dados em classes, ou intervalos, de tal forma que se possa determinar o nmero ou a percentagem de cada classe.

    Estatura de 40 alunos do Colgio A

  • I Estatura (cm)

    fi xi fri Fi Fri

    1 150 |--- 154 4 152 0,100 4 0,100

    2 154 |--- 158 9 156 0,225 13 0,325

    3 158 |--- 162 11 160 0,275 24 0,600

    4 162 |--- 166 8 164 0,200 32 0,800

    5 166 |--- 170 5 168 0,125 37 0,925

    6 170 |--- 174 3 172 0,075 40 1,000

    =40

    1.REPRESENTAO GRFICA

    A apresentao dos dados e respectivos resultados de sua anlise pode tambm ser feita sob a forma de figuras, em geral grficos ou diagramas.

    Grficos devem ser auto-explicativos e de fcil compreenso, de preferncia sem comentrios inseridos. Devem ser simples, atrair a ateno do leitor e inspirar confiana.

    Alguns pontos devem ser respeitados na construo de um grfico:

    - o tamanho deve ser adequado sua publicao em revistas, peridicos, cartazes ou livros;

    - deve ter sempre um ttulo;

    - deve ser construdo em uma escala que no desfigure os fatos ou as relaes que se deseja destacar.

    Os grficos podem ser cartogramas ou diagramas; entende-se por cartogramas o mapa geogrfico ou topogrfico em que as freqncias das

  • categorias de uma varivel so projetadas nas reas especficas do mapa, utilizando-se cores ou traados cujos significados constam em legendas anexadas s figuras.

    Diagramas so grficos em que a magnitude das freqncias representada por certa mensurao de uma determinada figura geomtrica. Se a medida utilizada for o comprimento, tem-se o diagrama de ordenadas (grfico de linhas); caso se utilize superfcie de figura, tem-se diagrama de barras, histograma e grfico de setores, alem de grficos representativos de distribuies de freqncia.

    GRFICO EM LINHAS - ARRECADAO MENSAL DE ICMS NO PARAN 1991

    GRFICO EM COLUNAS MLTIPLAS - VENDA DE TRATORES/ COLHEITADEIRAS BRASIL 2000/2001

    Fonte: Anfavea

  • GRFICO EM BARRAS- METALRGICA S/A VENDAS POR REGIO (2002)

    Fonte: Dados fictcios

    GRFICO EM SETORES- METALRGICA S/A VENDAS POR REGIO (2001)

    Fonte: Dados fictcios

    GRFICO POLAR - ARRECADAO MENSAL DE ICMS NO PARAN 1991

    Fonte: SEFA

  • HISTOGRAMA: ESTATURA DE 40 ALUNOS DO COLGIO A

    Fonte: Dados fictcios

    F

    12

    10

    8

    6

    4

    2

    0

    150 154 158 162 166 170 174 Estatura

  • GRFICO DE DISTRIBUIO DE FREQNCIA

    HISTOGRAMA/POLGONO DE FREQNCIA - NMERO MDIO DE ACIDENTES POR MIL HOMENS/HORA EM UMA INDSTRIA

    Dados fictcios

    AULA 03

    DISTRIBUIO DE FREQNCIAS

    Distribuio de freqncias so descries de dados resultantes de variveis quantitativas agrupadas em classes.

    TABELA PRIMITIVA

    assim denominada quando os valores so diretamente organizados conforme coletados, isto sem critrios de ordem numrica.

    Suponhamos termos feito uma coleta de dados relativos s estaturas de quarenta alunos, que compem uma amostra dos alunos de um colgio A, resultando na seguinte tabela de valores:

    Estatura de 40 alunos do Colgio A

    166

    160

    161 150 162 160 165 167 164 160

    16

    16 168 163 156 173 160 155 164 168

  • 2 1

    168 163 156 173 160 155 164 168

    155

    152

    163 160 155 155 169 151 170 164

    154

    161

    156 172 153 157 156 158 158 161

    1.

    2.

    3.ROL

    uma ordenao dos dados da tabela primitiva.

    Estatura de 40 alunos do Colgio A

    150 154 155 157 160 161 162 164 166 169

    151 155 156 158 160 161 162 164 167 170

    152 155 156 158 160 161 163 164 168 172

    153 155 156 160 160 161 163 165 168 173

    1.

    2.DISTRIBUIO DE FREQNCIA

    uma ordenao em freqncias, sendo no exemplo anterior o numero de alunos componentes da amostra.

  • Estatura de 40 alunos do Colgio A

    Estatura Freqncia Estatura Freqncia

    150 1 163 2

    151 1 164 3

    152 1 165 1

    153 1 166 1

    154 1 167 1

    155 4 168 2

    156 3 169 1

    157 1 170 1

    158 2 172 1

    160 5 173 1

    161 4 Total 40

    162 2

    DISTRIBUIO DE FREQNCIA COM INTERVALOS DE CLASSES

    uma representao dos valores em vrios intervalos; onde perde-se a sensibilidade ou pormenores mas ganha-se em simplicidade. No exemplo estudado agrupamos em intervalos de classe conforme critrios a serem estudados.

    Estatura de 40 alunos do Colgio A

  • ESTATURA FREQNCIA

    150 |--- 154 4

    154 |--- 158 9

    158 |--- 162 11

    162 |--- 166 8

    166 |--- 170 5

    170 |--- 174 3

    TOTAL 40

    1.

    1.ELEMENTOS DE UMA DISTRIBUIO DE FREQNCIA

    Classes de freqncia, ou simplesmente classes - so os intervalos de variao da varivel

    Limites de classe - so os extremos de cada classe

    l1 = 150 L5 = 170

    Amplitude de um intervalo de classe, ou simplesmente intervalo de classe a medida do intervalo que define a classe.

    hi = Li li h2 = L2 l2 = 158 150 = 4 cm

    Amplitude total de distribuio (AT) a diferena entre o limite superior da

  • ltima classe ( limite superior mximo) e o limite inferior da primeira classe (limite inferior mnimo)

    AT = L(mx) l(mn) = 174 150 = 24 cm

    Amplitude amostral (AA) a diferena entre o valor mximo e o valor mnimo da amostra

    AA = x(mx) x(mn) = 173 150 = 23 cm

    Ponto mdio de uma classe (xi) o ponto que divide o intervalo de classe em duas partes iguais

    xi = (li + Li) / 2 x2 = (154 + 158) / 2 = 156 cm

    Note que a colocao de um ndice i para x para f e os demais elementos da tabela tem a finalidade de referncia. Deste modo x2 representa o segundo valor distinto da srie, f3 representa a freqncia simples do terceiro valor da srie e assim sucessivamente.

    1.PASSOS PARA A CONSTRUO DE UMA DISTRIBUIO DE FREQNCIA

    a. Estabelecer o nmero de classes

    Pela frmula de Sturges:

    i = 1 + 3,3 log n

  • Onde n representa o nmero total de observaes

    Esta regra nos permite obter a seguinte tabela:

    n i

    3 |---| 5 3

    6 |---| 11 4

    12 |---| 22 5

    23 |---| 46 6

    47 |---| 90 7

    91 |---| 181 8

    182 |---| 362 9

    ... ...

    i = 1 + 3,3 log n = 1 + 3,3 log 40 = 1 + 3,3 * 1,602 = 1 + 5,2866 = 6,2866 = 6

    Portanto no exemplo usam-se 6 intervalos

    b. Determinar a amplitude total dos dados

    AT = L(mx) l (mn)

    AT = (173 + 1) 154 = 24 cm

    c. Estabelecer o intervalo ou amplitude de classe

    h = AT / i

  • h = 24 / 6 = 4 cm

    OBS: se h fosse decimal aplicar-se-ia o inteiro maior que o nmero dado, exemplo se h fosse 4,03 usar-se-ia 5 para amplitude de intervalo e no 4 como manda a regra de arredondamento, constituindo em estatstica a nica exceo a regra.

    d. Estabelecer os limites dos intervalos, comeando com um inteiro em relao ao menor valor da srie.

    O limite superior da primeira classe determinado acrescendo-se o valor de h ao limite mnimo. L1= 150 + 4 = 154 cm

    O limite inferior da segunda classe igual ao limite mximo da primeira classe. l2 = 154 cm

    1.TIPOS DE FREQNCIA

    Estatura de 40 alunos do Colgio A

    I Estatura (cm)

    fi xi fri Fi Fri

    1 150 |--- 154 4 152 0,100 4 0,100

    2 154 |--- 158 9 156 0,225 13 0,325

  • 3 158 |--- 162 11 160 0,275 24 0,600

    4 162 |--- 166 8 164 0,200 32 0,800

    5 166 |--- 170 5 168 0,125 37 0,925

    6 170 |--- 174 3 172 0,075 40 1,000

    =40

    Freqncias Simples ou Absolutas (fi) so os valores que realmente representam o nmero de dados de cada classe.

    Freqncias Relativas (fri) so os valores das razes entre as freqncias simples e a freqncia total.

    Fri = fi / fi

    Freqncia Acumulada (Fi) o total das freqncias de todos os valores inferiores ao limite superior de intervalo de uma dada classe.

    Fi = f1 + f2 + .... + fi

    Freqncia Acumulada Relativa (Fri) a freqncia acumulada da classe dividida pela freqncia total de distribuio.

    Fri = Fi / fi

    Fri = fr1 + fr2 + .... + fri

  • HISTOGRAMA

    POLGONO DE FREQNCIA

    So a representao grfica das distribuies de freqncia, onde no histograma os valores de fi so representados no eixo de y, paralelos aos limites de cada classe.

    No polgono de freqncia as freqncias fi so representadas no eixo y porem no ponto mdio de cada classe.

    I Estatura (cm) fi

    1 150 |--- 154 4

    2 154 |--- 158 9

    3 158 |--- 162 11

    4 162 |--- 166 8

    5 166 |--- 170 5

    6 170 |--- 174 3

    =40