[email protected]Introdução à Estatística e Estatística Descritiva 0 [email protected]ESTATÍSTICA? Um conjunto de procedimentos e princípios para recolha, compilação, análise e interpretação de dados por forma a ajudar na tomada de decisões quando na presença de incerteza. 1 [email protected]Herbert George Wells, Herbert George Wells, English author, said (circa 1940 ), “Statistical thinking will one day be as necessary for efficient citizenship as the ability necessary for efficient citizenship as the ability to read and write” 2 [email protected]Average depth 3ft (0 9144 ) (0.9144m) 3
13
Embed
Introdução à Estatística ESTATÍSTICA? e Estatística Descritivaec/files_1011/week 02 - descriptive... · [email protected] Introdução à Estatística e Estatística Descritiva
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Um conjunto de procedimentos e princípios para recolha, compilação, análise e interpretação de dados por forma a ajudar na tomada de decisões quando na presença de incerteza.
Herbert George Wells,Herbert George Wells, English author, said (circa 1940 ),
“Statistical thinking will one day be as necessary for efficient citizenship as the abilitynecessary for efficient citizenship as the ability to read and write”
A. The average number of tosses until HTH is larger thanthe average number of tosses until HTT
B. The average number of tosses until HTH is the same asthe average number of tosses until HTT
C. The average number of tosses until HTH is smaller thanthe average number of tosses until HTT
Most people think that B is true but A is true The averageMost people think that B is true but A is true. The average number of tosses till HTH is 10 and the average number of tosses till HTT is 8.
• Intuitive explanation:• Imagine that you win if HTH occursImagine that you win if HTH occurs
– If the first toss gives a H you are exited and you get even more exited if the second is a T. If the third is H you win ybut if it is a T you have to start again and wait for the next H.
• If you win when HTT occursy– For the first two tosses the experience is the same.
However, if the third toss is a H you loose but you already have the first H and are 1/3 of the way to your pattern.
A relação existente entre os dois atributos de uma amostra bivariada com dados quantitativos pode ser evidenciada por um diagrama (X Y)com dados quantitativos pode ser evidenciada por um diagrama (X,Y)ou, de forma mais sintética, pelo cálculo do grau de ajuste de determinada relação
Um scatterplot permite analisar o relacionamento geral e a existência de desvios entre duas variáveis.
Por vezes interessa caracterizar a relação entre duas variáveis e medirPor vezes interessa caracterizar a relação entre duas variáveis e medir o respectivo grau de ajuste.
The Lie Factor is simply the ratio of the difference in the proportion of the graphic elements versus the difference in the quantities they represent. The most informative graphics are those with a Lie Factor of 1. Here is an example of a badly scaled graphic, with a lie factor of 14.8:
33
(from Tufte, E.R. (1983). The Visual Display of Quantitative Information. Cheshire, CT: Graphics Press)
An example of a graph where two-dimensional figures are used to represent one-dimensional values. What often phappens is that the size of the graphic is scaled both horizontally and vertically according to the value being graphed. However, this results in the area of the graphic varying with the square of the underlying data, causing y g q y g , gthe eye to read an exaggerated effect in the graph. This graph has a lie factor of about 2.8, based on the variation between the area of each doctor graphic and the number it represents. p
34
(from Tufte, E.R. (1983). The Visual Display of Quantitative Information. Cheshire, CT: Graphics Press)
One more point about graphs: be sure to include enough context to make the graph meaningful. For instance, one may be tempted to draw unwarranted conclusions based on this graph:
(f T ft E R (1983) Th Vi l Di l f Q tit ti I f ti Ch hi CT G hi P )
36
(from Tufte, E.R. (1983). The Visual Display of Quantitative Information. Cheshire, CT: Graphics Press)
Designa-se por população (ou universo) o conjunto dos g p p p ç ( ) jdados que expressam a característica em causa para todos os objectos sobre os quais a análise incide.
Uma amostra corresponde a um subconjunto de d d t à l ãdados que pertencem à população.
QQuando todos os elementos da população têm igual probabilidade de ser incluídos na amostra evita-se qualquer enviesamento de selecção designando se então o processo porenviesamento de selecção, designando-se então o processo por
Análise dos dadosRecorre-se às técnicas de estatística descritiva para sintetizar a informação contida nos dados
Estabelecimento de inferências acerca da populaçãoCom base na informação contida na amostra pretendemCom base na informação contida na amostra, pretendem retirar-se conclusões relativas à população e associar-lhes um grau de credibilidade
Na inferência estatística com base na análise de umNa inferência estatística, com base na análise de um conjunto limitado de dados (amostra), pretende-se caracterizar o todo a partir do qual tais dados foram p qobtidos (população)
E lExemplo
A partir dos 100 saldos disponíveis retirar conclusõesA partir dos 100 saldos disponíveis, retirar conclusões sobre a forma como se comportam os saldos das contas à ordem de todos os profissionais liberais clientes do pbanco
2057 entrevistas validadas e apresenta um erro de amostra de 2,16 por cento para um grau de probabilidade de 95 por cento.
819 entrevistas e apresenta um erro de amostragem para um intervalo de confiança de 95 por cento, de maisconfiança de 95 por cento, de mais ou menos 3,42 por cento.
Independente -> Instituto de Pesquisa de Opinião e Mercado (IPOM)
Resultados Finais
997 entrevistas validadas e apresenta um erro de amostragem, para um nível de confiança de 95,5 por cento, de mais ou
Na avaliação de um problema de classificação foram utilizados dois algoritmos ONa avaliação de um problema de classificação foram utilizados dois algoritmos. O algoritmo A classificou correctamente 27 de 45 exemplos enquanto o algoritmo B classificou correctamente 32 de 65 exemplos.A h d fi l it A é i ifi ti t i i dAcha que se pode afirmar que o algoritmo A é significativamente mais preciso do que o algoritmo B?
4906532
6004527 .. ==== ba pep
121326532274527
6532
4527
.)()(
=−
=ET
65326532
45274527
33
)()( −+−
46
ivasignificat amenteestatistic é não diferença a logo,6451121 .. <