Top Banner
Probabilidades y Estadística I TEMA 1 El análisis estadístico de datos
53

Tema1 (1ª parte)

Jan 26, 2017

Download

Education

Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Tema1 (1ª parte)

Probabilidades y Estadística I

TEMA 1

El análisis estadístico de datos

Page 2: Tema1 (1ª parte)

Probabilidades y Estadística I

Esquema inicial

1. Introducción.

2. Variables y datos. Tipos de datos.

3. Descripción de datos mediante tablas.

4. Descripción de datos mediante gráficos.

5. Introducción al análisis exploratorio de datos.

Page 3: Tema1 (1ª parte)

Probabilidades y Estadística I

Esquema inicial

1. Introducción.

2. Variables y datos. Tipos de datos.

3. Descripción de datos mediante tablas.

4. Descripción de datos mediante gráficos.

5. Introducción al análisis exploratorio de datos.

Page 4: Tema1 (1ª parte)

Probabilidades y Estadística I

1. Introducción

Seis objetivos de la Estadística Descriptiva

A. Recoger y organizar datos (observaciones)

x1, x2,..., xn

Calificaciones de “Probabilidades y Estadística” en 20 alumnos

5.12, 7, 8.62, 6, 2.88, 7.33, 2.08, 2.75, 5.25, 5, 6.88, 5.83, 5, 3.38, 6.25, 6.12, 6, 4.62, 6.62, 8.5

(x1, y1), (x2, y2),…,(xn,, yn) (5.12, 2), (7, 1), (8.62, 2), (6, 3), (2.88, 2),(7.33, 2), (6, 3), (2.75, 4) (5.25, 2), (5, 1),(6.88, 5) (5.83, 1), (5, 4), (3.38,4), (6.25, 3), (6.12, 1), (6, 2), (4.62, 3), (6.62, 2), (8.5, 1)

Calificaciones de “Probabilidades y Estadística” y nº de convocatorias utilizadas hasta ahora

(1/6)

Page 5: Tema1 (1ª parte)

Probabilidades y Estadística I

1. Introducción (2/6)

B. Técnicas de visualización para datos multivariantes (visualización)

Seis objetivos de la Estadística Descriptiva

Page 6: Tema1 (1ª parte)

Probabilidades y Estadística I

1. Introducción

C. Esquematizar el comportamiento de los datos mediante tablas, gráficos o dibujos (patrones)

Seis objetivos de la Estadística Descriptiva

(3/6)

Page 7: Tema1 (1ª parte)

Probabilidades y Estadística I

1. Introducción

D. Resumir la información en unos pocos datos representativos (síntesis)

Seis objetivos de la Estadística Descriptiva

(4/6)

Page 8: Tema1 (1ª parte)

Probabilidades y Estadística I

1. Introducción

E. Analizar la relación de dependencia entre las componentes de datos multidimensionales (correlación)

Seis objetivos de la Estadística Descriptiva

(5/6)

Page 9: Tema1 (1ª parte)

Probabilidades y Estadística I

1. Introducción

F. Interpretar la información obtenida (aprendizaje)

Seis objetivos de la Estadística Descriptiva

(6/6)

Page 10: Tema1 (1ª parte)

Probabilidades y Estadística I

Esquema inicial

1. Introducción.

2. Variables y datos. Tipos de datos.

3. Descripción de datos mediante tablas.

4. Descripción de datos mediante gráficos.

5. Introducción al análisis exploratorio de datos.

Page 11: Tema1 (1ª parte)

Probabilidades y Estadística I

2. Variables y datos. Tipos de datos

Enunciados genéricos

(1/12)

Sea x1, x2,….., xn un conjunto de n valores numéricos

Sea (x1, y1), (x2, y2),….., (xn, yn)

Sea 1 1 1 2 2 21 2 1 2 1 2( , ,..., ), ( , ,..., ),......, ( , ,..., )n n n

m m mx x x x x x x x x

Page 12: Tema1 (1ª parte)

Probabilidades y Estadística I

2. Variables y datos. Tipos de datos

Glosario de términos

(5/12)

1. Población (universo, colectivo)

2. Muestra

4. Modalidades

5. Variables estadísticas

3. Carácter

Page 13: Tema1 (1ª parte)

Probabilidades y Estadística I

Page 14: Tema1 (1ª parte)

Probabilidades y Estadística I

2. Variables y datos. Tipos de datos

Enunciado

(6/12)

Se seleccionan 20 alumnos de la Facultad de Informática con la asignatura “Probabilidad y Estadística” aprobada. Se recoge información sobre el número deconvocatorias que necesitaron para aprobar dicha asignatura

PoblaciónMuestra

Carácter a estudio

MODALIDADES: {1,2,3,......} (carácter cuantitativo)

Page 15: Tema1 (1ª parte)

Probabilidades y Estadística I

2. Variables y datos. Tipos de datos

Otro enunciado

(7/12)

Se seleccionan 20 alumnos de la Facultad de Informática con la asignatura “Probabilidad y Estadística” aprobada. Se recoge información sobre su nota en laAsignatura.

Carácter a estudio

MODALIDADES: [5,10] (carácter cuantitativo)

Page 16: Tema1 (1ª parte)

Probabilidades y Estadística I

Discreto

Continuo

Page 17: Tema1 (1ª parte)

Probabilidades y Estadística I

2. Variables y datos. Tipos de datos

Un nuevo enunciado

(8/12)

Se seleccionan 20 alumnos de la Facultad de Informática con la asignatura “Probabilidad y Estadística” aprobada. Se recoge información sobre su color deojos.

Carácter a estudio

MODALIDADES: {negros, marrones, azules, otros} (carácter cualitativo)1 2 3 4

MEDIDA NOMINAL

Page 18: Tema1 (1ª parte)

Probabilidades y Estadística I

2. Variables y datos. Tipos de datos

Tipos de caracteres

(9/12)

Se seleccionan 20 alumnos de la Facultad de Informática con la asignatura “Probabilidad y Estadística” aprobada. Se recoge información sobre el nivelde estudio de su padre .

Carácter a estudio

MODALIDADES: {SE, EGB, BUP, Universitario} (carácter cualitativo)1 2 3 4

MEDIDA ORDINALEl penúltimo enunciado

Page 19: Tema1 (1ª parte)

Probabilidades y Estadística I

2. Variables y datos. Tipos de datos

El último

(10/12)

Se lanza 20 veces una moneda y se observan los resultados.

MODALIDADES: {C, X} (carácter cualitativo)

Población: Lanzar una moneda (experimento aleatorio)

Muestra: 20 lanzamientos

MEDIDA NOMINAL

Page 20: Tema1 (1ª parte)

Probabilidades y Estadística I

2. Variables y datos. Tipos de datos

NOTACIÓN

(11/12)

1. Población (universo, colectivo)

2. Muestra

4. Modalidades

5. Variables estadísticas

3. Carácter

P

M P

C

C1, C2,…., Ck

Xx’1, x’2,…., x’k k valores

diferentes

Page 21: Tema1 (1ª parte)

Probabilidades y Estadística I

Ejemplo del Lego

NOTACIÓN

1. Población (universo, colectivo)

2. Muestra

4. Modalidades

5. Variables estadísticas

3. Carácter

Piezas del lego

Subconjunto de 10 piezas

Color

rojo, azul, verde

X1, 2, 3 3 valores

diferentes

Page 22: Tema1 (1ª parte)

Probabilidades y Estadística I

2. Variables y datos. Tipos de datos

Glosario de términos

1. Población (universo, colectivo)

2. Muestra

4. Modalidades

5. Variables estadísticas

3. CarácterCualitativo

Cuantitativo

Discreta

ContinuaModalidades = Rango

Page 23: Tema1 (1ª parte)

Probabilidades y Estadística I

2. Variables y datos. Tipos de datos

Glosario de términos

1. Población (universo, colectivo)

2. Muestra

4. Modalidades

5. Variables estadísticas

3. CarácterCualitativo

Cuantitativo

Discreta

ContinuaModalidades = Rango

Cuantificación Medida nominal

Medida ordinal

Page 24: Tema1 (1ª parte)

Probabilidades y Estadística I

2. Variables y datos. Tipos de datos

Glosario de términos

1. Población (universo, colectivo)

2. Muestra

4. Modalidades

5. Variables estadísticas

3. CarácterCualitativo

Cuantitativo

Discreta

ContinuaModalidades = Rango

Medida de intervalo

Medida de razón

Page 25: Tema1 (1ª parte)

Probabilidades y Estadística I

Medida Operacionesposibles

Requisitos Ejemplo.

Nominal Verificar la igualdadde dos modalidades.

Posibilidad depermutar

modalidades

Estado civil, Sexo,nacionalidad.

Ordinal Verificar si unamodalidad es mayor

que otra.

Mantenimiento delorden

Gravedad de unalesión.

De intervalo Comparar lasdiferencias entre dos

modalidades.

Unidad constante Temperatura.

De razónEstablecer razonesentre modalidades Existencia de cero

absolutoPeso, altura...

2. Variables y datos. Tipos de datos

Caracterescualitativos

Caracterescuantitativos

Page 26: Tema1 (1ª parte)

Probabilidades y Estadística I

2. Variables y datos. Tipos de datos

MEDIDANOMINAL

Relaciones entre medidas

MEDIDAORDINAL

MEDIDADE INTERVALO

MEDIDADE RAZÓN

Page 27: Tema1 (1ª parte)

Probabilidades y Estadística I

Pregunta de test

Page 28: Tema1 (1ª parte)

Probabilidades y Estadística I

Esquema inicial

1. Introducción.

2. Variables y datos. Tipos de datos.

3. Descripción de datos mediante tablas (caso unidimensional)

4. Descripción de datos mediante gráficos.

5. Introducción al análisis exploratorio de datos.

Page 29: Tema1 (1ª parte)

Probabilidades y Estadística I

3. Descripción de datos mediante tablas (1/8)

SERIE 1 3, 3, 3, 3, 3, 3, 3, 3, 3, 3

SERIE 2 2, 4, 6, 8, 10, 12

SERIE 3 1, 2, 2, 3, 3, 3, 4, 4, 4, 4

PATRONES NUMÉRICOS

SERIE 4 1, 2, 1, 1, 2, 3, 2, 1, 1, 1

Cte = 3

Xn = 2n n = 1,2,3....

n veces el número “n”

Page 30: Tema1 (1ª parte)

Probabilidades y Estadística I

3. Descripción de datos mediante tablas (2/8)

PATRONES NUMÉRICOS

SERIE 4 Seis “1”Tres “2”Un “3”

REPETICIONES(Tablas)

REPETICIONES(Gráficos)

Page 31: Tema1 (1ª parte)

Probabilidades y Estadística I

Modalidad Frecuencia absoluta

Frecuencia absoluta acumulada

Frecuencia relativa

Frecuencia relativa acumulada

x’1 n1 N1=n1 f1 = n1/n F1 = f1

x’2 n2 N2=n1 + n2 f2 = n2/n F2= f1 + f2... ... ... ... ...

x’i ni Ni = n jj

i

1f1 = ni/n Fi= f j

j

i

1

... ... ... ... ...

x’k nk Nk =

k

jjn

1fk = nk/n Fk= f j

j

n

1= 1

TOTALES n 1

3. Descripción de datos mediante tablas (3/8)

DATOS UNIDIMENSIONALES

Page 32: Tema1 (1ª parte)

Probabilidades y Estadística I

Modalidad Frecuencia absoluta

Frecuencia absoluta acumulada

Frecuencia relativa

Frecuencia relativa acumulada

1 6 6 6/10 = 0.60 0.60

2 3 9 0.30 0.90

3 1 10 0.10 1

TOTALES 10 1

SERIE 4 1, 2, 1, 1, 2, 3, 2, 1, 1, 1

Page 33: Tema1 (1ª parte)

Probabilidades y Estadística I

MUESTRA: 20 Alumnos con la asignatura “Probabilidad y Estadística”aprobada

POBLACIÓN: Alumnos de la Facultad de Informática

VARIABLE ESTADÍSTICA: X nº de convocatorias

RANGO: Rg X = {1,2,3,......}

SERIE: 5, 3, 1, 2, 1, 3, 1, 3, 5, 1, 2, 1, 1, 1, 2, 4, 5, 1, 2, 1

SERIE ORDENADA: 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 5, 5, 5

3. Descripción de datos mediante tablas (4/8)

EJEMPLO 1

Page 34: Tema1 (1ª parte)

Probabilidades y Estadística I

Nº deconvocatorias

Frecuenciaabsoluta

Frecuencia absolutaacumulada

Frecuenciarelativa

Frecuencia relativaacumulada

1 9 9 9/20 = 0.45 0.45

2 4 13 0.20 0.65

3 3 16 0.15 0.80

4 1 17 0.05 0.85

5 3 20 0.15 1

TOTALES 20 1

3. Descripción de datos mediante tablas (5/8)

EJEMPLO 1

Page 35: Tema1 (1ª parte)

Probabilidades y Estadística I

MUESTRA: 20 Alumnos presentados a una convocatoria de la asignatura “Probabilidades y Estadística”

POBLACIÓN: Alumnos de la Facultad de Informática

VARIABLE ESTADÍSTICA: X calificación en “P y E”

RANGO: Rg X = [0,10]

SERIE: 5.12, 7, 8.62, 6, 2.88, 7.33, 2.08, 2.75, 5.25, 5, 6.88, 5.83, 5, 3.38, 6.25, 6.12, 6, 4.62, 6.62, 8.5

SERIE ORDENADA: 2.08, 2.75, 2.88, 3.88, 4.62, 5, 5, 5.12, 5.25, 5.83, 6,6, 6.12, 6.25, 6.62, 6.88, 7, 7.33, 8.5, 8.62

3. Descripción de datos mediante tablas (6/8)

EJEMPLO 2

Page 36: Tema1 (1ª parte)

Probabilidades y Estadística I

Calificaciones(clases)

Marcas declase

Frecuenciaabsoluta

Frecuencia absolutaacumulada

Frecuenciarelativa

Frecuencia relativaacumulada

[ 0, 1 ] 0.5 0 0 0 0

( 1, 2 ] 1.5 0 0 0 0

( 2, 3 ] 2.5 3 3 0.15 0.15

( 3, 4 ] 3.5 1 4 0.05 0.20

( 4, 5 ] 4.5 3 7 0.15 0.35

( 5, 6 ] 5.5 5 12 0.25 0.60

( 6, 7 ] 6.5 5 17 0.25 0.85

( 7, 8 ] 7.5 1 18 0.05 0.90

( 8, 9 ] 8.5 2 20 0.10 1

( 9, 10 ] 9.5 0 20 0 1

TOTALES 20 1

3. Descripción de datos mediante tablas (7/8)

EJEMPLO 2

MODALIDADESx’i

Page 37: Tema1 (1ª parte)

Probabilidades y Estadística I

3. Descripción de datos mediante tablas (8/8)

AGRUPAMIENTO EN CLASES

Page 38: Tema1 (1ª parte)

Probabilidades y Estadística I

Pregunta de test

Page 39: Tema1 (1ª parte)

Probabilidades y Estadística I

Esquema inicial

1. Introducción.

2. Variables y datos. Tipos de datos.

3. Descripción de datos mediante tablas.

4. Descripción de datos mediante gráficos (caso unidimensional)

5. Introducción al análisis exploratorio de datos.

Page 40: Tema1 (1ª parte)

Probabilidades y Estadística I

No presentadosAprobadosSuspensos

34,09%

48,86%

17,05%

4. Descripción de datos mediante gráficos (1/13)

Medidas nominales. Datos categóricos

1. Diagrama de sectores

VARIABLE ESTADÍSTICA

DISCRETA

Page 41: Tema1 (1ª parte)

Probabilidades y Estadística I

Frec

uenc

ias A

bsol

utas

Continentes

0

10

20

30

40

50

Europa América Asia Africa Oceanía

4. Descripción de datos mediante gráficos (2/13)

Medidas nominales. Datos categóricos

2. Diagrama de rectángulos

VARIABLE ESTADÍSTICA

DISCRETA

Page 42: Tema1 (1ª parte)

Probabilidades y Estadística I 0 10 20 30 40 50

España

Francia

Italia

Bélgica

3. Pictogramas

4. Descripción de datos mediante gráficos (3/13)

Medidas nominales. Datos categóricos

3. Pictogramas

VARIABLE ESTADÍSTICA

DISCRETA

Page 43: Tema1 (1ª parte)

Probabilidades y Estadística I

Medidas ordinales e intervalar/razón

1. Diagrama de barras

4. Descripción de datos mediante gráficos (4/13)

Representacióndiferencial

VARIABLE ESTADÍSTICA

DISCRETA

Page 44: Tema1 (1ª parte)

Probabilidades y Estadística I

Medidas ordinales e intervalar/razón

2. Función de distribución escalonada

4. Descripción de datos mediante gráficos (5/13)

Representaciónintegral

VARIABLE ESTADÍSTICA

DISCRETA

Page 45: Tema1 (1ª parte)

Probabilidades y Estadística I

4. Descripción de datos mediante gráficos (6/13)

Medidas intervalar/razón

1. Histogramas (polígono de frecuencias)

VARIABLE ESTADÍSTICA

CONTÍNUA

Representacióndiferencial

Page 46: Tema1 (1ª parte)

Probabilidades y Estadística I

4. Descripción de datos mediante gráficos (7/13)

Medidas intervalar/razón

2. Diagrama tallo-hoja

44, 45, 46, 46, 47, 48, 49, 50, 50, 50, 52, 52, 52, 52, 53, 53, 53, 54, 54, 54, 55, 55, 55, 55, 56, 56, 56, 57, 60, 60, 60, 60 ,60, 61, 61, 62, 62, 63, 64, 64, 64, 65, 65, 65, 66, 67, 68, 68, 68, 70, 70, 70, 70, 71, 72, 72, 74, 75, 80, 93.

Análisis Exploratorio de Datos

Page 47: Tema1 (1ª parte)

Probabilidades y Estadística I

Stem-and-Leaf Display for IPC: unit = 1,0 1|2 represents 12,0

10 0|1222333344 (9) 0|555556779 5 1| 5 1|5

HI|16,3 20,1 32,7 40,5 4 [3’5,4’5)

VALORES ATÍPICOS POR EXCESO

FRECUENCIAS ABSOLUTAS ACUMULADAS

4. Descripción de datos mediante gráficos (8/13)

Page 48: Tema1 (1ª parte)

Probabilidades y Estadística I

Page 49: Tema1 (1ª parte)

Probabilidades y Estadística I

IPC

Frec

. Abs

ol

0 4 8 12 160

2

4

6

8

10

4. Descripción de datos mediante gráficos (9/13)

Histograma vs. Tallo-hoja

Page 50: Tema1 (1ª parte)

Probabilidades y Estadística I

0 1 2 3 40

0,2

0,40,6

0,81

1,2

4. Descripción de datos mediante gráficos (10/13)

Catálogo de perfiles

Perfil de datos sin tratar

Page 51: Tema1 (1ª parte)

Probabilidades y Estadística I

-5 -3 -1 1 3 50

0,1

0,2

0,3

0,4

Forma de campana

4. Descripción de datos mediante gráficos (11/13)

Catálogo de perfiles

Page 52: Tema1 (1ª parte)

Probabilidades y Estadística I

0 10 20 30 40 50 600

0,02

0,04

0,06

0,08

0,1

Asimétrico desplazado a la dcha

0 1 2 3 40

0,2

0,4

0,6

0,8

1

1,2

4. Descripción de datos mediante gráficos (12/13)

Catálogo de perfiles

Page 53: Tema1 (1ª parte)

Probabilidades y Estadística I

4. Descripción de datos mediante gráficos (13/13)

Medidas intervalar/razón

3. Función de distribución (polígono acumulativo)

VARIABLE ESTADÍSTICA

CONTÍNUA