Top Banner
BIOMETRÍA 242203 242317 17 de abril de 2012 Sergio Neira Hugo Arancibia
30

Biometria clase 6

Jan 28, 2018

Download

Engineering

Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Biometria clase 6

BIOMETRÍA

242203 242317

17 de abril de 2012

Sergio Neira – Hugo Arancibia

Page 2: Biometria clase 6

• Distribuciones de probabilidad = frecuencias teóricas.

• Nos permiten hacer predicciones, hacer juicios o tomar decisiones.

• Las usamos porque se ajustan a observaciones.

• Cuando la data (obs) no se ajustan a la teoría (esp), estaremos frente a la

presencia de algún mecanismo biológico causando esta discrepancia (o

desviación).

• TLC: Independiente de la distribución subyacente, si las sumas o

promedios de muestras grandes e independientes son estandarizadas,

entonces seguirán una distribución normal.

• TLC apoya el uso de pruebas estadísticas que suponen distribución

normal.

Page 3: Biometria clase 6

µ -1σ -2σ -3σ 1σ 2σ 3σ

50%

68.27%

95.45%

99.73%

Page 4: Biometria clase 6

• Comportamiento de las muestras

• La distribución de la media muestral

• La distribución de la proporción muestral

• Distribuciones muestrales e inferencia estadística

Page 5: Biometria clase 6

Supongamos que tenemos un censo (e.g. conocemos la

población completa y sus parámetros poblacionales µ y σ.

Unos años después queremos indagar nuevamente sobre los

parámetros, pero no podemos muestrear nuevamente toda la

población. Entonces, tomamos una muestra y obtenemos los

parámetros muestrales y s.

¿Cuál es la conexión entre la muestra poblacional y la

muestral?

x

Page 6: Biometria clase 6

Población de langostino amarillo

µ

Page 7: Biometria clase 6

Población de

langostino amarillo

x

Muestra

(30 indv.)

Media

muestral

?

Page 8: Biometria clase 6

Población de

langostino amarillo

x

?

x

x

Page 9: Biometria clase 6

Si tomamos una muestra mañana, tendremos otra media y

varianza, distintas muestras tendremos distintas medias y

varianzas.

De hecho, podemos tener múltiples medias dependiendo del

número de muestras que tengamos.

Entonces ¿Por qué debemos confiar en una media muestral

específica?

1. Las medias muestrales varían, pero lo hacen alrededor de la

media poblacional.

2. Aunque varían, no varían mucho. De hecho cualquier media

muestral no se ubicará muy lejos de la media poblacional (media

verdadera).

Page 10: Biometria clase 6

Si tenemos una población (universo) existe una población

completa de medias muestrales, esta población es conocida

como .

Y la probabilidad de la es la distribución de probabilidad que

describe .

El estudio de la distribución de la media muestral nos permite:

1. Estudiar como se “comportan las muestras”.

¿Qué medias muestrales encontraremos?

¿Cuál es su verosimilitud?

¿Cuál es su variabilidad?

X

XX

Page 11: Biometria clase 6

MM1 MM2

MM1 y MM2 constituyen el conjunto , y tiene su propia distribución:

La Distribución de la Media Muestral.

X

X

Page 12: Biometria clase 6

Como ya vimos, la distribución de la media muestral se

distribuye alrededor de la media poblacional µ.

1. Entonces, la media de la distribución de la media muestral

es igual a la media poblacional µ.

2. Las medias muestrales no varían demasiado, entonces si X

tiene una desviación estándar σ y tamaño muestral n,

entonces:

La desviación estándar de

=> Mientras más grande es n, menor es σ. Esto es, menor

variación alrededor de µ.

nX

Page 13: Biometria clase 6

Si la distribución de x es normal, es normal.

Si la distribución de x no es normal, aún será normal si la muestra es suficientemente grande.

La distribución muestral de la media es la distribución principal que obtendremos de variables numéricas.

Si tenemos una variable categórica, entonces nos enfocamos en la distribución muestral de la proporción.

X

X

X

Page 14: Biometria clase 6

Si la variable x es categórica, esto significa que sus valores son categorías (cualidades).

Supongamos que queremos conocer el sabor favorito de las personas (chocolate, vainilla, pasas al ron) .

Estos tres sabores serán las tres categorías de x.

En general, nos interesaremos por la(s) proporción(es) de una o más de estas categorías.

Proporción de chocolate=50% (π= 50%)

Page 15: Biometria clase 6

Tal como en el caso de , podemos tomar distintas muestras y cada muestra nos arrojará un valor distinto de π. π1= 39%

π2= 41% π3= 40% π4= 38% . . . Definimos la variable P como la distribución muestral de π.

X

Page 16: Biometria clase 6

Tal como en el caso de , esperamos que las proporciones muestrales varíen alrededor de la π de la población.

Supongamos entonces que tenemos una variable categórica X, y que estamos interesados en la proporción de una de las categorías dentro de X, cuya distribución de la proporción muestral es π.

Sea P la distribución de π.

X

Page 17: Biometria clase 6

P se distribuirá aproximadamente normal con

2

1

)1(

n

Page 18: Biometria clase 6

Usamos todo lo que hemos visto para realizar Inferencia estadística:

1. Recolectar una muestra

2. Concluir cosas respecto de la población

Page 19: Biometria clase 6

Supongamos que tenemos dos poblaciones:

X: µ = 50 y σ=5

Y : µ = 55 y σ=20

Tenemos una muestra cuya media muestral es = 52.

¿A qué población corresponde?

Page 20: Biometria clase 6

X~N(50, 5)

Y~N(55, 20)

Media muestra = 52

Page 21: Biometria clase 6

X~N(50, 5)

Y~N(55, 20)

Media muestra = 52

La media de la muestra se acerca más a 50 que a 55. Pertenece a X?

Page 22: Biometria clase 6

X~N(50, 0.5)

Y~N(55, 2)

Media muestra = 52

Miremos ahora las distribuciones muestrales.

Page 23: Biometria clase 6

X~N(50, 0.5)

Media muestra = 52

El valor de la media parece

extremo en X

Page 24: Biometria clase 6

Media muestra = 52

El valor de la media parece

extremo en X, pero no en Y.

Y~N(55, 2)

Page 25: Biometria clase 6

Media muestra = 52

El valor de la media parece

extremo en X, pero no en Y.

Entonces, inferimos que la

muestra vino de Y

Y~N(55, 2)

Page 26: Biometria clase 6

Existen dos campos principales en la inferencia estadística:

• Estimación

• Pruebas

Inferencia: Una conclusión que surge de forma lógica a partir de

observaciones o premisas

Page 27: Biometria clase 6

• Tomamos una muestra

• Calculamos la media y, de acuerdo a ella,

• Damos un rango de valores para la media poblacional

Page 28: Biometria clase 6

Una muestra de las notas del primer test de BIOMETRIA arrojó lo siguiente:

“Confío que el promedio del curso está entre y ”.

Calculamos la media para entregar un rango

de valores para el parámetro poblacional.

95.0)96.196.1( xx sxsxP Aleatorio X

24 6.0

17 4.0

30 5.5

32 2.0

7 2.0

8 6.5

3 2.0

14 4.0

5 4.5

13 5.5

media 4.2

desv. Estándar 1.7

n 10.0

sx 0.5

Page 29: Biometria clase 6

1. Proponemos un valor para el parámetro poblacional

2. Tomamos una muestra 3. Probamos nuestro supuesto contra la muestra.

Page 30: Biometria clase 6

Supuesto sobre el chocolate Proporción poblacional: 40% Tomamos una muestra La proporción muestral: 32% Conclusión Nuestro supuesto sobre la proporción poblacional fue errado (πpoblacional ≠ 40%) En este caso la muestra se usa como evidencia para probar un supuesto sobre la población.