Top Banner
Estadística. Facultad de Matemáticas Tema: Modelos probabilisticos Métodos Estadísticos Tema : Modelos probabilísticos
52

Modelos probabilisticos

Feb 21, 2023

Download

Documents

Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Modelos probabilisticos

Estadística. Facultad de Matemáticas

Tema: Modelos probabilisticos

Métodos Estadísticos

Tema : Modelos probabilísticos

Page 2: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

Espacio Muestral

Cuando se realiza un experimento aleatorio diversos resultados son posibles. El conjunto de todos los resultados posibles se llama espacio muestral (S).

Algunos conceptos: Un experimento aleatorio es cualquier

operación cuyo resultado no puede predecirse con exactitud.

Ejemplos:1. Se tira un dado a la vez. El experimento consiste en lanzar un dado. El espacio muestral es:

S={1, 2, 3, 4, 5, 6}

Cada uno de los elementos del espacio muestral es llamado punto muestral.

Page 3: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

2. Se selecciona al azar una persona entre el estudiantado de una universidad.

S={Todos los estudiantes que se pudieran elegir}

2. Se selecciona al azar una persona entre el estudiantado de una universidad. El experimento consiste en seleccionar un estudiante de entre el estudiantado completo. El espacio muestral para el experimento sería:

=La lista de todos los estudiantes de dicha universidad al momento de hacer la selección={x| x es un estudiante de dicha universidad}

3. Se lanzan dos monedas. El experimento es justamente lanzar dos monedas. El espacio muestral sería:

S={AA, SS, AS, SA}

Page 4: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

Un subconjunto del espacio muestral (una parte de S) es llamado evento o suceso. Así por ejemplo

1. A={1,3,5}= números impares al lanzar un dado.

2. B=El estudiante debe ser de primer semestre de licenciatura.

3. Resulta al menos un A (aguila), al lanzar dos monedas.

son ejemplos de eventos de los ejemplos anteriores, respectivamente. Cuando el evento tiene sólo un punto muestral se dice que es un evento simple.

Page 5: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

Note que los puntos muestrales pueden ser objetos muy concretos, tales como los resultados de lanzar un dado, los estudiantes, los resultados AA, SS, AS, SA del lanzamiento de dos monedas. Y como tales poseen diversas cualidades, algunas de las cuales son medibles.

Por ejemplo, un estudiante tiene peso, estatura, edad; su aprovechamiento en alguna materia puede medirse por el promedio que obtuvo; lo hacen único algunas cualidades fisicas como sexo, color de ojos, si es gordo o flaco, etc.

Variable aleatoria

Page 6: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

Ejemplo: Sea S una población humana que consiste en n individuos, que podemos denotar por

S={s1, s2, ..., sn},

Si nos interesa su distribución de edad, podemos denotar por A(s) la edad de s. Así pues, a cada s está asociado un número A(s) de ciertas unidades, por ejemplo “años”. Por consiguiente, la aplicación

s A(s)

es una función cuyo dominio (los valores s) es el espacio muestral S, y los resultados de la aplicación son números enteros o reales.

Page 7: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

De forma parecida podemos denotar la estatura, el peso o los ingresos anuales mediante las funciones:

s H(s) s W(s) s I(s)

En este último caso, puede que I tome valores negativos!!. Por otra parte, puede que una combinación lineal de peso y estatura dé medida adecuada en ciertas cuestiones de interés medico:

s λH(s)+ρW(s)Siendo λ y ρ dos números. Se tiene tambien así una función de s. Analogamente, si s es una “cabeza de familia”, alias “el ganador” del pan, puede que a la oficina del censo le interese calcular la función

s I(s)/N(s)

Page 8: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

siendo N(s) el número de personas de su familia, a saber, de bocas a alimentar. El cociente anterior representa la “renta per capita” de la familia.

Definición [Variable aleatoria]: Una función X de s, de valores númericos, cuyo dominio es S:

sЄS: s X(s)

se llama variable aleatoria.

Page 9: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

Ejercicios:1. Un fabricante tiene cinco terminales de

computadoras aparentemente idénticas listas para ser enviadas a su destino. Él no sabe que dos de las cinco son defectuosas. Recibe un pedido especial de dos terminales y lo surte seleccionando al azar dos de las cinco disponibles.

i). Obtenga el espacio muestral para este experimento.ii). Sea A el evento en que el pedido se surte con

dos terminales no defectuosas. Liste los puntos muestrales de A.

iii). Asigne las probabilidades a los eventos simples de tal manera que la información en el problema se utilice.

iv). Encuentre la probabilidad del evento evento A.v). Si X(e) es la variable aleatoria que cuenta el

número número de terminales defectuosas, liste los valores de X(e) para cada punto muestral.

Page 10: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

2. Considere el problema de seleccionar dos aspirantes de un grupo de cinco para un empleo, e imagine que los aspirantes difieren en su grado de preparación, 1 es el mejor, 2 es el segundo mejor, y así sucesivamente para 3, 4 y 5. El jefe de personal naturalmente no sabe nada de esta clasificación. Defina dos eventos A y B como

A: El jefe de personal selecciona el mejor y uno de los dos peores aspirantes (aspirantes 1 y 4 o bien 1 y 5).

B: El jefe de personal selecciona al menos uno de los dos mejores.

i). Listar los elementos del espacio muestral.ii). Determinar las probabilidades de los eventos A y

B.iii). Si X((e1,e2)) es la variable aleatoria que

cuenta el número de empleados que se consideran mejores (los empleados 1 y 2). Liste el valor de X((e1,e2)) para cada punto muestral.

Page 11: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

3. Se hacen tres lanzamientos de una moneda. Sea X((l1,l2,l3)) la variable aleatoria que cuenta el número de caras.

i). Obtenga el espacio muestral para este experimento.ii). Asigne las probabilidades a los eventos simples .iii). Liste los valores que puede tomar X((l1,l2,l3)).iv). Determine la probabilidad de que cuando mucho

caigan dos caras.

Page 12: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

Distribuciones de probabilidad

Page 13: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

Función de probabilidad (V. Discretas) Asigna a cada posible valor de una variable discreta su probabilidad. Es decir:

f(xi)=P(X= xi)

Ejemplo Número de caras al lanzar 3 monedas. 0%

5%

10%

15%

20%

25%

30%

35%

40%

0 1 2 3

Page 14: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

Función de densidad (V. Continuas) Definición

Es una función no negativa de integral 1.

Piénsalo como la generalización del histograma con frecuencias relativas para variables continuas.

¿Para qué lo voy a usar? Nunca lo vas a usar directamente.

Sus valores no representan probabilidades.

Page 15: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

¿Para qué sirve la f. densidad? Muchos procesos aleatorios vienen descritos por

variables de forma que son conocidas las probabilidades en intervalos.

La integral definida de la función de densidad en dichos intervalos coincide con la probabilidad de los mismos.

Es decir, identificamos la probabilidad de un intervalo con el área bajo la función de densidad.

Page 16: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

Función de distribución Es la función que asocia a cada valor de

una variable, la probabilidad acumulada de los valores inferiores o iguales.

Se representa por F(x). Así,F(xi)=P(X xi)

Piénsalo como la generalización de lasfrecuencias acumuladas. Diagrama integral.

A los valores extremadamente bajos les corresponden valores de la función de distribución cercanos a cero.

A los valores extremadamente altos les corresponden valores de la función de distribución cercanos a uno.

Lo encontraremos en los artículos y aplicaciones en forma de “p-valor”, significación,…

Page 17: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

Valor esperado y varianza de una v.a. X Valor esperado

Se representa mediante E[X] ó μEs el equivalente a la media

VarianzaSe representa mediante VAR[X] o σ2

Es el equivalente a la varianzaSe llama desviación típica a σ

Page 18: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

Algunos modelos de variables aleatorias Hay variables aleatorias que aparecen con frecuencia en las Ciencias de la Salud. Experimentos dicotómicos.

Bernoulli

Contar éxitos en experimentos dicotómicos repetidos:

Binomial Poisson (sucesos raros)

Y en otras muchas ocasiones… Distribución normal (gaussiana, campana,…)

El resto del tema está dedicado a estudiar estas distribuciones especiales.

Page 19: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

Distribución de Bernoulli Tenemos un experimento de Bernoulli si al realizar un experimentos sólo son posibles dos resultados: X=1 (éxito, con probabilidad p) X=0 (fracaso, con probabilidad q=1-p)

Lanzar una moneda y que salga cara. p=1/2

Elegir una persona de la población y que esté enfermo.

p=1/1000 = prevalencia de la enfermedad Aplicar un tratamiento a un enfermo y que éste se cure.

p=95%, probabilidad de que el individuo se cure Como se aprecia, en experimentos donde el resultado es dicotómico, la variable queda perfectamente determinada conociendo el parámetro p.

Page 20: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

Ejemplo de distribución de Bernoulli. Se ha observado estudiando 2000 accidentes de tráfico con impacto frontal, y cuyos conductores no tenían cinturón de seguridad,, que 300 individuos quedaron con secuelas. Describa el experimento usando conceptos de variable aleatoria.

Solución. S={Los 2000 accidentes de tráfico con impacto

frontal}. A={Los 300 individuos que quedaron con secuelas}. La probabilidad de tener secuelas es

300/2000=0.15=15%

X=“tener secuelas tras accidente sin cinturón” es variable de Bernoulli

X=1 tiene probabilidad p = 0.15 X=0 tiene probabilidad q=1-p= 0.85

Page 21: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

Ejemplo de distribución de Bernoulli. Se ha observado estudiando 2000 accidentes de tráfico con impacto frontal, y cuyos conductores sí tenían cinturón de seguridad, que 10 individuos quedaron con secuelas. Describa el experimento usando conceptos de variable aleatoria.

Solución. S={Los 2000 accidentes de tráfico con impacto

frontal}. B={Los 10 individuos que quedaron con secuelas}. La probabilidad de tener secuelas es 10/2000=0.005

X=“tener secuelas tras accidente usando cinturón” es variable de Bernoulli

X=1 tiene probabilidad p = 0.005 X=0 tiene probabilidad q = 1-p = 0.995

Page 22: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

Observación En los dos ejemplos anteriores hemos visto cómo

enunciar los resultados de un experimento en forma de estimación de parámetros en distribuciones de Bernoulli. Sin cinturón: p = 15% Con cinturón: p = 0.5%

En realidad no sabemos en este punto si ambas cantidades son muy diferentes o aproximadamente iguales, pues en otros estudios sobre accidentes, las cantidades de individuos con secuelas hubieran sido con seguridad diferentes.

Para decidir si entre ambas cantidades existen diferencias estadísticamente significativas necesitamos introducir conceptos de estadística inferencial (extrapolar resultados de una muestra a toda la población).

Page 23: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

Ejercicios1. Se ha observado que un jugador de baloncesto al realizar 20 tiros libres, 15 son anotaciones. Describa el experimento usando conceptos de variable aleatoria.

2. Un estudiante presenta un examen de selección múltiple que contiene 8 preguntas cada una con 3 respuestas opcionales. Suponga que el estudiante esta adivinando al responder a cada pregunta. ¿Cúal es la probabilidad de que el estudiante responda correctamente a cada pregunta?.

3. De una población de 15 000 votantes registrados, 800 estan a favor del candidato Gómez. ¿Cúal es la probabilidad de que Gómez gane las elecciones (en este momento)?.

Page 24: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

Distribución Binomial Si se repite un número fijo de veces, n, un

experimento de Bernoulli con parámetro p, el número de éxitos sigue una distribución binomial de parámetros (n,p). Se denotará B(n,p).

Lanzar una moneda 10 veces y contar las caras. Bin(n=10,p=1/2)

Lanzar una moneda 100 veces y contar las caras. Bin(n=100,p=1/2) Difícil hacer cálculos con esas cantidades. El modelo normal

será más adecuado.

El número de personas que enfermará (en una población de 500.000 personas) de una enfermedad que desarrolla una de cada 2000 personas.

Bin(n=500.000, p=1/2000) Difícil hacer cálculos con esas cantidades. El modelo de

Poisson será más adecuado.

Page 25: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

Distribución binomial Función de probabilidad

Problemas de cálculo si n es grande y/o p cercano a 0 o 1.

Media: μ =n p

Varianza: σ2 = n p q

nkqpknkXPpnXB knk

0 ,][),;(

Page 26: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

EjemploLa experiencia a demostrado que el 50% de todas las personas afectadas por cierta enfermedad, se recupera. Una compañía farmacéutica desarrollo una nueva vacuna. Se seleccionaron al azar 10 personas con la enfermedad en cuestión y se les administro la vacuna; poco después nueve se recuperaron. ¿Cuál es la probabilidad de que al menos nueve de 10 personas infectadas se recupere?Solución:Sea X el número de personas que se recuperan. Si la vacuna no funciona la probabilidad de que la persona se recupere es p=0.5. Si el número de pruebas es n=10, entonces la probabilidad que se pide es

109]9[10

9

XPXPkXPXPk

0108.00010.00098.0

Page 27: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

Probability Density FunctionBinomial with n = 10 and p = 0.500000

x P( X = x) 0.00 0.0010 1.00 0.0098 2.00 0.0439 3.00 0.1172 4.00 0.2051 5.00 0.2461 6.00 0.2051 7.00 0.1172 8.00 0.0439 9.00 0.0098 10.00 0.0010

Cumulative Distribution FunctionBinomial with n = 10 and p = 0.500000

x P( X <= x) 0.00 0.0010 1.00 0.0107 2.00 0.0547 3.00 0.1719 4.00 0.3770 5.00 0.6230 6.00 0.8281 7.00 0.9453 8.00 0.9893 9.00 0.9990 10.00 1.0000

Page 28: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

0 5 10

0.00

0.05

0.10

0.15

0.20

0.25

Núm ero de enferm os

P(X)

0 5 10

0.0

0.5

1.0

Núm ero de enferm os

P(X<=k)

Función de probabilidad

Función de distribución

Page 29: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

Ejercicios1. La probabilidad de que un jugador de baloncesto anote un tiro libre es de ¾, y sus tiros son independientes. Suponiendo que puede hacer 5 tiros libres en un juego, ¿Cuál es la probabilidad

a) De que acierte todos los tiros?b) De que acierte por lo menos 3 tiros?2. Un estudiante presenta un examen de selección múltiple que contiene 8 preguntas cada una con 3 respuestas opcionales. Suponer que esta adivinando al responder a cada pregunta. ¿Cuál es la probabilidad

a) De que responda incorrectamente a todas las preguntas?

b) De que responda correctamente al menos 6 preguntas?

Page 30: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

Ejercicios3. Un inversionista compra cinco viviendas como

parte de un plan de inversion. Suponer que la probabilidad de obtener utilidad en cada una de ellas es de 0.9. Suponiendo que hay independencia,

a) ¿Cuál es la probabilidad de que obtenga utilidad en todas las viviendas?.

b) ¿Cuál es la probabilidad de que no obtenga utilidad en ninguna de las viviendas?.

4. Una nueva técnica quirúrgica tiene una probabilidad p de éxito. Supóngase que la operción se efectua cinco veces y que los resultados son independientes uno de otro.

a) ¿Cuál es la probabilidad de que las cinco operaciones sean exitosas, si p=0.8?

b) ¿Cuál es la probabilidad de que al menos cuatro operaciones sean exitosas, si p=0.6?

c) ¿Cuál es la probabilidad de que menos de dos operaciones sean exitosas, si p=0.8?

Page 31: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

Distribución Poisson

La segunda distribución de probabilidad que consideraremos es la distribución poisson, la cual esta relacionada con la variable “número de eventos aleatorios por unidad de tiempo”.

El número de partículas radiactivas que pasan a través de un contador durante un milisegundo en un experimento de laboratorio.

Número de llamadas que recibe una telefonista en 10 minutos.

Número de accidentes automovilísticos en un cruce en particular durante un periodo de una semana.

Page 32: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

Distribución poisson Función de probabilidad

Media: μ = λt

Varianza: σ2 = λt

,...,, ,k!)(][);( 210

ktekXPtXpkt

151050

0.3

0.2

0.1

0.0

Núm. llam adas

P(X=k)

Page 33: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

EjemploLos clientes en un supermercado se forman en la caja 3 a razón de 4 por minuto. ¿Cuál es la probabilidad de que por lo menos un cliente se forme en dicha cola en cualquier periodo de 30 segundos (1/2 minuto)?.

Solución:Sea X el número de clientes que llegan a la caja 3. Se tiene que el promedio de llegadas por minuto es de λ=4 y, por lo tanto, el promedio de llegadas cada medio minuto es λ t=λ/2=2. Entonces

]0[1]1[1]1[ XPXPXP

865.0!021!01

200

eet t

Page 34: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

Función de probabilidad

0.1353

0.2707 0.2707

0.1804

0.0902

0.0361

0.012 0.0034 0.0009 0.0002

0

0.05

0.1

0.15

0.2

0.25

0.3

P(X=k)

Page 35: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

Ejercicios1. Supongase que el número de muertes por suicidio en Manhattan es un proceso de Poisson con parámetro λ=2 por día. En una semana, ¿Cuál es la probabilidad

a) de que al menos haya 10 muertes en este periodo?

b) de que haya menos de 5 muertes en este periodo?

2. Suponga que el número de llamadas que llegan a un comutador telefónico de una industria es un proceso de Poisson con parámetro λ=120 llamadas por hora.

a) ¿Cuál es la probabilidad de que no se reciban llamadas en un minuto?

b) ¿Cuál es la probabilidad de que lleguen entre 1 y 5 llamadas en un minuto?

Page 36: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

Ejercicios3. Suponer que las ventas que hace un vendedor de autos usados se realiza en la misma forma como ocurren los eventos de un proceso de Poisson con parámetro λ=1 por semana. ¿Cuál es la probabilidad de que haga (exactamente) 3 ventas en un periodo de dos semanas? ¿cuándo menos 3?¿3 a lo más?.

4. El número de errores tipográficos cometidos por una mecanógrafa en particular tiene una distribución de Poisson con una media de cuatro errores por página. Si una página dada tiene más de cuatro errores, la mecanógrafa tendrá que repetir la página entera. ¿Cuál es la probabilidad de que no se tenga que repetir cierta pagina?.

Page 37: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

Distribución normal o de Gauss Aparece de manera natural:

Errores de medida. Distancia de frenado. Altura, peso, propensión al crimen… Distribuciones binomiales con n grande (n>30) y ‘p ni pequeño’ (np>5) ‘ni grande’ (nq>5).

Está caracterizada por dos parámetros: La media, μ, y la desviación típica, σ.

Su función de densidad es:

2

21

21)(

x

exf

Page 38: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

N(μ, σ): Interpretación geométrica Se puede interpretar la media como un factor de traslación.

Y la desviación típica como un factor de escala, grado de dispersión,…

Page 39: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

N(μ, σ): Interpretación probabilista Entre la media y una desviación típica tenemos siempre la misma probabilidad: aprox. 68%

Entre la media y dos desviaciones típicas aprox. 95%

Page 40: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

Algunas características La función de densidad es simétrica, mesocúrtica y

unimodal. Media, mediana y moda coinciden.

Los puntos de inflexión de la fun. de densidad están a distancia σ de μ.

Si tomamos intervalos centrados en μ, y cuyos extremos están… a distancia σ, tenemos probabilidad 68% a distancia 2 σ, tenemos probabilidad 95% a distancia 2.5 σ tenemos probabilidad 99%

Todas las distribuciones normales N(μ, σ), pueden ponerse mediante una traslación μ, y un cambio de escala σ, como N(0,1). Esta distribución especial se llama normal tipificada o normal estandar.. Justifica la técnica de tipificación, cuando

intentamos comparar individuos diferentes obtenidos de sendas poblaciones normales.

Page 41: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

Tipificación o Estandarización. Dada una variable de media μ y desviación típica σ,

se denomina valor tipificado,z, de una observación x, a la distancia (con signo) con respecto a la media, medido en desviaciones típicas, es decir

En el caso de variable X normal, la interpretación es clara: Asigna a todo valor de N(μ, σ), un valor de N(0,1) que deja exáctamente la misma probabilidad por debajo.

Nos permite así comparar entre dos valores de dos distribuciones normales diferentes, para saber cuál de los dos es más extremo.

xz

Page 42: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

Ejemplo Se quiere dar una beca a uno de dos estudiantes de sistemas

educativos diferentes. Se asignará al que tenga mejor aprovechamiento académico.

El estudiante A tiene una calificación de 8 en un sistema donde la calificación de los alumnos se comporta como N(6,1).

El estudiante B tiene una calificación de 80 en un sistema donde la calificación de los alumnos se comporta como N(70,10).

1107080

2168

Bxz

xz

BBB

A

AAA

Solución No podemos comparar directamente 8 puntos de A frente a los 80

de B, pero como ambas poblaciones se comportan de modo normal, podemos tipificar y observar las puntuaciones sobre una distribución de referencia N(0,1)

Como ZA>ZB, podemos decir que el porcentaje de compañeros del mismo sistema de estudios que ha superado en calificación el estudiante A es mayor que el que ha superado B. Podríamos pensar en principio que A es mejor candidato para la beca.

Page 43: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

¿Por qué es importante la distribución normal? Las propiedades que tiene la distribución normal son interesantes, pero todavía no hemos hablado de por qué es una distribución especialmente importante.

La razón es que aunque una v.a. no posea distribución normal, ciertos estadísticos/estimadores calculados sobre muestras elegidas al azar sí que poseen una distribución normal.

Es decir, tengan las distribución que tengan nuestros datos, los “objetos” que resumen la información de una muestra, posiblemente tengan distribución normal (o asociada).

Page 44: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

Veamos aparecer la distribución normal Como ilustración mostramos una variable que presenta valores distribuidos más o menos uniformemente sobre el intervalo 150-190.

Como es de esperar la media es cercana a 170. El histograma no se parece en nada a una distribución normal con la misma media y desviación típica.

Page 45: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

A continuación elegimos aleatoriamente grupos de 10 observaciones de las anteriores y calculamos el promedio.

Para cada grupo de 10 obtenemos entonces una nueva medición, que vamos a llamar promedio muestral.

Observa que las nuevas cantidades están más o menos cerca de la media de la variable original.

Repitamos el proceso un número elevado de veces. En la siguiente transparencia estudiamos la distribución de la nueva variable.

Muestra1ª 2ª 3ª185 190 179174 169 163167 170 167160 159 152172 179 178183 175 183188 159 155178 152 165152 185 185175 152 152

173 169 168 …

Page 46: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

La distribución de los promedios muestrales sí que tiene distribución aproximadamente normal.

La media de esta nueva variable (promedio muestral) es muy parecida a la de la variable original.

Las observaciones de la nueva variable están menos dispersas. Observa el rango. Pero no sólo eso. La desviación típica es aproximadamente ‘raiz de 10’ veces más pequeña. Llamamos error estándar a la desviación típica de esta nueva variable.

Nada de lo anterior es casualidad.

Page 47: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

Teorema central del límite Dada una v.a. cualquiera, si extraemos muestras de

tamaño n, y calculamos los promedios muestrales, entonces:

dichos promedios tienen distribución aproximadamente normal;

La media de los promedios muestrales es la misma que la de la variable original.

La desviación típica de los promedios disminuye en un factor “raíz de n” (error estándar).

Las aproximaciones anteriores se hacen exactas cuando n tiende a infinito.

Este teorema justifica la importancia de la distribución normal.

Sea lo que sea lo que midamos, cuando se promedie sobre una muestra grande (n>30) nos va a aparecer de manera natural la distribución normal.

Page 48: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

Distribuciones asociadas a la normal Cuando queramos hacer inferencia estadística hemos

visto que la distribución normal aparece de forma casi inevitable.

Dependiendo del problema, podemos encontrar otras (asociadas): X2 (chi cuadrado) t- student F-Snedecor

Estas distribuciones resultan directamente de operar con distribuciones normales. Típicamente aparecen como distribuciones de ciertos estadísticos.

Veamos algunas propiedades que tienen (superficialmente). Para más detalles consultad el manual.

Sobre todo nos interesa saber qué valores de dichas distribuciones son “atípicos”. Significación, p-valores,…

Page 49: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

Chi cuadrado Tiene un sólo parámetro

denominado grados de libertad.

La función de densidad es asimétrica positiva. Sólo tienen densidad los valores positivos.

La función de densidad se hace más simétrica incluso casi gausiana cuando aumenta el número de grados de libertad.

Normalmente consideraremos anómalos aquellos valores de la variable de la “cola de la derecha”.

Page 50: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

T de student Tiene un parámetro denominado grados de libertad.

Cuando aumentan los grados de libertad, más se acerca a N(0,1).

Es simétrica con respecto al cero.

Se consideran valores anómalos los que se alejan de cero (positivos o negativos).

Page 51: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas

F de Snedecor Tiene dos parámetros denominados grados de libertad.

Sólo toma valores positivos. Es asimétrica.

Normalmente se consideran valores anómalos los de la cola de la derecha.

Page 52: Modelos probabilisticos

Tema: Modelos probabilísticos

Estadística. Facultad de Matemáticas