1 Introducci´ on al Tema 7 Tema 6. Variables aleatorias unidimensionales Distribuci´ on. Caracter´ ısticas: media, varianza, etc. Transformaciones. V.A. de uso frecuente Tema 7. Modelos probabil´ ısticos discretos Uniforme discreta. Bernoulli, binomial, geom´ etrica y binomial negativa. Hipergeom´ etrica Poisson. Tema 8. Modelos probabil´ ısticos continuos Introducci´ on a la Estad´ ıstica Andr´ es M. Alonso
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
1
Introduccion al Tema 7
Tema 6. Variables aleatorias unidimensionalesDistribucion.
Caracterısticas: media, varianza, etc.
Transformaciones.
V.A. de uso frecuente
Tema 7. Modelos probabilısticos discretosUniforme discreta.Bernoulli, binomial, geometrica y binomial negativa.HipergeometricaPoisson.
Tema 8. Modelos probabilısticos continuos
Introduccion a la Estadıstica Andres M. Alonso
2
Tema 7. Modelos probabilısticos discretos
Los contenidos a desarrollar en este tema son los siguientes:
La distribucion uniforme discreta.
Ensayos de Bernoulli.
Distribuciones binomial, geometrica y binomial negativa.
La distribucion hipergeometrica.
Sucesos raros y la distribucion de Poisson.
Aproximacion a la binomial con p pequeno.
Lecturas recomendadas: Capıtulo 16 del libro de Pena y Romo (1997) y lassecciones 4.5 a 4.7 de Newbold (2001).
Introduccion a la Estadıstica Andres M. Alonso
3
Distribucion uniforme discreta
Una variable aleatoria X se dice que tiene una distribucion uniforme discretasobre n puntos {x1, x2, . . . , xn} si su funcion de probabilidad es:
Pr(X = xi) =1n, para todo i ∈ {1, 2, . . . , n}.
Media: E[X] =∑n
i=1 xi Pr(X = xi) = 1n
∑ni=1 xi = x.
Momento de orden p: E[|X|p] = 1n
∑ni=1 |xi|p.
Varianza: V [X] = E[X2]− E2[X] = 1n
∑ni=1 x2
i − x2 = 1n
∑ni=1(xi − x)2.
I Si {x1, x2, . . . , xn} es a su vez una muestra aleatoria, el proceso de tomarmuestras de la variable X es lo que se conoce en la literatura como bootstrap.
I Como vemos, en ese caso, la variable X reproduce las caracterısticas (media,varianza, momentos) de la muestra original.
Introduccion a la Estadıstica Andres M. Alonso
4
Distribucion uniforme discreta - Ejemplo
Ejemplo 1. Suponga que tiramos una vez un dado no trucado. Defina unavariable aleatoria que modele el resultado de la tirada y diga su funcion demasa, media y varianza.
X = i si en la tirada del dado sale el numero i, con i ∈ {1, 2, 3, 4, 5, 6}.
Pr(X = i) = 1/6, es decir, todos los resultados son igualmente probables.
E[X] = 1+2+3+4+5+66 = 3,5.
V [X] = 12+22+32+42+52+62
6 −3,52 ≈ 2,9167.
Introduccion a la Estadıstica Andres M. Alonso
5
El modelo de Bernoulli
Supongamos que hacemos un experimento simple de lanzar una vez unamoneda sesgada con p = Pr(cruz).
Definimos una variable X como
X ={
1 si sale cruz0 si sale cara
es decir que X = el numero de cruces.
En este caso, se dice que X tiene una distribucion de Bernoulli conparametro ppp.
Una variable con solo dos posibles resultados (cruz / cara, exito / fracaso, . . .)donde se da un valor de 1 en caso de cruz (exito) y 0 en caso de cara (fracaso)tiene una distribucion de Bernoulli. El experimento se llama un ensayo deBernoulli.
Introduccion a la Estadıstica Andres M. Alonso
6
Media y varianza de una variable Bernoulli
Sea X una variable Bernoulli con parametro p:
E[X] = p× 1 + (1− p)× 0
= p
E[X2
]= p× 12 + (1− p)× 02
= p
V [X] = E[X2
]− E[X]2
= p− p2
= p(1− p)
DT [X] =√
p(1− p)
Introduccion a la Estadıstica Andres M. Alonso
7
Ejemplo 2. Se sabe que una maquina produce un 3% de piezas defectuosas.Elegimos una pieza al azar para comprobar si no presenta defectos.
¿Como se distribuye la variable X que vale 1 si la pieza no es defectuosa y 0si es defectuosa?
¿Cuales son su media y su varianza?
X sigue una distribucion Bernoulli con parametro 0,97.
Su media y varianza son
E[X] = ,97
V [X] = ,97× ,03
= ,0291
Ejemplo tomado de Pe~na y Romo (1997).
Introduccion a la Estadıstica Andres M. Alonso
8
Distribucion binomial
Supongamos ahora que se repite un ensayo de Bernoulli n veces de formaindependiente. Por ejemplo, se tira n veces una moneda con p = Pr(cruz), yque se quiere la distribucion de X = el numero de cruces. Esta distribucion sellama la distribucion binomial con parametros n y p.
Definicion 1. Una variable X tiene distribucion binomial con parametrosnnn y ppp si
Pr(X = x) =(
nx
)px(1− p)n−x
para x = 0, 1, . . . , n donde
(nx
)= n!
x!(n−x)!. En este caso, se escribe
X ∼ B(n, p).
Por tanto, la distribucion Bernoulli es el caso especial X ∼ B(1, p).
Introduccion a la Estadıstica Andres M. Alonso
9
Ejemplo 3. La probabilidad de que Ronaldo marque un gol de penalti es 0,8.
¿Cual es la distribucion del numero de goles que marca en los siguientes 6
penaltis? Supuestos
X ∼ B(6, 0,8)
¿Cual es la probabilidad de que marque todos los 6 penaltis?
Pr(X = 6) =(
66
)0,86(1− 0,8)6−6 ≈ ,262
¿Y la probabilidad de que falle por lo menos uno?
Pr(X < 6) = 1− Pr(X = 6) = ,738
Introduccion a la Estadıstica Andres M. Alonso
10
Ejemplo 4. Volviendo al Ejemplo 2, supongamos que se eligen 10 piezas alazar. Si X es el numero de piezas defectuosas, ¿cual es la distribucion de X?
X ∼ B(10, 0,03)
Igualmente, si Y es el numero de piezas buenas,
Y ∼ B(10, 0,97)
¿Cual es la probabilidad de que se encuentre por lo menos una pieza defectuosa?
Pr(X ≥ 1) = 1− Pr(X = 0)
= 1−(
100
)0,030(1− 0,03)10−0
≈ ,263
Introduccion a la Estadıstica Andres M. Alonso
11
Media y varianza de una variable binomial
Teorema 1. Sea X ∼ B(n, p). Entonces,
E[X] = np
V [X] = np(1− p)
DT [X] =√
np(1− p)
Demostracion Propiedades de E[·] y V [·]
Escribimos X = X1 +X2 + . . .+Xn donde cada Xi es un ensayo de Bernoulli.
E[X] = E[X1 + X2 + . . . + Xn]
= E[X1] + . . . + E[Xn] = p + . . . + p = np
V [X] = V [X1 + X2 + . . . + Xn]
= V [X1] + . . . + V [Xn] = np(1− p).
Introduccion a la Estadıstica Andres M. Alonso
12
Ejemplo 5. Volvemos a con el ejemplo de Ronaldo.
El numero medio de goles en 6 penaltis es
E[X] = 6× 0,8 = 4,8
La desviacion tıpica es
DT [X] =√
6× 0,8× 0,2 ≈ 0,98.
Ejemplo 6. El numero medio de piezas defectuosas en una muestra de 10 es
10× 0,03 = 0,3
La desviacion tıpica es √10× 0,03× 0,97 ≈ 0,54.
Introduccion a la Estadıstica Andres M. Alonso
13
Uso de tablas de la distribucion binomial
Calcular directamente probabilidades binomiales a traves de la formula puedeser trabajoso. Mas facil es usar tablas de la distribucion binomial.
En Pena y Romo (1997), se proporcionan tablas de las probabilidades de kexitos en una distribucion binomial con n ensayos y probabilidad p de exito:
Ejemplo 7. Sea X ∼ B(15, 0,2). Hallar Pr(X = 3) y Pr(X ≤ 3).
Pr(X = 3) = 0,2501
Pr(X ≤ 3) =∑3
x=0Pr(X = x)
= ,0352 + ,1319 + ,2309 + ,2501
= ,6481
I Estas tablas solo consideran el caso p ≤ 0,5. ¿Que hacemos si p > 0,5?
Introduccion a la Estadıstica Andres M. Alonso
14
Distribucion geometrica
Hemos visto que si se tira una moneda (con p = Pr(cruz)) n veces, entoncesel numero de cruces se distribuye como binomial.
Consideramos otro experimento relacionado. Vamos a seguir tirando la monedahasta que veamos la primera cruz ¿Cuantas tiradas necesitamos?
Sea X el numero de tiradas.
Pr(X = 1) = p
Pr(X = 2) = (1− p)p
Pr(X = 3) = (1− p)2p... = ...
Pr(X = x) = (1− p)x−1p
La distribucion de X se llama la distribucion geometrica.
Introduccion a la Estadıstica Andres M. Alonso
15
Definicion 2. Una variable X tiene una distribucion geometrica conparametro ppp si
Pr(X = x) = (1− p)x−1p para x = 1, 2, . . .
En este caso, se escribe X ∼ G(p).
Teorema 2. Si X ∼ G(p), entonces
E[X] =1p,
V [X] =1− p
p2y
DT [X] =√
1− p
p2.
Introduccion a la Estadıstica Andres M. Alonso
16
Ejemplo 8. Volvemos al Ejemplo 3. Supongamos que Ronaldo esta ensayandotiros de penalti y que dejara de ensayar cuando marque por primera vez.
¿Cual es la probabilidad de que Ronaldo marque por primera vez en su quintopenalti?
Sea X el numero de penaltis que necesita para marcar su primer gol, suponemosque X ∼ G(0,8).
Pr(X = 5) = 0,24 × 0,8 = ,00128
¿Cual es el numero esperado de penaltis que necesita para marcar?
La esperanza de X es 1/0,8 = 1,2 penaltis.
Se ira pronto a casa ...
Introduccion a la Estadıstica Andres M. Alonso
17
Ejemplo 9. En el Ejemplo 2, supongamos que se inspeccionaran piezas hastaencontrar la primera pieza defectuosa. ¿Cual es la probabilidad de que senecesiten inspeccionar 4 o menos piezas para encontrar la primera piezadefectuosa?
Sea Y el numero de inspecciones necesarias, suponemos que Y ∼ G(0,03).
Pr(Y ≤ 4) =4∑
y=1
Pr(Y = y)
=4∑
y=1
0,97y × 0,03
≈ 0,115
¿Cual es el numero esperado de inspecciones necesarias?
El numero esperado de inspecciones necesarias es 1/0,03 = 33.3.
Introduccion a la Estadıstica Andres M. Alonso
18
Ejemplo 10. (Junio de 2003) Andres y Pedro se plantean el siguiente juego:se lanza al aire un dado equilibrado con seis caras numeradas de uno a seis. Seconsidera que el jugador gana cuando el resultado del dado es cuatro o seis, yrecibe diez euros. En otro caso, no recibe nada. Cada apuesta (un lanzamiento)es de cinco euros.
1) Si Andres juega en cinco ocasiones, ¿cual es la probabilidad de que aciertea lo sumo una vez?
2) ¿Cual es el numero medio de aciertos en esas cinco ocasiones?
3) Pedro jugara tantas veces como sea necesario hasta conseguir acertar unavez. Calcular la probabilidad de que tenga que jugar al menos tres veces.Obtener el numero medio de veces que tiene que jugar para conseguir suobjetivo.
4) ¿Cual sera el beneficio medio obtenido por cada jugador?
El numero medio de jugadas necesarias es 11/3 = 3.
Introduccion a la Estadıstica Andres M. Alonso
20
4) El beneficio medio de Andres serıa
E[10X] − 5× 5 = 10× 53− 25 = −25
3
es decir que en promedio, Andres pierde 8,33 euros.
El beneficio medio de Pedro es
10− E[5Y ] = 10 − 5× 3 = −5
y entonces, en promedio, Pedro pierde 5 euros.
I La estrategia de Pedro es mejor, en promedio, que la de Andres.
Introduccion a la Estadıstica Andres M. Alonso
21
Distribucion binomial negativa
Hemos visto que si se tira n veces una moneda con p = Pr(cruz), entonces elnumero de cruces se distribuye como una binomial.
Consideramos otro experimento relacionado. Vamos a seguir tirando la monedahasta que obtengamos exactamente n cruces. ¿Cuantas caras (fallos) seobservan?
Sea X el numero de fallos. Para que X = x se necesita que:
En las primeras x + n− 1 tiradas haya exactamente n− 1 exitos.
La n-esima tirada sea un exito.
La variable X sigue una distribucion binomial negativa.
Introduccion a la Estadıstica Andres M. Alonso
22
Definicion 3. Una variable X tiene una distribucion binomial negativa conparametros ppp y nnn si
Pr(X = x) =(
n + x− 1n− 1
)pn(1− p)x para x = 0, 1, 2, . . .
En este caso, se escribe X ∼ BN(p, n).
Teorema 3. Si X ∼ BN(p, n), entonces
E[X] =n(1− p)
p,
V [X] =n(1− p)
p2y
DT [X] =
√n(1− p)
p2.
Introduccion a la Estadıstica Andres M. Alonso
23
Ejemplo 11. Volvemos al Ejemplo 3. Supongamos que Ronaldo esta ensayan-do tiros de penalti y que dejara de ensayar cuando marque 20 veces. ¿Cual esel numero esperado de tiros que fallara antes de irse a casa?
Sea X es el numero de fallos, suponemos que X ∼ BN(0,8, 20). La esperanzade X es 20(1− 0,8)
0,81/0,8 = 5 penaltis.
¿Cual es la probabilidad de que Ronaldo tire exactamente 25 veces?
Pr(X = 5) =(
20 + 5− 120− 1
)0,820(1− 0,8)5 = 0,1568.
¿Cual es la probabilidad de que falle mas de 5 veces?
Supongamos que tenemos una poblacion de N individuos, D poseen unacaracterıstica dada (por ejemplo, estan empleados) y N −D no la poseen(desempleados).
Consideremos el experimento de obtener una muestra simultanea de nindividuos.
Equivalentemente, podemos ir extrayendo la muestra uno a uno hastatener los n individuos pero no “devolvemos” los individuos a la poblacion:Muestreo sin reemplazamiento.
Denotamos por X el numero de individuos que poseen la caracterıstica deinteres en la muestra de n.
La variable X sigue una distribucion hipergeometrica.
Introduccion a la Estadıstica Andres M. Alonso
25
Definicion 4. Una variable X tiene una distribucion hipergeometrica conparametros NNN , DDD y nnn si
Pr(X = x) =
(Dx
) (N −Dn− x
)(
Nn
) ,
con max(0, n−N + D) ≤ x ≤ mın(D,n).
Teorema 4. Si X ∼ HG(N,D, n), entonces
E[X] =Dn
N, y V [X] =
D(N −D)n(N − n)N2(N − 1)
.
I Si llamamos p = DN , entonces E[X] = np y V [X] = np(1− p)N−n
N−1
I ¿Que nos recuerda el lımite N →∞ de E[X] y V [X]?
I ¿Que distribucion aproxima a la HG(N,D, n) cuando N →∞ y D/N → p?
Introduccion a la Estadıstica Andres M. Alonso
26
Ejemplo 12. En estudio sobre la relacion entre el nivel de estudio y paro, serealiza una encuesta de 100 personas (sin reemplazamiento) en una comunidadcon 10000 personas en edad laboral y una tasa de paro del 5%. Sea X elnumero de personas encuestadas que estan en paro.
a) Proponga una distribucion para X y diga su funcion de masa, media yvarianza.
b) Calcule la probabilidad de obtener exactamente 5 personas en paro.
a) X ∼ HG(10000, 500, 100) cuya media es 5 y la varianza es 4,7030
b)
Pr(X = 5) =
(5005
) (950095
)(
10000100
) = 0,1809.
Si, “incorrectamente” hubiesemos utilizado una B(n = 100, p = 0,05) losresultados habrıan sido: Media = 5, Varianza = 4.7500, Pr(X = 5) = 0,1800.
Introduccion a la Estadıstica Andres M. Alonso
27
Sucesos raros y la distribucion de Poisson
La distribucion del numero de “sucesos raros” (llamadas de telefono, emisionesde partıculas radioactivos, accidentes de trafico, numero de erratas) que ocurrenen un periodo fijo del tiempo (una hora, un segundo, un ano, una pagina) esla llamada distribucion Poisson.
Definicion 5. Una variable X tiene distribucion Poisson con parametro λλλsi
Pr(X = x) =λxe−λ
x!para x = 0, 1, 2, . . .
En este caso, se escribe X ∼ Poisson(λ).
Teorema 5. Si X ∼ Poisson(λ), entonces
E[X] = λ, V [X] = λ y DT [X] =√
λ.
Introduccion a la Estadıstica Andres M. Alonso
28
Ejemplo 13. El numero medio de erratas por transparencia es 0,2. ¿Cual esla probabilidad de que en una transparencia no haya erratas?
Sea X el numero de erratas. Supondremos que X ∼ Poisson(0,2)
Pr(X = 0) =0,20e−0,2
0!= e−0,2 ≈ 0,8187
¿Y la probabilidad de que haya 2 o mas erratas?
Pr(X ≥ 2) = 1− Pr(X < 2)
= 1− Pr(X = 0)− Pr(X = 1)
= 1−(
0,20e−0,2
0!+
0,21e−0,2
1!
)≈ 1− (0,8187 + 0,1637) = 0,0176.
Introduccion a la Estadıstica Andres M. Alonso
29
Teorema 6. Si X ∼ Pr(λ) es el numero de sucesos raros en una unidad detiempo e Y representa el numero de sucesos raros en un tiempo t, entonces
Y ∼ Pr(tλ).
Ejemplo 14. En promedio, hay 50 incendios serios cada ano en una localidad
a) ¿Cual es la probabilidad de que no haya ningun incendio manana?
El numero medio de incendios serios al t = ano es 50.
El numero medio de incendios serios en un dıa es 50365 ≈ 0,137, y si suponemos
que el numero de incendios es Poisson(0,137) tenemos que la probabilidad decero incendios manana es
0,1370e−0,137
0!≈ 0,872.
b) Dada la suposicion anterior, ¿cual es la distribucion del numero de incendiosen un ano?
Poisson(365× 0,137) = Poisson(50).
Introduccion a la Estadıstica Andres M. Alonso
30
Ejemplo 15. Volvemos al Ejemplo 13. Este tema tiene 40 transparencias
¿Cual es el numero medio de erratas en el tema?
Sea Y el numero de erratas en el tema. Si X ∼ Poisson(0,2), entoncesY ∼ Poisson(40× 0,2) y E[Y ] = 8.
¿Cual es la probabilidad de que el tema contengan por lo menos una errata?
Pr(Y > 0) = 1− Pr(Y = 0)
= 1− 80e−8
0!≈ 1− 0,00034 = 0,99966
Ejercicio importante: Detectarla(s) antes del examen.
Introduccion a la Estadıstica Andres M. Alonso
31
Tablas de la distribucion Poisson
Igual que con la distribucion binomial, en el libro de Pena y Romo (1997) haytablas de la distribucion Poisson para varios valores de λ.
Ejemplo 16. Si X ∼ Poisson(3). Hallar Pr(X = 2) y Pr(X ≥ 2).
Pr(X = 2) = 0,2240
Pr(X ≥ 2) = 1− Pr(X < 2)
= 1− Pr(X = 0)− Pr(X = 1)
= 1− 0,0498− 0,1494
= 0,8008
Excel: POISSON(x;media;acumulado)
Introduccion a la Estadıstica Andres M. Alonso
32
Aproximacion de la distribucion binomial mediante ladistribucion Poisson
Sea X ∼ B(n, p) donde p es pequena y n es grande. Llamemos λ = np,
Pr(X = x) =(
nx
)px(1− p)n−x =
n!(n− x)!x!
(λ
n
)x (1− λ
n
)n−x
=n(n− 1) . . . (n− x + 1)
nx
λx
x!
(1− λ
n
)n−x
=n
n
(n− 1)n
. . .(n− x + 1)
n
λx
x!
(1− λ
n
)n−x
≈ λx
x!e−λ.
El resultado implica que para n grande (n > 50) y p pequeno, (p < 0,1) en-tonces se pueden aproximar probabilidades binomiales a traves de la distribucionPoisson.
Introduccion a la Estadıstica Andres M. Alonso
33
Aproximacion de la distribucion binomial mediante ladistribucion Poisson