Estad ´ ıstica Tema 3: C´alculo de Probabilidades Unidad 4: Algunas Distribuciones Notables de Variables Aleatorias ´ Area de Estad´ ıstica e Investigaci´on Operativa Licesio J. Rodr´ ıguez-Arag´on Noviembre 2010 Contenidos............................................................... 2 Variables Aleatorias Discretas 3 Distribuci´ on Uniforme .................................................... 4 Distribuci´ on de Bernoulli .................................................. 5 Distribuci´ on Binomial .................................................... 6 Distribuci´ on Binomial con R ................................................ 8 Distribuci´ on de Poisson ................................................... 9 Distribuci´ on de Poisson con R.............................................. 11 Variables Aleatorias Continuas 12 Distribuci´ on Uniforme ................................................... 13 Distribuci´ on de Uniforme con R ............................................ 14 Distribuci´ on Exponencial ................................................. 15 Distribuci´ on de Exponencial con R .......................................... 16 Distribuci´ on Normal ..................................................... 17 Distribuci´ on Normal con R ................................................ 18 Distribuci´ on Normal Est´ andar.............................................. 19 Teorema Central del L´ ımite ............................................... 23 Aproximaciones por la Normal ............................................. 24 Distribuci´ on χ 2 n de Pearson ................................................ 26 Distribuci´ on t n de Student ................................................ 30 Distribuci´ on F m,n de Snedecor ............................................. 34 1
29
Embed
Estad stica Area de Estad´ıstica e Investigaci´on Operativa · Distribucion tn de Student ... aproximaciones por la Normal, χ2 de Pearson, t de Student y F de Snedecor. Presentamos
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Estadıstica
Tema 3: Calculo de Probabilidades
Unidad 4: Algunas Distribuciones Notables
de Variables Aleatorias
Area de Estadıstica e Investigacion OperativaLicesio J. Rodrıguez-Aragon
– Uniforme, Exponencial, Normal, aproximaciones por la Normal, χ2 de Pearson, t deStudent y F de Snedecor.
Presentamos en este tema algunas Distribuciones de Variables Aleatorias, primero
discretas y luego contınuas, a continuacion presentaremos su Esperanza y Varianza.
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 2 / 37
Variables Aleatorias Discretas 3 / 37
Distribucion Uniforme
Sea X una variable aleatoria que toma valores x1, x2, . . . , xk con igual probabilidad, entonces laFuncion de Probabilidad de esta Variable Aleatoria Uniforme viene dada por,
f(x; k) = 1/k para x = x1, x2, . . . , xk,
siendo k un parametro de la distribucion de probabilidad.
Su Esperanza y Varianza vienen dadas por las expresiones:
E(X) = µ =k∑
i=1
xif(xi) =k∑
i=1
xi
k.
Var(X) = σ2 =
k∑
i=1
(xi − µ)2
k=
k∑
i=1
x2i
k−(
k∑
i=1
xi
k
)2
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 4 / 37
2
Distribucion de Bernoulli
Daniel Bernoulli (1700-1782). Se conoce como prueba de Bernoulli, todo experimento aleatorio enel que solo son posibles dos resultados, eg. “exito” o “fracaso”. Definamos X como la variablealeatoria que toma el valor 1 con probabilidad p, “exito”, y 0 con probabilidad 1 − p, “fracaso”.
La Funcion de Probabilidad de la Variable Aleatoria X vendra dada por,
f(x; p) = px · (1 − p)1−x , para x = 0, 1.
Su Esperanza y Varianza vienen dadas por las expresiones:
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 5 / 37
3
Distribucion Binomial
Supongamos que realizamos n experimentos de Bernoulli, con probabilidad de “exito” p para cadauno de ellos. Definamos la Variable Aleatoria X como el numero de exitos en esas n ejecucionesdel experimento.La Funcion de Probabilidad es la siguiente:
f(x;n, p) =
(
n
x
)
px(1 − p)n−x , para x = 0, 1, 2, . . . , n,
siendo n y p parametros de la distribucion de probabilidad.
Su Esperanza y Varianza vienen dadas por las expresiones,
+ xlab="Numero de Exitos", ylab="Probabilidad Acumulada",
+ main="Distribucion Binomial: n = 10, p = 0.6", type="l")
> abline(h=0, col="gray")
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 8 / 37
5
Distribucion de Poisson
Simeon Denis Poisson (1781-1840). Una Variable Aleatoria discreta X se dice que es una variablede Poisson si su funcion de probabilidad es de la forma:
f(x;λ) =λxe−λ
x!, para x = 0, 1, 2, . . . ,
siendo λ un parametro positivo.
Su Esperanza y Varianza vienen dadas por las expresiones,
La distribucion de Poisson se presenta en experimentos en los que se estudia la ocurrencia desucesos en un intervalo de tiempo dado. Usualmente para sucesos “raros”, pi <<.
� El numero de vehıculos que pasan a traves de un cierto punto en una ruta durante unperiodo definido de tiempo.
� El numero de errores de ortografıa que uno comete al escribir una unica pagina.
� El numero de llamadas telefonicas en una central telefonica por minuto.
� El numero de servidores web accedidos por minuto.
� El numero de mutaciones de determinada cadena de ADN despues de cierta cantidad deradiacion.
Funcion de Probabilidad y de Distribucion,
0 2 4 6 8 10
0.00
0.05
0.10
0.15
0.20
Distribución Poisson: Media = 3
x
Pro
babi
lidad
0 2 4 6 8 10
0.2
0.4
0.6
0.8
1.0
Distribución Poisson: Media = 3
x
Pro
babi
lidad
Acu
mul
ada
λ = 3
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 9 / 37
6
Distribucion de Poisson
Funcion de Probabilidad y de Distribucion,
0 5 10 15
0.00
0.05
0.10
0.15
Distribución Poisson: Media = 6
x
Pro
babi
lidad
0 5 10 150.
00.
20.
40.
60.
81.
0
Distribución Poisson: Media = 6
x
Pro
babi
lidad
Acu
mul
ada
λ = 6
La distribucion de Poisson aproxima de forma muy acertada a la distribucion Binomial cuandon > 25 y p < .1 y np = λ < 5
0 2 4 6 8 10
0.00
0.05
0.10
0.15
0.20
Distribución Binomial: n = 30, p = 0.1
Número de Exitos
Pro
babi
lidad
0 2 4 6 8 10
0.00
0.05
0.10
0.15
0.20
Distribución Poisson: Media = 3
x
Pro
babi
lidad
f(x;n, p) =
(
n
x
)
px(1 − p)n−x → f(x;λ) =λxe−λ
x!
Para un proceso de Poisson, la probabilidad de obtener exactamente x exitos en n intentos vienedada por el lımite de la distribucion binomial.
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 10 / 37
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 14 / 37
10
Distribucion Exponencial
Una Variable Aleatoria X sigue una distribucion Exponencial si su Funcion de Densidad vienedada por,
f(x;λ) =
λe−λx para x ≥ 0 y λ > 0
0 en el resto.
Su funcion de Distribucion sera,
F (x) =
∫ x
0f(t)dt =
{
0 si x ≤ 0,1 − e−λx para x ≥ 0
Su Esperanza y Varianza vienen dadas por las expresiones,
E(X) = µ =
∫ ∞
0xf(x)dx =
1
λ.
Var(X) = σ2 = E(X2) − E(X)2 = 1/λ2.
La representacon grafica de las Funciones de Densidad y de Distribucion para una Variablealeatoria que siga una distribucion Exponencial de parametro λ = 5,
0.0 0.5 1.0 1.5
01
23
45
Distribución Exponencial: λ = 5
x
Den
sida
d
0.0 0.5 1.0 1.5
0.0
0.2
0.4
0.6
0.8
1.0
Distribución Exponencial: λ = 5
x
Pro
babi
lidad
Acu
mul
ada
La distribucion Exponencial modeliza el tiempo transcurrido entre dos sucesos “raros”consecutivos modelizados por la distribucion de Poisson.
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 15 / 37
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 16 / 37
12
Distribucion Normal
Johann Carl Friedrich Gauss (1777-1855). La Distribucion Normal es clave en multitud defenomenos naturales. Sobre todo destacar la distribucion de errores de medida, que siguen unadistribucion Normal.
Una variable aleatoria X, se dice que sigue una distribucion Normal si su Funcion de Densidad esde la forma,
f(x;µ, σ) =1
σ√
2πexp
{
−(x − µ)2
2σ2
}
,
con −∞ < x < ∞ siendo µ y σ parametros de la distribucion.
En estadıstica esta distribucion se conoce como la “distribucion normal”. Mientras en otroscampos se conoce con el nombre de distribucion Gaussiana o Campana Gaussiana.
Representacion grafica de las funciones de densidad de diferentes N (µ, σ),
−3 −2 −1 0 1 2 3
0.0
0.1
0.2
0.3
0.4
Distribución Normal: µ =−1, 0, 1, σ =1
x
Den
sida
d
µ = −1
µ = 0
µ = 1
−3 −2 −1 0 1 2 3
0.0
0.2
0.4
0.6
0.8
Distribución Normal: µ = 0 , σ = 0.5, 1, 1.5
x
Den
sida
d
σ = 0.5
σ = 1
σ = 1.5
La Esperanza y la Varianza de una variable aleatoria X de distribucion N (µ, σ), sonrespectivamente,
E(X) =
∫ ∞
−∞
xf(x)dx =1
σ√
2π
∫ ∞
−∞
xe
{
−(x−µ)2
2σ2
}
dx =
z = (x − µ)/σ, dx = σdz
=1√2π
∫ ∞
−∞
(µ + σz)e−z2/2dz = µ
Var(X) = E((X − µ)2) =σ2
√2π
∫ ∞
−∞
z2e−z2/2dz =
u = z, dv = ze−z2/2dz
=σ2
√2π
(
[
−ze−z2/2]∞
−∞+
∫ ∞
−∞
e−z2/2dz
)
= σ2(0 + 1) = σ2
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 17 / 37
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 18 / 37
14
Distribucion Normal Estandar
La funcion de Distribucion de una N (µ, σ),
F (x) =1
σ√
2π
∫ x
−∞
exp
{
−(t − µ)2
2σ2
}
dt.
La transformacion Z = (X − µ)/σ nos proporciona valores de una distribucion normal de mediacero y varianza uno, N (0, 1).
−3 −2 −1 0 1 2 3
0.0
0.2
0.4
0.6
0.8
1.0
Distribución Normal: µ = 0, σ = 1
x
Pro
babi
lidad
Acu
mul
ada
Definimos entonces la Funcion de Distribucion de la Normal Estandarizada o Tipificada,
Φ(z) =1√2π
∫ z
−∞
exp
{
− t2
2
}
dt
Esta integral no puede calcularse por metodos ordinarios, debemos acudir a integracion numerica,esta funcion Φ se encuentra recogida en las Tablas de la Normal Tipificada.
De esta forma si X sigue una distribucion N (0, 1), para el calculo de P(a < X < b) podemoshacer uso de las tablas,
P(a < X < b) = Φ(b) − Φ(a).
La “distribucion normal estandar” se obtiene al tomar una distribucion normal con parametrosµ = 0 y σ2 = 1.
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 19 / 37
15
Distribucion Normal Estandar
X ≡ N (0, 1), P(1 < X < 2) = Φ(2) − Φ(1)
−3 −2 −1 0 1 2 3
0.0
0.1
0.2
0.3
0.4
Φ(2)
x
Den
sida
d
−3 −2 −1 0 1 2 3
0.0
0.1
0.2
0.3
0.4
Φ(1)
x
Den
sity
−3 −2 −1 0 1 2 3
0.0
0.1
0.2
0.3
0.4
Φ(2)−Φ(1)
x
Den
sity
P(1 < X < 2) = Φ(2) − Φ(1)
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 20 / 37
16
Distribucion Normal Estandar
Si X sigue una distribucion Normal cualquiera, N (µ, σ), la P(a < X < b) puede calcularserealizando la transformacion, Z = (X − µ)/σ, es decir:
P(a < X < b) = P((a − µ)/σ < Z < (b − µ)/σ) =
= Φ((b − µ)/σ) − Φ((a − µ)/σ).
Una conclusion de la definicion de Φ es que,
Φ(−x) = 1 − Φ(x),
esta relacion es muy util ya que en la mayorıa de las tablas, Φ solo aparece tabulada para valorespositivos de x.
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 21 / 37
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 22 / 37
Teorema Central del Lımite
• Si X1,X2, . . . ,Xn son n variables aleatorias independientes yX = k1 · X1 + k2 · X2 + · · · + kn · Xn, entonces X es otra v.a. de media y varianza:
E(X) =∑
i
kiE(Xi) Var(X) =∑
i
k2i Var(Xi)
Si las Xi son normales, tambien lo sera X.
• Si las v.a. X1, . . . ,Xn, constituyen una muestra de una poblacion de media µ y varianza σ2 yX = 1
n
∑
Xi, es la media muestral:
E(X) =1
n
∑
i
E(Xi) = µ Var(X) =1
n2
∑
i
Var(Xi) =nσ2
n2=
σ2
n
Ademas se tendra que X ≡ N (µ, σ2/n), n > 30.
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 23 / 37
18
Aproximaciones por la Normal
Si X es una variable Binomial, de parametros n y p, entonces si n es grande y ni p ni 1 − p sonproximos a cero:podemos considerar que X sigue aproximadamente una distribucionN (µ = n · p, σ2 = n · p · (1 − p)).
Z =X − n · p
√
n · p · (1 − p)≡ N (0, 1).
25 30 35 40 45 50 55
0.00
0.02
0.04
0.06
0.08
Distribución Binomial: n = 100, p = 0.4
Número de Exitos
Pro
babi
lidad
25 30 35 40 45 50 55
0.00
0.02
0.04
0.06
0.08
Distribución Normal: µ = 40, σ = 4.8989
x
Den
sida
d
Si X es una distribucion de Poisson de parametro λ grande, λ > 25, en la practica se puedeconsiderar que X sigue una distribucion N (µ = λ, σ2 = λ).
Z =X − λ√
λ≡ N (0, 1).
20 30 40 50
0.00
0.01
0.02
0.03
0.04
0.05
0.06
Distribución de Poisson: λ = 36
x
Pro
babi
lidad
20 30 40 50
0.00
0.01
0.02
0.03
0.04
0.05
0.06
Distribución Normal: µ = 36, σ = 6
x
Den
sida
d
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 24 / 37
+ main="Distribucion t Student : n = 1,2,3,4",, type="l")
> abline(h=0, col="gray")
> text(2,.38,"N(0,1)",col="black")
> lines(.x, dt(x, df=1),col="blue")
> text(2,.36,"n = 1",col="blue")
> lines(.x, dt(x, df=2),col="green")
> text(2,.34,"n = 2",col="green")
> lines(.x, dt(x, df=3),col="red")
> text(2,.32,"n = 3",col="red")
> lines(.x, dt(x, df=4),col="pink")
> text(2,.30,"n = 4",col="pink")
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 33 / 37
26
Distribucion Fm,n de Snedecor
George Waddel Snedecor (1881-1974). Sean U y V dos variables independientes distribuidassegun leyes ji-cuadrado de m y n grados de libertad respectivamente, la variable X,
X =U/m
V/n,
se dice que es una variable Fm,n de Snedecor con m y n grados de libertad, en el numerador ydenominador respectivamente.La funcion de densidad viene dada por la expresion,
f(x;m,n) =
(m/n)m/2
β(m2
, n2) · xm/2−1
(1+ mn
x)(m+n)/2 para x > 0 y m,n > 0
0 en el resto.
La Esperanza y la Varianza de una distribucion Fm,n son:
E(X) = µ =n
n − 2, para n > 2, indefinida para otros valores.
Var(X) = σ2 =2n2(m + n − 2)
m(n − 2)2(n − 4), para n > 4, indefinida para otros valores.
0 2 4 6 8
0.0
0.5
1.0
1.5
2.0
Distribución F: m,n
f
Den
sida
d
m=1, n=1
m=2, n=1
m=5, n=2
m=100, n=1
m=100, n=100
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 34 / 37
27
Distribucion Fm,n de Snedecor
Propiedad: Si X ≡ Fm,n entonces 1X ≡ Fn,m.
La Funcion de Distribucon F (x) nos permite saber, dada una variable aleatoria X ≡ Fm,n,
P(X < a) = p =
∫ a
0f(x;m,n)dx.
El calculo de esta integral se encuentra en la Tabla de distribucion Fm,n de Snedecor.
> qf(0.95,df1=3,df2=4)
[1] 6.591382
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 35 / 37
28
Distribucion Fm,n de Snedecor
Mas en concreto la Funcion de Distribucion Inversa: para distintos valores de m,n y de p sepuede buscar en la tabla su cuantil a.
0 1 2 3 4 5 6
0.0
0.1
0.2
0.3
0.4
0.5
F m=5,n=2, P(X<a)=p=F(a)
x
Den
sida
d
p
a
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 36 / 37