Top Banner
Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015 1 Estadística I Bloque II GRADO EN ADIMINISTRACIÓN Y DIRECCIÓN DE EMPRESAS Variable aleatoria y Modelos probabilísticos Tema 5: VARIABLE ALEATORIA 5.1. Introducción 5.2. Concepto de variable aleatoria. Características 5.3. Distribuciones bidimensionales, marginales y condicionadas 5.4. Independencia estocástica
59

Variable aleatoria y Modelos probabilísticos

May 13, 2023

Download

Documents

Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

1

Estadística I

Bloque II

GRADO EN

ADIMINISTRACIÓN Y DIRECCIÓN DE

EMPRESAS

Variable aleatoria y Modelos probabilísticos

Tema 5: VARIABLE ALEATORIA

5.1. Introducción

5.2. Concepto de variable aleatoria. Características

5.3. Distribuciones bidimensionales, marginales y condicionadas

5.4. Independencia estocástica

Page 2: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

2

Tema 5 VARIABLE ALEATORIA 5.1. INTRODUCCIÓN La variable aleatoria es la herramienta matemática que permite pasar del estudio de sucesos aislados al estudio de las distribuciones de probabilidad y, por lo tanto, es también la responsable de la aplicación del análisis matemático y de otras herramientas matemáticas a la Estadística. De hecho, el concepto de variable aleatoria constituye una pieza básica para el desarrollo de los métodos y técnicas inferenciales. Trabajar con resultados numéricos permite hacer uso de desarrollos matemáticos. De ahí el interés de buscar reglas que hagan posible pasar de un espacio muestral original, E, de resultados posibles no numéricos, a un nuevo espacio muestral inducido, cuyos resultados o elementos van a ser números. Este paso o transformación se realiza mediante la función llamada variable aleatoria, que representamos por X. 5.2. CONCEPTO DE VARIABLE ALEATORIA. CARACTERÍSTICAS Como punto de partida, consideremos el experimento aleatorio ξ consistente en lanzar dos monedas al aire. Su espacio muestral vendrá dado por:

{ }, , , .E cc ck kc kk=

Entendemos que sobre ese espacio muestral se ha definido un álgebra de sucesos A y una probabilidad P, de manera que el triple ( )A, , ,E P esto es, el espacio probabilístico, caracteriza de manera completa al experimento aleatorio. Supongamos ahora que lo único que nos interesa de los resultados del experimento ξ es el número de caras obtenido. En tal caso, el conjunto de resultados vendrá dado por { }0,1,2 , un nuevo espacio muestral cuyos elementos son números reales. De esta manera, los resultados cualitativos del experimento se han transformado en números reales por el simple cómputo de caras en los elementos de E. Pues bien, acabamos de definir una variable aleatoria, llamémosla X. Se dice que es aleatoria porque toma sus valores en función del azar que caracteriza al experimento aleatorio .ξ Nuestro interés respecto a los experimentos aleatorios es medir la incertidumbre asociada a sus resultados. Parece lógico pues preguntarse cosas como cuál es la probabilidad de que X tome el valor 0 ó que alcance cómo máximo el valor 1. Pero, no podemos utilizar nuestra medida original de incertidumbre P, ya que ésta fue definida sobre el espacio probabilizable

Page 3: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

3

original ( ), .AE Necesitamos definir un nuevo espacio probabilizable sobre el cuerpo de los

números reales, que llamaremos ( )B, y una nueva medida de probabilidad XP que se infiera de P por la propia definición de X. Es decir, debemos pasar del espacio probabilístico ( ), ,AE P al espacio probabilístico inducido ( )B ., , XP Veámoslo con más detalle. 5.2.1. Concepto de variable aleatoria Retomemos el experimento consistente en el lanzamiento de dos monedas al aire. Su espacio muestral es { } { }1 2 3 4, , , , , , .E e e e e cc ck kc kk= = Supongamos que tenemos caracterizado

completamente dicho experimento mediante el triple ( ), , .AE P Definamos ahora la variable X como “número de caras al lanzar dos monedas al aire”. Lo que hemos generado es una variable aleatoria. Hemos creado una regla que asigna números reales a cada elemento del espacio muestral E. En definitiva, nuestra variable X es, en realidad, una función real que tiene como dominio el conjunto E y como conjunto imagen, . Pero no se trata de una función real de variable real, las que estamos habituados a manejar, puesto que el conjunto origen es E y este conjunto no está incluido en . 1 Es una función de conjunto. Al conjunto de valores de asignados a los elementos de E se le llama recorrido de la variable aleatoria y lo representamos por ( ).X E En nuestro ejemplo, el recorrido de la variable aleatoria X viene dado por { } { }1 2 3( ) , , 0,1, 2X E x x x= = ⊂ puesto que ( ) 0,X kk =

( ) 1,X ck = ( ) 1X kc = y ( ) 2.X cc = Gráficamente:

Figura 4.1 Variable aleatoria como función real

Si recorremos las flechas que aparecen en el anterior diagrama en sentido contrario al indicado podemos obtener las antiimagenes de cada uno de los valores que toma X. Así

( ) { }1 0 ,X kk− = ( ) { } { }1 1X ck kc− = y ( ) { }1 2 .X cc− = Al hacer esto observamos que las antiimagenes son sucesos pertenecientes al álgebra original A. Esta propiedad exhibida por la función X recibe el nombre de medibilidad. 1 Se dice que una función es función real si, cualquiera que sea su dominio, el conjunto imagen de la función está

contenido en el conjunto de los número reales . Se dice que es función real de variable real si también el dominio de la función está incluido en .

=1e cc

=2e ck

=3e kc

=4e kk

12 x=

21 x=

30 x=

E

Page 4: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

4

Que nuestra función real X sea medible resulta crucial para conseguir el objetivo que perseguimos al definirla, esto es, calcular la probabilidad de que X tome determinados valores (probabilidad inducida). Es precisamente esta propiedad la que lo permite. Así, las probabilidades de que X tome los valores 0, 1 ó 2 vendrán dadas por:

( ) { }( ) 104XP P kk= = ( ) { } { }( ) 1 1 11

4 4 2XP P ck kc= = + = ( ) { }( ) 12 .4XP P cc= =

mientras que la probabilidad de que, por ejemplo, X sea menor o igual que 1 será:

( ) { } { } { }( ) 31 .4XP X P kk ck kc≤ = =

Fijémonos bien en las expresiones anteriores. Aparecen dos probabilidades, P y .XP La probabilidad P ya sabemos lo que es. Es la función de conjunto definida sobre el espacio probabilizable ( ), ,AE nuestro espacio probabilizable original. Pero, ¿qué es ?XP Antes de proseguir recapitulemos. Hemos tomado como ejemplo el experimento aleatorio consistente en el lanzamiento de dos monedas y hemos establecido una regla (el cómputo de las caras) que nos permite transformar los elementos del espacio muestral E en elementos del conjunto de los números reales. Vemos, además, que a cada resultado e de E le hemos hecho corresponder uno y sólo un número x de , de manera que nuestra regla cumple los requisitos exigibles a una función real. Por tanto, una variable aleatoria es una función real, que asocia un valor numérico a cada evento del espacio muestral asociado a un cierto experimento aleatorio. La peculiaridad de la variable aleatoria como función radica en el espacio sobre el que está definida, es decir, su dominio. Las funciones matemáticas a las que estamos acostumbrados, del tipo y=f(x), tienen como dominio el conjunto o un subconjunto del mismo. El conjunto y sus subconjuntos son espacios métricos en los que existen distancias entre puntos y la propia función consiste en una aplicación que a cada punto del dominio le hace corresponder un número. Las variables aleatorias, sin embargo, no tienen como dominio espacios métricos de este tipo y ésta es una diferencia radical. Su espacio natural es un espacio probabilístico, que recordemos de nuevo que está formado por un conjunto en la acepción más general de la palabra (el espacio muestral), junto con sus elementos y subconjuntos (el álgebra), más una probabilidad definida en su seno. Si hemos definido una variable aleatoria X es porque estamos interesados en conocer la probabilidad de que tome determinados valores. Pero para esto no nos sirve la probabilidad P original, puesto que esta asigna probabilidades a los sucesos del álgebraσ − A, esto es, está definida sobre el espacio probabilizable ( ), .AE En el ejemplo del lanzamiento de dos monedas al aire, la variable aleatoria que hemos definido toma los valores reales 0, 1 y 2, que están contenidos en el conjunto de los números reales y no en E. En general, una variable aleatoria podría tomar cualquier valor contenido en . Dicho de otra manera, el espacio muestral inducido por la definición de una variable aleatoria es el conjunto , o un subconjunto del mismo.

Page 5: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

5

Por tanto, ahora necesitaremos definir una álgebraσ − sobre para poder tener un espacio probabilizable y definir una probabilidad sobre él. Lo único que nos falta para tener el panorama completo es dotar a de un álgebra.σ − Los conjuntos de números reales más usuales son los intervalos, por ello se define el conjunto { }( , ], ,B a a= −∞ ∀ ∈ y se considera el menor de todos los álgebrasσ − que contienen a este conjunto B. A este álgebraσ − se le denomina álgebra de B l,oreσ − se denota por ,B y a sus elementos se le denominan borelianos. Casi cualquier cosa incluida en que podamos imaginar es un boreliano: los intervalos lo son, sean abiertos o cerrados, los puntos aislados también lo son y las uniones o intersecciones finitas o infinitas numerables de ellos, que son operaciones permitidas en las

álgebras.σ − Ya podemos proporcionar una definición formal de variable aleatoria: Una variable aleatoria es una función medible de un espacio probabilístico ( ), ,AE P en el

espacio probabilizable ( ), ,B donde B es el álgebra de Borelσ − definida en . Una función se dice medible cuando se cumple que:

1: ( )B AB X B−∀ ∈ ∈ donde { }1( ) / ( ) .X B e E X e B− = ∈ ∈ Esta condición (medibilidad) quiere decir que la antiimagen de todo subconjunto B de que sea elemento del álgebra de Borel B es un subconjunto de E, que es a su vez elemento de .A Por tanto, la definición de variable aleatoria implica que todo boreliano tiene un subconjunto medible en el espacio probabilístico original, del cual es imagen. Esto permite trasladar las probabilidades del espacio probabilístico ( ), ,AE P al espacio ( ), .B Así, en virtud de la condición de medibilidad de X, podemos considerar ahora una probabilidad inducida en , que llamamos .XP En efecto, si B es un boreliano de , tenemos la probabilidad inducida indicada por la siguiente igualdad:

( ) ( )( )1XP B P X B−=

La probabilidad original es P, y está definida en el espacio probabilístico original ( ), , ;AE P

la probabilidad inducida XP está definida sobre el espacio probabilizable ( ), B y se induce de la probabilidad P. De esta manera, conseguimos un espacio probabilístico inducido ( )B ,, , XP que se deriva de la definición de variable aleatoria, y que, como veremos seguidamente, resulta más agradable de tratar matemáticamente. Téngase en cuenta que a veces las variables aleatorias están ya implícitas en los elementos del espacio muestral original. Esto ocurre así cuando el resultado del experimento aleatorio es numérico. Por ejemplo, si el experimento consiste en observar el tiempo de espera hasta la llegada de un autobús o los ingresos anuales de un trabajador asalariado elegido al azar. En otros casos, en un mismo experimento aleatorio podemos definir diferentes variables aleatorias. Por ejemplo, al lanzar dos monedas al aire podemos asignar a cada suceso la

Page 6: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

6

variable “número de caras”, pero también el “número de cruces”. En ningún caso debe confundirse el experimento con la variable aleatoria, ni el espacio muestral del experimento con el conjunto de valores que toma la variable. Tipos de variables aleatorias: Atendiendo a la naturaleza de su recorrido, X(E), suele ser habitual clasificar las variables aleatorias en:

a) Discretas: Se dice que X es una variable aleatoria discreta cuando sólo toma un número finito de valores reales o un número infinito, pero numerable. Ejemplos: número de piezas defectuosas que aparecen en un proceso de fabricación, número de llamadas telefónicas que se reciben en una centralita durante un determinado período de tiempo, número de depósitos efectuados al día en una entidad bancaria, etc.

b) Continuas: Pueden tomar un número infinito no numerable de valores. Una variable

aleatoria es continua cuando puede tomar todos los posibles valores del conjunto de los números reales ( )x−∞ < < ∞ o de un subconjunto de él, definido por un intervalo ( )0 .kl x l≤ ≤ Ejemplos: tiempo en minutos que dedica un alumno a hacer un

examen cuya duración máxima es de dos horas ( )0 120 ,x≤ ≤ cantidad de agua caída

al día en un determinado punto geográfico ( )0 .x ≥ Al definir una variable aleatoria lo que perseguimos en última instancia es hacer que el cálculo de probabilidades sea matemáticamente más “agradable”. Pero aún no lo hemos conseguido del todo. Estamos habituados a manejar funciones reales de variable real, del tipo y=f(x), pero nuestra probabilidad inducida XP sigue siendo una función de conjunto, como lo era P ya que su dominio está formado no sólo por números sino también por intervalos. El siguiente paso debe ser definir funciones reales de variable real que proporcionen probabilidades para nuestra variable aleatoria. Estas funciones reciben el nombre de distribución de probabilidad y función de distribución. Veamos, a continuación, como se definen y su utilidad, particularizando para el caso de variables discretas y continuas. 5.2.2. Distribución de probabilidad de variables aleatorias discretas

Si X es una variable aleatoria discreta con recorrido { }1 2( ) , , , ,kX E x x x= su distribución de probabilidad puede escribirse como:

( ) ( ) para 1, 2,...,i i if x P X x p i k= = = = Esta ya es una función real de variable real, de esas que estamos acostumbrados a manejar puesto que su dominio está formado por puntos (números singulares) de la recta real. Recibe el nombre específico de función de cuantía, debido a que proporciona la cantidad de probabilidad que corresponde a cada valor de la variable aleatoria discreta X.

Page 7: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

7

Las dos propiedades que debe cumplir una función real de variable real para ser función de cuantía son:

(1) ( ) 0if x ≥ para 1, 2,...,i k=

(2) 1

( ) 1.i k

ii

f x=

=

=∑

Como vemos, la primera condición establece simplemente que las probabilidades no pueden ser negativas. La segunda condición nos dice que la suma de toda la masa de probabilidad debe ser igual a la unidad. Una función de cuantía puede expresarse de tres maneras distintas: 1) Mediante una tabla en la que se recojan los pares ( , ).i ix p 2) Mediante una expresión matemática del tipo f(x). 3) Mediante una gráfica: La representación gráfica de la función de cuantía se lleva a cabo

mediante un diagrama de barras (equivale a la distribución de frecuencias relativas para datos no agrupados) en el que la suma de las alturas de las barras debe ser igual a la unidad.

Normalmente se utiliza más la expresión matemática por ofrecer más posibilidades de estudio (mayor manejabilidad) que la simple enumeración de probabilidades o la representación gráfica. Ejemplo 1:

La función: 0,1 1,2,3,4

( )0 en el resto

x xf x

==

es una función de cuantía, puesto que cumple las dos propiedades que le son exigibles. Su representación en forma de tabla y gráfica son las siguientes:

Tabla 4.1

Ejemplo 1 de función de cuantía (tabla)

ix ( )if x 1 0,1 2 0,2 3 0,3 4 0,4 1,0

Figura 4.2

Ejemplo 1 de función de cuantía (Representación gráfica)

Page 8: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

8

Ejemplo 2: La variable X definida como el número de caras en el lanzamiento de dos monedas es una variable aleatoria discreta. La representación en forma de tabla de su distribución de probabilidad es:

Tabla 4.2 Ejemplo 2 de función de cuantía

(tabla) x f(x)

0 14

1 12

2 14

1 Puede comprobarse que su forma funcional es:

22! 1 1( )

!(2 )! 2 2

x x

f xx x

− = −

para 0,1,2x =

Como veremos en la lección siguiente, esta forma funcional recibe el nombre específico de función de cuantía binomial. Su representación gráfica es:

Figura 4.3

Ejemplo 2 de función de cuantía (Representación gráfica)

0

0.1

0.2

0.3

0.4

0.5

0.6

-1 0 1 2

f(x)

x

Page 9: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

9

5.2.3. Distribución de probabilidad de variables aleatorias continuas En el caso de variables aleatorias continuas, la distribución de probabilidad no puede darse para valores puntuales de la variable dado que ésta toma infinitos valores distintos para un subconjunto cualquiera de la recta real. En este caso, resulta necesario agrupar los valores de la variable en intervalos exhaustivos y mutuamente excluyentes.2 A cada intervalo se le asignará una probabilidad y su representación gráfica será, ahora, un histograma en el que colocaremos las alturas hi en el eje de ordenadas.3 En ese histograma, el área de cada rectángulo que tiene por base un intervalo específico será la probabilidad de que la variable tome valores en ese intervalo. Al aumentar el número de intervalos y, por tanto, haciendo la amplitud de los mismos cada vez más pequeña, entonces resultará que, en el límite, el perfil de ese histograma será el de una línea continua bajo la cual se encierra toda la masa de probabilidad (figura 4.4). A esa línea continua que nos da las ordenadas del histograma límite se le llama función de densidad de una variable aleatoria continua. Ahora esa función f(x) no proporciona directamente probabilidades, sino densidades de probabilidad, si bien el área bajo esa función es igual a la unidad. Las densidades de probabilidad se interpretan, por tanto, como los límites a los que tienden las densidades de frecuencia (hi) vistas en Estadística Descriptiva, cuando la amplitud de los intervalos tiende a cero.

Figura 4.4 Función de densidad como límite del histograma

0

10

20

30

40

50

60

0 4 8 12 16 20 24 28 32 36 40

f(x)

x

La función de densidad de cualquier variable aleatoria continua debe satisfacer las siguientes propiedades o condiciones: 1) ( ) 0 -f x x≥ ∞ < < +∞

2) -

( ) 1f x dx+∞

=∫ , lo que implica que el área bajo la curva y por encima del eje de abscisas es

igual a la unidad.

2 Cualquier valor de la variable aleatoria debe estar recogido en un intervalo (intervalos exhaustivos) y sólo uno (intervalos

excluyentes). 3 Recordemos que en Estadística Descriptiva, la distribución de frecuencias de variables continuas se representaba mediante

un histograma.

Page 10: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

10

Si la función de densidad no proporciona probabilidades sino densidades de probabilidad, ¿cómo podemos, a partir de ella, obtener probabilidades? ¿Cómo calcular la probabilidad de que la variable aleatoria X tome valores dentro de un determinado intervalo? Este cálculo se llevará a cabo integrando f(x) para el intervalo de valores considerado. La probabilidad será igual al área S bajo la curva entre los límites de integración (véase también figura 4.5):

( ) ( )b

a

P a X b f x dx≤ ≤ = ∫

Figura 4.5

Cálculo de probabilidad sobre una función de densidad ( )P a X b≤ ≤

0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

3.5

f(x)

x

Es importante tener en cuenta que la probabilidad de que una variable aleatoria continua tome un valor concreto es siempre cero:

( ) ( ) 0.i

i

x

ix

P X x f x dx= = =∫

Obsérvese que con esa integral se está calculando el área de un segmento, y que ésta es siempre igual a cero. Lo podemos entender también si se aplica la Regla de Laplace para el cálculo de esa probabilidad: hay infinitos casos posibles (por ser continua la variable aleatoria) y uno sólo favorable (el valor concreto ix en cuya probabilidad estamos interesados). Debemos insistir en que la función de densidad de una variable aleatoria continua no da directamente probabilidades, sino densidades de probabilidad, por lo que la sustitución de un determinado valor en la misma no proporciona la probabilidad de que la variable tome ese valor. Esta probabilidad es siempre igual a cero. Esto nos lleva a que, para este tipo de variables, se cumplan las siguientes igualdades:

( ) ( ) ( ) ( ) ( ) .b

a

P a X b P a X b P a X b P a X b f x dx≤ ≤ = ≤ < = < ≤ = < < = ∫

a

( ) ( )b

a

S P a X b f x dx= ≤ ≤ = ∫

S

b

Page 11: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

11

Luego el hecho de escribir un intervalo en forma abierta, cerrada o semiabierta no afecta al cálculo de la integral definida ni, por tanto, a la probabilidad. Ejemplo: Sea X una variable aleatoria continua cuya función de densidad es la siguiente:

0 '1 0 20( )0 en el resto

x xf x < <=

Se pide: a) Compruebe que es una función de densidad. b) Obtenga la probabilidad de que X tome valores comprendidos entre 1 y 3. Resolución: a) Tenemos que comprobar que cumple las dos condiciones para ser función de densidad:

1) ( ) 0,1 0 con 0 20.f x x x= ≥ < <

2) 2020 20 2

- 0 0 0

20( ) ( ) 0,1 0,1 0,1 0 1.2 2xf x dx f x dx xdx

+∞

= = = = − =

∫ ∫ ∫

La función f(x) cumple las condiciones, luego es una función de densidad.

b) 33 3 2

1 1 1

9 1(1 3) ( ) 0,1 0,1 0,1 0,1 0,4.2 2 2xP X f x dx xdx

< < = = = = − =

∫ ∫

La siguiente representación gráfica ilustra este resultado:

Figura 4.6

Representación gráfica de una función de densidad (variable aleatoria continua)

0

0.1

0.2

0.3

0.4

0.5

0 1 2 3 4 5

f(x)

x

20

0 '1 0 20( )0 en el resto

x xf x < <=

0,4S =

Page 12: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

12

5.2.4. Función de distribución Supongamos ahora que, con fundamento en un experimento aleatorio, hemos definido una variable aleatoria discreta X y que su función de cuantía es:

0,1 1,2,3,4( )

0 en el restox x

f x=

=

Supongamos que nos interesa conocer la probabilidad de X sea menor o igual que 2. A partir de f(x) la podemos obtener sin demasiada complicación sumando probabilidades de la siguiente manera:

( 2) ( 1) ( 2) (1) (2) 0,1 0,2 0,3.P X P X P X f f≤ = = + = = + = + = Supongamos ahora otra variable aleatoria discreta con recorrido { }0,1,2,...,50 y que, conociendo su función de densidad, queremos calcular las probabilidades ( 25)P X ≤ y

( 42).P X ≤ Obtenerlas a partir de la función de cuantía tampoco resultará complicado pero sí laborioso, porque involucra muchos sumandos. Pensemos ahora en una variable aleatoria continua con función de densidad:

0 '1 0 20( )0 en el resto

x xf x < <=

Supongamos que nos interesa conocer las siguientes probabilidades: ( 1, 4),P X ≤ ( 2,7),P X ≤

( 3,1)P X ≤ y ( 4,1).P X ≤ Como hemos visto, una cualquiera de esas probabilidades se obtiene integrando la función de densidad, por lo que tendremos que hacer cuatro integrales. ¿Es posible aligerar los cálculos en situaciones como las señaladas? La respuesta es afirmativa y reside en la función de distribución. Para una variable aleatoria X (discreta o continua) la función de distribución, que representaremos por F(x), se define como la función que proporciona la probabilidad acumulada hasta el punto x, es decir,

( ) ( ).F x P X x= ≤ Por tanto, esta función F(x) proporciona la probabilidad de que un valor observado de la variable aleatoria sea menor o igual que el número real x. Su significado es análogo a la distribución de frecuencias relativas acumuladas vista en Estadística Descriptiva. La función de distribución tiene las siguientes propiedades: 1. ( ) 0.F −∞ =

2. ( ) 1.F +∞ = 3. Es una función monótona no decreciente. Es decir, si a y b son dos valores cualesquiera de

X, tales que a<b, entones ( ) ( ).F a F b≤

Page 13: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

13

4. ( ) ( ) ( )P a X b F b F a< ≤ = − ya que ( ) ( ) ( ).P a X b P X b P X a< ≤ = ≤ − ≤

5. F(x) es continua por la derecha. En cambio, por la izquierda no siempre lo es y cuando no

lo es, tiene un número finito pero numerable de puntos de discontinuidad.

Recordemos que una vez definida una variable aleatoria X, las probabilidades que nos interesan son las que proporciona la función de conjunto XP cuyo dominio es el

álgebraσ − de Borel. La pregunta es: ¿tiene alguna relación F(x) con ?XP La respuesta es sí, ya que, para un valor concreto de X, F(x) proporciona ( )P X x≤ y esto equivale a ( )XP B donde B es el boreliano (intervalo) definido por { }( , ] .B x= −∞ En esto radica el poder de esta nueva función que hemos introducido en nuestra caja de herramientas para el cálculo de probabilidades. a) Función de distribución para variables aleatorias discretas La expresión de la función de distribución de una variable aleatoria discreta X es la siguiente:

( )( ) ( ).i

ix x

F x P X x f x≤

= ≤ = ∑

En este caso, la función de distribución es una función escalonada, constante a intervalos. Cada salto o discontinuidad se produce en los valores aislados que toma la variable, siendo en cada uno de estos saltos continua por la derecha y discontinua por la izquierda (similar a lo que ocurre en Estadística Descriptiva con las frecuencias relativas acumuladas para datos no agrupados). Seguidamente se indica la manera de utilizar esta función para el cálculo de probabilidades:

- ( ) 1( ) ( ),i i iP X x F x F x −= = − donde 1ix − es el primer valor de la variable menor que .ix - ( ) ( )1 1 ( )i i iP X x P X x F x> = − ≤ = −

- ( ) ( )1 1( )i i iP X x P X x F x− −< = ≤ =

- ( ) ( ) 11 1 ( )i i iP X x P X x F x −≥ = − < = −

- ( ) ( ) ( )P a X b F b F a< ≤ = −

- ( ) ( ) ( ) ( )P a X b F b F a P X a≤ ≤ = − + =

- ( ) ( ) ( ) ( ) ( )P a X b F b P X b F a P X a≤ < = − = − + =

- ( ) ( ) ( ) ( )P a X b F b P X b F a< < = − = −

Page 14: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

14

Ejemplo: La tabla adjunta recoge la función de distribución de la variable aleatoria X cuya función de cuantía es:

0,1 1,2,3,4( )

0 en el resto.x x

f x=

=

ix ( )iF x

[ ,1)−∞ 0 [1, 2) 0,1 [2,3) 0,3 [3, 4) 0,6

[4, )+∞ 1,0 La representación gráfica de la función de distribución es la siguiente:

Figura 4.7 Representación gráfica de una función de distribución

(variable aleatoria discreta)

0

0.2

0.4

0.6

0.8

1

-1 0 1 2 3 4 5 6

Fi

x

A partir de esa información podemos calcular, por ejemplo, las siguientes probabilidades:

1) ( ) ( ) ( )3 3 2 0,6 0,3 0,3P X F F= = − = − =

2) ( )2,5 0,P X = = ya que 2,5 no es un valor que tenga asignada una probabilidad distinta de cero en la función de distribución.

3) ( ) ( )2,5 2,5 0,3.P X F≤ = = Obsérvese que, aunque 2,5 no es un valor que pueda tomar la variable aleatoria, le corresponde un valor distinto de cero en la función de distribución.

Page 15: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

15

4) ( ) ( ) ( )3 2 2 0,3P X P X F< = ≤ = =

5) ( ) ( ) ( )2 1 2 1 2 1 0,3 0,7P X P X F> = − ≤ = − = − =

6) ( ) ( ) ( )2 1 1 1 1 1 0,1 0,9P X P X F≥ = − ≤ = − = − =

7) ( ) ( ) ( )2 4 4 2 1 0,3 0,7P X F F< ≤ = − = − =

8) ( ) ( ) ( ) ( )2 4 3 3 2 0,6 0,3 0,3.P X P X F F< < = = = − = − = b) Función de distribución para variables aleatorias continuas En el caso de variable aleatoria continua, se define la función de distribución como:

( ) ( ) ( )x

F x P X x f t dt−∞

= ≤ = ∫

En el integrando se sustituye x por t para que no haya confusión con el límite superior de integración. La función de distribución para variables aleatorias continuas tiene el mismo significado que en el caso de variables aleatorias discretas; proporciona la probabilidad de que la variable aleatoria X tome valores iguales o inferiores al número real x (límite superior de integración), es decir, la probabilidad acumulada hasta ese valor. Teniendo en cuenta que en las variables aleatorias continuas ( ) 0,iP X x= = se cumplen las siguientes igualdades:

- ( ) ( ) ( )i i iP X x P X x F x< = ≤ =

- ( ) ( ) ( ) ( ) ( ) ( )1 2 1 2 1 2 1 2 2 1 .P x X x P x X x P x X x P x X x F x F x< ≤ = ≤ ≤ = ≤ < = < < = − Como ocurre en esta última situación, cuando lo que se quiere es calcular la probabilidad de que una variable tome valores dentro de un intervalo, entonces haremos uso de integrales definidas ya que:

( ) ( ) ( )2

1

1 2 2 1( ) .≤ ≤ = = −∫x

x

P x X x f x dx F x F x

Para el caso de variables aleatorias continuas, una propiedad muy interesante de F(x) es que su derivada es igual a la función de densidad. Matemáticamente:

( )( ) dF xf x

dx= o, lo que es lo mismo, ( ) ( ).f x F x′=

Page 16: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

16

Ejemplo: Sigamos con el ejemplo de una variable aleatoria X con función de densidad:

0,1 0 20( )0 en el resto

x xf x < <=

Anteriormente habíamos comprobado que esa función es función de densidad. Ahora vamos a calcular la función de distribución asociada:

2 22

0 0

( ) ( ) 0,1 0,1 0,1 0 0,05 .2 2

t xx x

t

t xF x f t dt tdt x=

−∞ =

= = = = − =

∫ ∫

Se comprueba que:

( ) ( ) 0,1 ( ).dF x

F x x f xdx

′= = =

La manera de expresar correctamente la función de distribución es:

2

para 000,05( ) para 0 20

1 para 20

x

xF x x

x

= < ≤ >

siendo su representación gráfica la siguiente:

Figura 4.8 Representación gráfica de una función de distribución

(variable aleatoria continua)

-0.2

0

0.2

0.4

0.6

0.8

1

-1 0 1 2 3 4 5

F(x)

x

20

2

para 000,05( ) para 0 20

1 para 20

x

xF x x

x

= < ≤ >

Page 17: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

17

En esta distribución hemos calculado anteriormente la probabilidad ( )1 3 .P X< < Vamos a calcularla ahora a partir de la función de distribución: ( ) ( ) ( )1 3 3 1 0,05 9 0,05 1 0, 45 0,05 0, 4.P X F F< < = − = ⋅ − ⋅ = − =

5.2.5. Características de una variable aleatoria De igual modo que cuando se estudió una variable en Estadística Descriptiva se analizaron sus distintas características relativas a su forma, medidas de posición, dispersión, etc., también en el caso de variables aleatorias puede realizarse el mismo tipo de análisis. Empezaremos por estudiar la media de una distribución, también conocida como media poblacional, esperanza matemática, valor esperado o simplemente esperanza. a) Esperanza Matemática

El concepto de valor esperado o esperanza matemática de una variable es uno de los más importantes en el estudio de las propiedades de las distribuciones de probabilidad. En Estadística, la esperanza matemática de una variable aleatoria X, es el número [ ]E X que formaliza la idea de valor medio de X. Una aplicación común de la esperanza matemática se encuentra en las apuestas o los juegos de azar. Veámoslo con un ejemplo. La ruleta americana tiene 38 casillas equiprobables. El acierto de una apuesta a un único número paga 35 a 1 (es decir, cobramos 35 veces lo que hemos apostado y recuperamos la apuesta, así que recibimos 36 veces lo que hemos apostado). Por tanto, considerando los 38 posibles resultados, el beneficio esperado o esperanza matemática de apostar un euro a un solo número es:

[ ] 1 3735 ( 1) 0,0526 euros38 38

E X = ⋅ + − ⋅ −

Téngase presente que el valor que toma la esperanza matemática en algunos casos puede no ser "esperado" en el sentido más general de la palabra. De hecho, su valor puede ser improbable o incluso imposible. Por ejemplo, el valor esperado cuando tiramos un dado equilibrado de 6 caras es 3,5. Podemos hacer el cálculo:

[ ] 1 1 1 1 1 11 2 3 4 5 6 3,56 6 6 6 6 6

E X = ⋅ + ⋅ + ⋅ + ⋅ + ⋅ + ⋅ =

y cabe destacar que 3,5 no es un valor posible al rodar el dado. Obsérvese que en los ejemplos señalados la esperanza matemática se corresponde con la media ponderada de los valores de la variable, donde las ponderaciones son las respectivas probabilidades de cada valor. Por lo tanto, representa la cantidad media que se "espera" como resultado de un experimento aleatorio cuando la probabilidad de cada suceso se mantiene constante y el experimento se repite un elevado número de veces.

Page 18: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

18

Esta idea intuitiva se ve muy clara en el caso de variables aleatorias discretas. Para este tipo de variable, la esperanza se define como:

( ) ( )x

E X x f x µ= =∑

En el caso de variables aleatorias continuas, la esperanza nos indica el centro de gravedad de la distribución y tiene la siguiente expresión:

( ) ( ) x

E X x f x dx µ= =∫

En ambos casos, el resultado es un número que simbolizamos por .µ Para que exista el valor esperado es necesario que la serie y la integral que la definen sean absolutamente convergentes, es decir, tengan cota superior.4 Este concepto de esperanza matemática se puede generalizar para el caso de una función

( )ϕ X de la variable aleatoria X, de tal forma que la esperanza de ( )Xϕ será:

[ ( )] ( ) ( )x

E X x f xϕ ϕ=∑ si X es una variable aleatoria discreta.

[ ( )] ( ) ( )

x

E X x f x dxϕ ϕ= ∫ si X es una variable aleatoria continua.

Téngase siempre presente que cualquier función de una variable aleatoria es otra variable aleatoria que “hereda” las propiedades probabilísticas de la variable original. Ejemplo: Supongamos el juego según el cual un jugador recibe 100 euros por cada punto que obtenga en el lanzamiento de su dado. ¿Cuál es el valor esperado de este juego? Veamos qué valores toma la variable aleatoria original, su función y las probabilidades asociadas:

ix ( ) 100i ix xϕ = ( )if x 1 100 1/6 2 200 1/6 3 300 1/6 4 400 1/6 5 500 1/6 6 600 1/6

Calculemos ahora el valor esperado del juego:

1 1 2 2 6 6[ ( )] ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )x

E X x f x x f x x f x x f xϕ ϕ ϕ ϕ ϕ= = + + + =∑

4 No nos preocuparemos por esta condición porque todas las distribuciones con las que trabajamos la cumplen.

Page 19: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

19

1 1 1 1 1 1 100 200 300 400 500 600 350 euros.6 6 6 6 6 6

= ⋅ + ⋅ + ⋅ + ⋅ + ⋅ + ⋅ =

Propiedades de la esperanza matemática: El símbolo E que hemos utilizado para representar el concepto de esperanza es un operador matemático, es decir, un símbolo que representa una operación matemática que hay que realizar (al igual que el operador o∑ el operador ).∏ Algunas de sus propiedades más interesantes son: 1. Esperanza de una constante: Si ( )X aϕ = , siendo a una constante, entonces [ ] .E a a=

Demostración:

- Variable aleatoria discreta: [ ] ( ) ( ) 1

x xE a af x a f x a a= = = ⋅ =∑ ∑

- Variable aleatoria continua: [ ] ( ) ( ) 1x x

E a af x dx a f x dx a a= = = ⋅ =∫ ∫

2. Cambio de origen: Si ( ) ,X a Xϕ = + siendo a una constante, entonces

[ ] [ ].E a X a E X+ = +

Demostración:

- Variable aleatoria discreta: [ ] ( ) [ ]

1

( ) ( ) ( )x x x

E a X a x f x a f x xf x a E X

=

+ = + = + = +∑ ∑ ∑

- Variable aleatoria continua:

[ ] ( ) [ ]

1

( ) ( ) ( )x x x

E a X a x f x dx a f x dx xf x dx a E X

=

+ = + = + = +∫ ∫ ∫

3. Cambio de escala: Si ( ) ,X bXϕ = siendo b una constante, entonces [ ] [ ].E bX bE X=

Demostración:

- Variable aleatoria discreta: [ ] [ ]( ) ( )x x

E bX bxf x b xf x bE X= = =∑ ∑

- Variable aleatoria continua: [ ] [ ]( ) ( )

x x

E bX bxf x dx b xf x dx bE X= = =∫ ∫

Page 20: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

20

4. Transformación lineal: Si ( ) ,X a bXϕ = + siendo a y b constantes, entonces ( ) ( ).E a bX a bE X+ = +

Demostración:

- Variable aleatoria discreta: [ ] ( ) [ ]

1

( ) ( ) ( )x x x

E a bX a bx f x a f x b xf x a bE X

=

+ = + = + = +∑ ∑ ∑

- Variable aleatoria continua:

[ ] ( ) [ ]

1

( ) ( ) ( )x x x

E a bX a bx f x dx a f x dx b xf x dx a bE X

=

+ = + = + = +∫ ∫ ∫

5. Acotación: Si una variable X está acotada, es decir, si existen dos valores a y b tales que

,a X b≤ ≤ entonces ( ) .a E X b≤ ≤ Demostración: Supongamos que X es una variable aleatoria continua. Partimos de que .a x b≤ ≤ Dado que ( ) 0,f x ≥ podemos escribir:

( ) ( ) ( )af x xf x bf x≤ ≤

Tomando integrales en los tres miembros y operando se llega a:

( ) ( ) ( )

x x x

af x dx xf x dx bf x dx≤ ≤∫ ∫ ∫

1 1

( ) ( ) ( )x x x

a f x dx xf x dx b f x dx

= =

≤ ≤∫ ∫ ∫

[ ]a E X b≤ ≤

6. Suma de funciones de X: El valor esperado de la suma de dos funciones de una misma

variable aleatoria X es la suma de los valores esperados de cada una de ellas:

[ ( ) ( )] [ ( )] [ ( )]E g X h X E g X E h X+ = +

Demostración:

[ ] [ ] [ ][ ( ) ( )] ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )x x x

E g X h X g x h x f x dx g x f x dx h x f x dx E g X E h X+ = + = + = +∫ ∫ ∫

Page 21: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

21

7. Binomio de Newton: Si ( ) ( ) ,nX a bXϕ = + siendo a y b constantes y n cualquier número entero, entonces:

-

0( ) ( )

nn n i i i

i

nE a bX a b E X

i=

+ = ∑

Demostración:

- - -

0 0 0

desarrollo del binomio de Newton

( ) ( )n n n

n n i i i n i i i n i i i

i i i

n n nE a bX E a b X E a b X a b E X

i i i= = =

+ = = =

∑ ∑ ∑

b) Momentos de una variable aleatoria Una vez definido el concepto de esperanza, vamos a generalizarlo dando la noción de momentos con respecto al origen y momentos con respecto a la media de una variable aleatoria. Los momentos son números que caracterizan a una distribución de probabilidad, de tal forma que dos variables tienen la misma distribución si tienen todos lo momentos iguales y serán tanto más parecidas cuanto más momentos tengan iguales. Como vemos, es un concepto análogo al manejado en Estadística Descriptiva. Los momentos con respecto al origen se definen de la siguiente forma:

para 0,1, 2,3,....rr E X rµ′ = =

Es decir, dada una variable aleatoria X, se define el momento de orden r respecto al origen como: ( )r r

rx

E X x f xµ′ = = ∑ si X es una variable aleatoria discreta,

( )r r

rx

E X x f x dxµ′ = = ∫ si X es una variable aleatoria continua.

Para cualquier variable aleatoria se tiene que:

[ ]00Si 0 1 1r E X Eµ′ = = = =

[ ]1

1Si 1 (media poblacional)r E X E Xµ µ′ = = = = Como vemos, la esperanza matemática de cualquier variable aleatoria es el momento con respecto al origen de orden 1.

Page 22: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

22

Por su parte, los momentos con respecto a la media o momentos centrales se definen de la siguiente forma:

( ) para 0,1, 2,3,....rr E X rµ µ = − =

Por tanto,

( ) - ( - ) ( )r rr

xE X x f xµ µ µ = = ∑ si X es una variable aleatoria discreta,

( ) - ( ) ( )r rr

x

E X x f x dxµ µ µ = = − ∫ si X es una variable aleatoria continua.

Para cualquier variable aleatoria se tiene que:

( ) [ ]00Si 0 - 1 1r E X Eµ µ = = = =

( ) [ ] [ ]11Si 1 - 0.r E X E X Eµ µ µ µ µ = = = − = − =

Un momento con respecto a la media importante es el momento de orden 2, ya que se corresponde con la varianza de la variable aleatoria. Así:

( )2 22Si 2 ( )r E X Var Xµ µ σ = = − = =

Vemos que la varianza es la esperanza del cuadrado de las desviaciones respecto al centro de gravedad de la distribución. Da idea de la dispersión de la variable aleatoria respecto de .µ Además, los momentos centrales tercero y cuarto proporcionan información muy útil respecto a la forma de la distribución de la variable aleatoria X:

33Si 3, ( - ) .r E Xµ µ = = Este coeficiente informa sobre el grado de asimetría de la

distribución. Una medida adimensional de asimetría basada en este momento es el coeficiente de asimetría de Fisher:

31 3

0 distribución asimétrica a la izquierda0 distribución simétrica0 distribución asimétrica a la derecha.

µγσ

<= =>

Todos los momentos respecto a la media pueden expresarse en función de los momentos con respecto al origen. Veámoslo en el caso de la varianza:

( ) [ ]22 2 2 2 22 2 2E X E X X E X E X Eσ µ µ µ µ µ µ = = − = − + = − + =

Page 23: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

23

[ ]2 2 2 2 2 2 22 1 2 2 .E X E X E X E Xµ µ µµ µ µ µ µ′ ′ = − + = − + = − = −

Por tanto, 2 2 2 2

2 1 .E Xσ µ µ µ′ ′ = − = − A todos los momentos de una distribución se les conoce como los parámetros de la distribución, siendo la media y la varianza los más importantes. Como ya se ha indicado anteriormente, son números que caracterizan a la distribución de probabilidad. c) Varianza, desviación típica y coeficiente de variación Ya hemos visto que la varianza es el momento con respecto a la media de orden 2:

( )22 22 2( )Var X E Xσ µ µ µ µ ′= = = − = −

La varianza posee una serie de propiedades, entre las cuales destacan las siguientes: 1. Varianza de una contante: ( ) 0,Var a = siendo a cualquier constante.

2. Cambio de origen: ( ) ( ) ,Var a X Var X+ = siendo a cualquier constante. 3. Cambio de escala: ( ) ( )2 ,Var bX b Var X= siendo b cualquier constante. De esta propiedad

se deriva, por ejemplo, que ( ) ( ).Var X Var X− = 4. Transformación lineal: ( ) ( )2 ,Var a bX b Var X+ = siendo a y b cualesquiera constantes. 5. La varianza es la mínima desviación cuadrática media:

( ) ( )2 2 para todo .E X E X p pµ µ − < − ≠

Como ya se ha indicado, la varianza es un indicador de la dispersión de los valores de la variable aleatoria respecto a la media poblacional. Tiene como unidad de medida el cuadrado de la unidad de medida de la variable, lo que dificulta su interpretación. Esta dificultad se evita calculando la desviación típica o desviación estándar, que se define como la raíz cuadrada positiva de la varianza:

( ) ( )Desv X Var Xσ= = + También podemos calcular el coeficiente de variación, que recordemos que es una medida relativa de dispersión:

100CV σµ

= ⋅

Page 24: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

24

Este coeficiente expresa la dispersión de una variable aleatoria respecto a su media y es muy útil para comparar la dispersión de dos distribuciones de probabilidad, ya que no posee unidades de medida (adimensional). d) Variable tipificada Una vez que hemos introducido la media y la varianza de una distribución, estamos en condiciones de dar el concepto de variable tipificada. Sea X una variable aleatoria cualquiera con esperanza igual a Xµ y varianza igual a 2 .Xσ Diremos que Z es la variable tipificada de X si es igual a:

- X

X

XZ µσ

=

La nueva variable aleatoria tipificada Z es adimensional, es decir, no tiene asociadas unidades de medida. Ello hace que puedan compararse directamente valores tipificados de distintas variables aleatorias. Este tipo de variables exhiben dos propiedades importantes:

1. La esperanza de una variable tipificada es siempre igual a cero: [ ] 0.E Z = Demostración:

[ ] [ ] [ ] [ ] [ ]- 1 1 1- 0.XX X X X

X X X X

XE Z E E X E X Eµ µ µ µ µσ σ σ σ

= = = − = − =

2. La varianza de una variable tipificada es siempre igual a la unidad: ( ) 1.Var Z =

Demostración:

( ) ( ) ( ) 22 2 2

1 1 1 1.XX X

X X X X

XVar Z Var Var X Var Xµ µ σσ σ σ σ

−= = − = = =

e) Función generatriz de momentos Ya hemos definido los momentos de una distribución de probabilidad y la esperanza de una función ( )Xϕ de una variable aleatoria. Supongamos ahora que ( ) .tXX eϕ = En tal caso, la esperanza de ( ),Xϕ se conoce como función generatriz de momentos de la variable aleatoria X. Se denomina función generatriz de momentos de la variable aleatoria X y la representamos por ( )xM t a la siguiente esperanza:

( ) tXXM t E e =

Page 25: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

25

donde t es una variable real auxiliar (la función generatriz de momentos es una función real de variable real).

- Si X es una variable aleatoria discreta: ( ) ( )tX txX

xM t E e e f x = = ∑

- Si X es una variable aleatoria continua: ( ) ( )txtX

Xx

M t E e e f x dx = = ∫

Para que la función generatriz de momentos exista es necesario que se dé la convergencia absoluta de la serie o de la integral que la define. Esta condición se cumple para los principales modelos probabilísticos más usados en Estadística Teórica, que se presentarán en las siguientes lecciones. La principal utilidad de ( )XM t es que, si existe, a partir de ella se puede obtener cualquier momento con respecto al origen ( rµ′ ) de una distribución de probabilidad. En concreto:

( )

00

( )( ) 0,1, 2,.....r

r Xr X rt

t

d M tM t rdt

µ=

=

′ = = =

Es decir, el momento respecto al origen de orden r, ,rµ′ se puede obtener derivando la función generatriz de momentos r veces respecto a t y particularizando para el valor 0.t = Así, por ejemplo:

(1)1

0

( )(0) XX

t

dM tMdt

µ µ=

′ = = =

2

(2)2 2

0

( )(0) XX

t

d M tMdt

µ=

′ = =

3

(3)3 3

0

( )(0) XX

t

d M tMdt

µ=

′ = =

Otras propiedades de la función generatriz de momentos son las siguientes: 1. (0) 1.XM =

2. Si ,Y a X= + entonces ( ) ( )ta

Y XM t e M t= (Cambio de origen)

Page 26: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

26

Demostración:

( )( ) ( ) ( )t a X ta tX taY a X XM t M t E e E e e e M t+

+ = = = = De esta propiedad se deduce que ( ) ( ).t

X XM t e M tµµ

−− =

3. Si ,Y bX= entonces ( ) ( ).Y XM t M tb= (Cambio de escala)

Demostración:

( )( ) ( ) ( )tb XtbX

Y bX XM t M t E e E e M tb = = = =

4. Si ,Y a bX= + entonces ( ) ( )ta

Y XM t e M tb= (transformación lineal)

Demostración:

( )( ) ( ) ( )a bX t ta tbX taY a bX XM t M t E e E e e e M tb+

+ = = = =

5. Si Z es la variable tipificada de X, con 2( ) y ( ) ,X XE X Var Xµ σ= = se tiene que:

( )t

Z XtM t e M

µσ

σ− =

Demostración:

( )X tX t tt

tZZ X

tM t E e E e E e e e Mµ µ µ

σ σ σ σ

σ

− − −

= = = ⋅ =

Además, la función generatriz de momentos tiene una propiedad muy importante que se enuncia como Teorema de la Unicidad. Este teorema dice que si la función generatriz de momentos existe, es única y determina completamente la distribución de probabilidad de la variable aleatoria correspondiente, en el sentido de que si dos variables aleatorias cualesquiera tienen la misma función generatriz de momentos, entonces las dos tienen la misma distribución de probabilidad y, de hecho, las dos son la misma variable. La inversa también se verifica y podemos decir que si dos variables aleatorias tienen la misma distribución, entonces también tienen la misma función generatriz de momentos. Ejemplo: La función de cuantía de una variable aleatoria es:

si 1, 2,3, 4,( ) 10

0 en el resto.

x xf x

==

Page 27: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

27

Se pide: a) Comprobar que es función de cuantía. b) Obtener la función generatriz de momentos. c) Utilizando dicha función, determinar los valores de la esperanza y la varianza. Resolución: a) Para que f(x) sea función de cuantía ha de cumplir la dos propiedades siguientes:

1) ( ) 0 (se cumple)f x x≥ ∀

2) 1

( ) 1i k

ii

f x=

=

=∑

4

1 1

1 2 3 4( ) 1 (se cumple)10 10 10 10 10

i k i

ii i

xf x= =

= =

= = + + + =∑ ∑

b) Función generatriz de momentos:

1 2 3 4 2 3 41 2 3 4 1( ) ( ) 2 3 410 10 10 10 10

tX tx t t t t t t t tX

xM t E e e f x e e e e e e e e = = = + + + = + + + ∑

c) Esperanza y varianza:

[ ] (1)

0( )X t

E X M tµ=

= =

2 3 4( ) 1 4 9 16

10t t t tXdM t e e e e

dt = + + +

[ ] [ ]0 0 0 0

0

( ) 1 14 9 16 1 4 9 16 310 10

X

t

dM tE X e e e edt

µ=

= = = + + + = + + + =

[ ] 2 2 (2)

2 2 0 donde ( )x t

Var X M tσ µ µ µ=

′ ′= = − =

2

2 3 42

( ) 1 8 27 6410

t t t tXd M t e e e edt

= + + +

[ ]2

0 0 0 02 2

0

( ) 1 18 27 64 1 8 27 64 1010 10

X

t

d M t e e e edt

µ=

′ = = + + + = + + + =

[ ] 2 2 2

2 =10 3 1.Var X σ µ µ′= = − − =

Page 28: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

28

5.3. DISTRIBUCIONES BIDIMENSIONALES Los apartados anteriores se han dedicado al estudio de distribuciones univariantes. Estas distribuciones respondían a experimentos aleatorios en los que se observa sólo una característica. Sin embargo, en muchas ocasiones podemos estar interesados en estudiar conjuntamente dos características de un fenómeno aleatorio, es decir, podemos querer estudiar el comportamiento conjunto de dos variables aleatorias, intentando explicar la posible relación entre ellas. Así, por ejemplo, nos puede interesar estudiar la relación entre el peso y la estatura de los individuos de una población, entre la longitud y la dureza de las piezas fabricadas en un proceso de producción, entre renta y consumo de las familias, entre producción y costes en una empresa, etc. A cada realización de estos experimentos no puede asignársele un número real, sino que en este caso tendríamos que considerar dos variables aleatorias X e Y distintas, de forma que si queremos estudiar su comportamiento conjunto habrá que estudiar su distribución conjunta de probabilidad. 5.3.1. Variable aleatoria bidimensional discreta Sean X e Y dos variables aleatorias discretas que toman los valores 1 2, ,..., kx x x e 1 2, ,..., ,my y y respectivamente. Llamamos distribución de probabilidad bidimensional, distribución de probabilidad conjunta o función de cuantía conjunta a la siguiente función:

( , ) ( , ) 1, 2,..., 1, 2,...,i j i jf x y P X x Y y i k j m= = = ∀ = ∀ =

que asigna probabilidades a los diferentes valores conjuntos de la variable bidimensional ( ), ,X Y de tal manera que se verifican las dos condiciones siguientes:

1. ( , ) 0 1, 2,..., 1, 2,...,i jf x y i k j m≥ ∀ = ∀ =

2. 1 1

( , ) 1 k m

i ji j

f x y= =

=∑∑

El cálculo de probabilidades a partir de esta función se realiza mediante un doble sumatorio. Así:

( , ) ( , ).x A y B

P x A y B f x y∈ ∈

∈ ∈ =∑∑

Ejemplo: Consideremos el experimento aleatorio consistente en sacar dos naipes, sin reposición, de una baraja de 52 (4 palos x 13 naipes). Definamos dos variables aleatorias X e Y de la siguiente manera:

{ }"número de espadas en la primera extracción" con ( ) 0,1X X E= =

{ }"número de espadas en la segunda extracción" con ( ) 0,1Y Y E= =

Page 29: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

29

Las variables aleatorias X e Y son discretas. Vamos a obtener su distribución de cuantía conjunta. Debemos calcular la probabilidad para cuatro pares de valores. Así:

39 38(0,0) ( 0, 0) 0,558852 51

f P X Y= = = = ⋅ =

13 39(1,0) ( 1, 0) 0,191252 51

f P X Y= = = = ⋅ =

39 13(0,1) ( 0, 1) 0,191252 51

f P X Y= = = = ⋅ =

13 12(1,1) ( 1, 1) 0,058852 51

f P X Y= = = = ⋅ =

La distribución de probabilidad conjunta la podemos expresar en forma de tabla de la siguiente manera:

(x,y) f(x,y) (0,0) 0,5588 (1,0) 0,1912 (0,1) 0,1912 (1,1) 0,0588

1 La representación gráfica de la función se corresponde con un diagrama de barras en el espacio tridimensional ( ), ; , .x y f x y 5.3.2. Variable aleatoria bidimensional continua Sean X e Y dos variables aleatorias continuas. Consideremos ahora la variable aleatoria bidimensional (X, Y) formada por esas dos variables. Llamamos función de densidad bidimensional o conjunta de X e Y a aquella función f(x,y) que cumpla las dos condiciones siguientes:

1. ( , ) 0 - - f x y x y≥ ∞ < < ∞ ∞ < < ∞

2. ( , ) 1x y

f x y dxdy =∫ ∫

Análogamente a lo que ocurría en el caso unidimensional, la función f(x,y) no proporciona directamente probabilidades sino que representa una superficie de densidad de probabilidad en el espacio tridimensional, de forma que el volumen encerrado bajo esa superficie es igual a la unidad.

Page 30: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

30

Ahora, la obtención de probabilidades se consigue por doble integración y se corresponden con el volumen encerrado bajo el área definida por la función f(x,y) y los correspondientes límites de integración de X y de Y. Concretamente, estas probabilidades vendrán dadas por:

2 2

1 1

1 2 1 2( ; ) ( , ) .x y

x y

P x X x y Y y f x y dxdy≤ ≤ ≤ ≤ = ∫ ∫

Al ser X e Y variables aleatorias continuas ocurre que la probabilidad de que ( ),X Y tome un par de valores concretos (x,y) es siempre igual a cero, es decir, ( ; ) 0.P X x Y y= = = Ejemplo: Sea la siguiente función de densidad conjunta:

1 para 0 1 , 0 1( , )

0 en el restox y

f x y≤ ≤ ≤ ≤

=

Se pide: a) Comprobar que efectivamente es una función de densidad bidimensional:

1. ( , ) 0 - - f x y x y≥ ∞ < < ∞ ∞ < < ∞ (se cumple)

2. ( , ) 1x y

f x y dxdy =∫ ∫

[ ] [ ]11 1 1 1 1 1 1

00 0 0 0 0 00( , ) 1 1 1 1

x y x y x xx y

f x y dxdy dxdy dy dx y dx dx x= = = = = =

= = = = = = ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫

b) Calcular (0, 2 0,5;0,4 0,6).P X Y≤ ≤ ≤ ≤

La probabilidad de que las variables aleatorias X e Y tomen valores correspondientes a puntos interiores al rectángulo R dado por 0, 2 0,5 y 0,4 0,6X Y≤ ≤ ≤ ≤ será igual al volumen por debajo de f(x,y) y por encima de R. Esta probabilidad la calcularemos de la siguiente forma:

0,5 0,6

0,2 0,4(0, 2 0,5;0,4 0,6) ( , )

x yP X Y f x y dxdy

= =≤ ≤ ≤ ≤ = =∫ ∫

[ ] [ ]0,60,5 0,6 0,5 0,5 0,5

0,20,2 0,4 0,2 0,20,41 0,2 0,2 0,2[0,5 0,2] 0,06.

x y x xdy dx y dx dx x

= = = =

= = = = = − = ∫ ∫ ∫ ∫

5.3.3. Función de distribución bidimensional o conjunta La función de distribución bidimensional conjunta de dos variables X e Y es aquella que asigna a todo par de números reales x e y la probabilidad de que, conjuntamente, X sea igual o menor que x, e Y sea igual o menor que y:

Page 31: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

31

( , ) ( , )F x y P X x Y y= ≤ ≤

En el caso de variables aleatorias discretas:

( , ) ( , ) ( , ) i i

i jx x y y

F x y P X x Y y f x y≤ ≤

= ≤ ≤ = ∑∑

Para variables aleatorias continuas:

( , ) ( , ) ( , ) yx

F x y P X x Y y f x y dxdy−∞ −∞

= ≤ ≤ = ∫ ∫

La función F(x,y) tiene las siguientes propiedades:

1. ( , ) ( , ) ( , ) 0.F F y F x−∞ −∞ = −∞ = −∞ =

2. ( , ) 1F +∞ +∞ =

3. Es una función monótona no decreciente respecto a las dos variables, es decir:

Si 1 2 1 2( , ) ( , )x x F x y F x y< ⇒ ≤ Si 1 2 1 2( , ) ( , )y y F x y F x y< ⇒ ≤

4. Si (X,Y) es una variable aleatoria bidimensional continua:

2 ( , ) ( , )F x y f x y

x y∂

=∂ ∂

Ejemplo: Para el ejemplo anterior en el que la función de densidad conjunta es:

1 para 0 1 , 0 1( , )

0 en el restox y

f x y≤ ≤ ≤ ≤

=

Vamos a calcular la función de distribución y comprobar la cuarta propiedad. a) Cálculo de la función de distribución:

[ ] [ ]00 0 0 0 0 0 0 00( , ) 1 1 .

yx y x y x y x x xf x y dxdy dx dy dx y dx ydx yx yx = = = = = = ∫ ∫ ∫ ∫ ∫ ∫ ∫ ∫

Por tanto,

Page 32: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

32

0 para 0 0( , ) 0 1 0 1

1 en el resto

x yF x y xy x y

< <= ≤ ≤ ≤ ≤

b) Comprobación de la propiedad 2 ( , ) ( , ) :F x y f x y

x y∂

=∂ ∂

( , )F x y yx

∂=

2( , )

( , ) 1 ( , ).

F x ydF x y x f x y

x y dy

∂ ∂ ∂ = = =

∂ ∂

5.3.4. Distribuciones marginales

A partir de la distribución de probabilidad conjunta es posible obtener la distribución de probabilidad de cada una de las variables por separado. A estas distribuciones se les conoce como distribuciones marginales (equivalentes a las distribuciones de frecuencias marginales en Estadística Descriptiva). Para ver cómo se procedería en el caso continuo (para variables discretas se haría de forma similar, sólo que en lugar de integrar se sumaría) se va a estudiar la siguiente situación: sean X e Y dos variables aleatorias continuas con función de densidad conjunta f(x,y). Definamos el evento { } ,a x b≤ ≤ con .a b< Este evento ocurrirá cuando ocurra { }, ,≤ ≤ −∞ < < +∞a x b y ya que establecemos unos límites para la variable X pero no para Y. Ambos eventos son equivalentes y, por lo tanto, tienen la misma probabilidad. Dicha probabilidad vendrá dada por:

( ), ( , ) ( , )b b

x a y x a yP a x b y f x y dxdy f x y dy dx

+∞ +∞

= =−∞ = =−∞

< < −∞ < < +∞ = = ∫ ∫ ∫ ∫

Ahora bien, ( , )y

f x y dy+∞

=−∞∫ es una función ( )Xf x que sólo depende de x. En consecuencia

resulta que ( ) ( ) ,b

Xx aP a X b f x dx

=< < = ∫ de tal forma que ( )Xf x es la función de densidad de

X. Esta función de densidad recibe el nombre de función de densidad marginal y, como hemos visto, se obtiene integrando la función de densidad conjunta para todos los valores de Y:

( ) ( , ) .X yf x f x y dy

+∞

=−∞= ∫

De igual forma se podría haber obtenido la función de densidad marginal de la variable Y. Estas funciones de densidad marginales nos dan la probabilidad de los valores de una variable sin tener en cuenta los que tome la otra variable. En resumen:

Page 33: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

33

Variable aleatoria X Variable aleatoria Y

Caso continuo: ( ) ( , ) ( ) ( , )X Yy xf x f x y dy f y f x y dx

+∞ +∞

=−∞ =−∞= =∫ ∫

Caso discreto: ( ) ( , ) ( ) ( , )X Y

y xf x f x y f y f x y= =∑ ∑

Ejemplo 1: Sea la función de cuantía conjunta de X e Y:

1,2,3 1, 2( , ) 21

0 en el resto

x y x yf x y

+ = ==

a) Compruebe que es función de cuantía. b) Calcule las funciones marginales de X y de Y.

Resolución: a) Hay que verificar que:

1) ( , ) 0 1, 2,..., 1, 2,...,i jf x y i r j s≥ ∀ = ∀ = (se cumple)

2) 1 1

( , ) 1r s

i ji j

f x y= =

=∑∑ (se cumple)

En este caso, la distribución es la siguiente:

(x,y) f(x,y) (1,1) 2/21 (1,2) 3/21 (2,1) 3/21 (2,2) 4/21 (3,1) 4/21 (3,2) 5/21

1

b) Función de cuantía marginal de X:

2

1

1 2 2 3( ) ( , ) con 1, 2,321 21 21 21

y

Xy y

x y x x xf x f x y x=

=

+ + + += = = + = =∑ ∑

Por tanto, la función de cuantía de X es: 2 3 1,2,3

( ) 210 en el resto

X

x xf x

+ ==

Page 34: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

34

Función de cuantía marginal de Y:

3

1

1 2 3 6 3 2( ) ( , ) = con 1, 221 21 21 21 21 7

x

Yx x

x y y y y y yf y f x y y=

=

+ + + + + += = = + + = =∑ ∑

Por tanto, la función de cuantía de Y es: 2 1, 2

( ) 70 en el resto.

Y

y yf y

+ ==

Ejemplo 2: Dada la siguiente función de densidad conjunta, calcule las funciones de densidad marginales de X y de Y:

1 0 1 0 1

( , ) 0 en el resto,

x yf x y

≤ ≤ ≤ ≤=

Resolución: Función de densidad marginal de la variable X:

[ ]1 1

00( ) ( , ) 1 1 si 0 1 y 0 en el resto.X y y

f x f x y dy dy y x=

= = = = ≤ ≤∫ ∫

Función de densidad marginal de la variable Y:

[ ]1 1

00( ) ( , ) 1 1 si 0 1 y 0 en el resto.Y x x

f y f x y dx dx x y=

= = = = ≤ ≤∫ ∫

5.3.5. Distribuciones condicionadas (o condicionales) A continuación analizaremos la idea de distribución de probabilidad condicionada. Supongamos que X e Y son dos variables aleatorias discretas con función de cuantía conjunta f(x,y). Supongamos también que ( )Xf x y ( )Yf y son sus correspondientes marginales. Definamos el suceso { }( , ) ; , ,A x y x x y′= = −∞ < < ∞ donde x′ es tal que

( ) ( ) ( ) 0,XP A P X x f x′ ′= = = > y también el suceso { }( , ) ; , .B x y x y y′= −∞ < < +∞ = Ahora, por definición, la probabilidad condicional del suceso B dado el suceso A es:

( ) ( )( )

( )( )

, ( , )/ .( )

′ ′∩ = = ′ ′= = =

′ ′= X

P A B P X x Y y f x yP B AP A P X x f x

Así pues, si (x,y) es cualquier punto para el cual ( ) 0,Xf x > la probabilidad condicional de Y y= dado X x= es:

( ) ( , )/ .( )X

f x yP Y y X xf x

= = =

Page 35: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

35

Este cociente satisface las condiciones para ser función de cuantía. Comprobémoslo:

1. Es no negativa, por tratarse siempre del cociente de dos funciones de cuantía (conjunta entre marginal).

2. ( )( , ) 1 ( , ) 1.( ) ( ) ( )

X

y yX X X

f xf x y f x yf x f x f x

= = =∑ ∑

En el caso de variables aleatorias discretas, a esta función se le conoce como función de cuantía condicional o condicionada de Y dado X y se le representa por el símbolo ( / ).f y x Por tanto,

( ) ( , )/ para ( ) 0( ) X

X

f x yf y x f xf x

= >

De igual forma, la función de cuantía condicional o condicionada de X dado Y tiene la siguiente expresión:

( ) ( , )/ para ( ) 0.( ) Y

Y

f x yf x y f yf y

= >

Esta definición de distribución de probabilidad condicionada se aplica tanto para el caso de variables discretas como para continuas. En este último caso, ( / )f y x recibe el nombre de función de densidad condicional o condicionada. Veamos algunos ejemplos basados en los anteriores: Ejemplo 1: Sea la función de cuantía conjunta de X e Y:

1, 2,3 1, 2( , ) 21

0 en el resto

x y x yf x y

+ = ==

Calcule la función de Y condicionada a X, demostrando que es función de cuantía. Resolución:

Sabemos que:

2 3 1,2,3

( ) 210 en el resto

X

x xf x

+ ==

Por tanto:

Page 36: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

36

( ) ( , ) 21/ para 1, 2,3 1, 2.2 3( ) 2 321

X

x yf x y x yf y x x yxf x x

++

= = = = =+ +

Comprobemos que, efectivamente, ( )/f y x es una función de cuantía:

1) Es no negativa por tratarse de cociente de funciones de cuantía.

2) 1 2 2 3( / ) 1.2 3 2 3 2 3 2 3y y

x y x x xf y xx x x x+ + + +

= = + = =+ + + +∑ ∑

Ejemplo 2: Sea la siguiente función de densidad conjunta:

1 0 1 0 1 ( , )

0 en el resto,x y

f x y≤ ≤ ≤ ≤

=

Calcule la función de X condicionada a Y, demostrando que es función de densidad.

Resolución:

( ) ( , )/ para ( ) 0.( ) Y

Y

f x yf x y f yf y

= >

Ya sabemos que:

( ) 1 si 0 1 y 0 en el resto.Yf y y= ≤ ≤ Por tanto:

( ) ( , ) 1/ = =1 para 0 1 0 1( ) 1Y

f x yf x y x yf y

= ≤ ≤ ≤ ≤

Efectivamente es función de densidad: 1) Es no negativa.

2) [ ]1 1

00( / ) 1 1.

x xf x y dx dx x

== = =∫ ∫

Independencia estocástica de variables aleatorias Supongamos que X e Y son dos variables aleatorias, continuas o discretas, con función de densidad conjunta f(x,y) y densidades marginales ( )Xf x y ( ).Yf y Diremos que X e Y son independientes si y sólo si:

Page 37: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

37

( , ) ( ) ( ) , x yf x y f x f y x y= ⋅ ∀ ∀ (condición 1)

Es decir, dos variables aleatorias X e Y son independientes si y sólo si la función de densidad conjunta es igual al producto de las marginales. Otra forma de caracterizar la independencia es la siguiente. A partir de la definición de la función de densidad condicional obtenemos:

( , )( / ) ( , ) ( ) ( / )( ) X

X

f x yf y x f x y f x f y xf x

= ⇒ =

o bien,

( , )( / ) ( , ) ( ) ( / )( ) Y

Y

f x yf x y f x y f y f x yf y

= ⇒ =

Por tanto, teniendo en cuenta la condición 1, que las variables X e Y sean independientes implica también:

( / ) ( ) , Yf y x f y x y= ∀ ∀ (condición 2)

( / ) ( ) , Xf x y f x x y= ∀ ∀ (condición 3)

Es decir, dos variables aleatorias X e Y son independientes si y sólo si las distribuciones condicionadas coinciden con las distribuciones marginales. Si se cumple una de las tres condiciones señaladas se cumple el resto. Por tanto, a efectos prácticos, para saber si dos variables aleatorias son independientes basta con comprobar una cualquiera de esas tres condiciones. En el caso de independencia estocástica, es posible simplificar el cálculo de probabilidades conjuntas ya que ( ) ( ) ( )1 2 1 2 1 2 1 2; .P x X x y Y y P x X x P y Y y≤ ≤ ≤ ≤ = ≤ ≤ ≤ ≤ Veámoslo en el caso de variables aleatorias continuas:

( ) 2 2 2 2

1 1 1 11 2 1 2; ( , ) ( ) ( )

x y x y

X Yx y x yP x X x y Y y f x y dxdy f x f y dxdy≤ ≤ ≤ ≤ = = =∫ ∫ ∫ ∫

( ) ( )2 2

1 11 2 1 2( ) ( ) .

x y

X Yx yf x dx f y dy P x X x P y Y y = = ≤ ≤ ≤ ≤ ∫ ∫

Ejemplo: Sea la siguiente función de densidad conjunta:

1 0 1 0 1 ( , )

0 en el resto,x y

f x y≤ ≤ ≤ ≤

=

Page 38: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

38

¿Son independientes las variables? Resolución: Las funciones marginales de X y de Y ya fueron calculadas con anterioridad. Recordemos aquellos cálculos:

Función de densidad marginal de la variable X:

[ ]1 1

00( ) ( , ) 1 1 si 0 1 y 0 en el resto.X y y

f x f x y dy dy y x=

= = = = ≤ ≤∫ ∫

Función de densidad marginal de la variable Y:

[ ]1 1

00( ) ( , ) 1 1 si 0 1 y 0 en el resto.Y x x

f Y f x y dx dx x y=

= = = = ≤ ≤∫ ∫

X e Y son independientes puesto que se cumple que ( , ) ( ) ( ) , :x yf x y f x f y x y= ⋅ ∀ ∀

( , ) ( ) ( ) 1 1 1 , .x yf x y f x f y x y= ⋅ = ⋅ = ∀ ∀ 5.3.6. Esperanza de una función de variables aleatorias

En el caso de una única variable aleatoria, definíamos su esperanza matemática o valor esperado como:

( ) ( )x

E X x f x=∑ (variable discreta)

( ) ( )

x

E X x f x dx= ∫ (variable continua)

y, en general, para una función ( )Xϕ de esa variable definíamos su esperanza como:

[ ( )] ( ) ( )x

E X x f xϕ ϕ=∑ (variable discreta)

[ ( )] ( ) ( )

x

E X x f x dxϕ ϕ= ∫ (variable continua).

De forma similar, para dos variable aleatorias X e Y que se distribuyen conjuntamente con distribución de probabilidad f(x,y) podemos considerar la esperanza de una función

( , )X Yϕ de esas variables:

[ ( , )] ( , ) ( , )x y

E X Y x y f x yϕ ϕ=∑∑ (variables discretas)

Page 39: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

39

[ ( , )] ( , ) ( , )E X Y x y f x y dxdyϕ ϕ+∞ +∞

−∞ −∞= ∫ ∫ (variables continuas).

Como sucedía en el caso unidimensional, en ambas situaciones el resultado es un número y para que exista el valor esperado es necesario que la correspondiente serie o integral sean absolutamente convergentes. Veamos ahora las propiedades de la esperanza de una función de variables aleatorias: 1. Si ( , ) ( ) ( ),X Y g X h Yϕ = + entonces: [ ] [ ] [ ] [ ]( , ) ( ) ( ) ( ) ( )E X Y E g X h Y E g X E h Yϕ = + = +

Demostración (caso continuo):

[ ] [ ]( ) ( ) ( ) ( ) ( , )E g X h Y g x h y f x y dxdy+∞ +∞

−∞ −∞+ = + =∫ ∫

( ) ( , ) ( ) ( , )g x f x y dxdy h y f x y dxdy+∞ +∞ +∞ +∞

−∞ −∞ −∞ −∞= + =∫ ∫ ∫ ∫

( ) ( , ) ( ) ( , )x y y x

g x f x y dy dx h y f x y dx dy+∞ +∞ +∞ +∞

=−∞ =−∞ =−∞ =−∞

= + = ∫ ∫ ∫ ∫

[ ] [ ]( ) ( ) ( ) ( ) ( ) ( ) .X Yx yg x f x dx h y f y dy E g X E h Y

+∞ +∞

=−∞ =−∞= + = +∫ ∫

Aplicaciones: (1) [ ] [ ] [ ]E X Y E X E Y+ = + (2) [ ] [ ] [ ]E aX bY aE X bE Y+ = +

(3) [ ] [ ] [ ] [ ]1 1 2 2 1 1 2 2... ... n n n nE a X a X a X a E X a E X a E X+ + + = + + +

2. Si ( , ) ( ) ( )X Y g X h Yϕ = ⋅ y X e Y son variables aleatorias independientes entonces:

[ ] [ ] [ ] [ ]( , ) ( ) ( ) ( ) ( ) E X Y E g X h Y E g X E h Yϕ = ⋅ = ⋅

Demostración:

[ ]( ) ( ) ( ) ( ) ( , ) ( ) ( ) ( ) ( )X YE g X h Y g x h y f x y dxdy g x h y f x f y dxdy+∞ +∞ +∞ +∞

−∞ −∞ −∞ −∞⋅ = ⋅ = ⋅ =∫ ∫ ∫ ∫

[ ] [ ]( ) ( ) ( ) ( ) ( ) ( ) .X Yx yg x f x dx h y f y dy E g X E h Y

+∞ +∞

=−∞ =−∞= ⋅ = ⋅∫ ∫

Aplicaciones:

(1) [ ] [ ] [ ]E XY E X E Y= si X e Y son variables aleatorias independientes.

Page 40: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

40

(2) [ ] [ ] [ ] [ ]1 2 1 2n nE X X X E X E X E X= si 1 2, , , nX X X son variables aleatorias independientes.

(3) Si X e Y son dos variables aleatorias independientes y ,W X Y= + entonces la función

generatriz de momentos de W es igual al producto de las funciones generatrices de momentos de X y de Y:

( ) ( )( )

por independencia de X e Y

( ) ( ) t X Y tX tY tX tYW X Y X YM t M t E e E e e E e E e M t M t+

+ = = = ⋅ = ⋅ = ⋅

5.3.7. Momentos de una distribución bidimensional Análogamente a como hacíamos en el caso unidimensional, podemos definir los momentos para variables aleatorias bidimensionales. Estos momentos reciben el nombre genérico de momentos cruzados o momentos producto. El momento cruzado de orden (r,s) con respecto al origen se define como:

[ ] para , 0,1, 2,... r srs E X Y r sµ′ = =

Es decir, dada una variable aleatoria bidimensional, se define el momento de orden (r,s) respecto al origen como:

( , )r srs

x yx y f x yµ′ =∑∑ para variables aleatorias discretas,

( , )r srs x y f x y dxdyµ

+∞ +∞

−∞ −∞

′ = ∫ ∫ para variables aleatorias continuas.

Obsérvese que rsµ′ no es más que la esperanza de una función particular ( , ) r sX Y X Yϕ = de las variables aleatorias X e Y. Por su parte, el momento cruzado de orden (r,s) con respecto a la media se define como:

[( ) ( ) ] para , 0,1, 2,... r srs X YE X Y r sµ µ µ= − − =

Es decir, dada una variable aleatoria bidimensional, se define el momento cruzado de orden (r,s) con respecto a la media como:

( ) ( ) ( , )r srs X Y

x yx y f x yµ µ µ= − −∑∑ para variables aleatorias discretas.

( ) ( ) ( , )r srs X Yx y f x y dxdyµ µ µ

+∞ +∞

−∞ −∞

= − −∫ ∫ para variables aleatorias continuas.

A partir de estas expresiones se puede obtener cualquier momento para una sola de las variables. Así, por ejemplo:

Page 41: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

41

[ ][ ]

1 010

0 101

2 0 220

0 2 202

2 0 2 220

0 2 2 202

[ ]

[ ]

[ ] [ ]

[ ] [ ]

[( ) ( ) ] [( ) ] ( )

[( ) ( ) ] [( ) ] ( )

x

y

X Y X X

X Y Y Y

E X Y E X

E X Y E Y

E X Y E XE X Y E YE X Y E X Var XE X Y E Y Var Y

µ µ

µ µ

µ

µ

µ µ µ µ σ

µ µ µ µ σ

′ = = =

′ = = =

′ = =

′ = =

= − − = − = =

= − − = − = =

Covarianza Uno de los momentos cruzados o momentos producto con respecto a la media más interesantes es el momento 11 :µ

11 [( )( )] ( , )X Y XYE X Y Cov X Yµ µ µ σ= − − = =

Este momento recibe el nombre de covarianza entre X e Y y puede expresarse en función de los momentos respecto al origen de la siguiente manera:

[ ] [ ] [ ]11 11 10 01 11 .X YE XY E X E Yµ µ µ µ µ µ µ′ ′ ′ ′= − = − = − La covarianza proporciona una medida de la dependencia o asociación lineal entre las variables, es decir, del grado de relación lineal existente entre ellas. Si, por ejemplo, se tiene una alta probabilidad de que valores grandes de X se encuentren asociados a valores grandes de Y, y pequeños de X a pequeños de Y, la covarianza será positiva. Por otro lado, si existe una alta probabilidad de que valores grandes de X se encuentren asociados con valores pequeños de Y o viceversa, la covarianza será negativa: Si Cov(X, Y) > 0 ⇒ relación lineal positiva

Si Cov(X, Y) < 0 ⇒ relación lineal negativa Propiedades de la covarianza: 1. Si X e Y son dos variables aleatorias independientes entonces ( ), 0.Cov X Y =

Demostración:

( ) [ ] [ ] [ ] [ ] [ ] [ ] [ ] porindependencia

, 0.Cov X Y E XY E X E Y E X E Y E X E Y= − = − =

Esta propiedad afirma que cuando dos variables aleatorias son independientes entonces su covarianza es cero. La inversa, sin embargo, no es siempre cierta, pues existen variables aleatorias que no son independientes y que tienen covarianza cero por presentar una relación no lineal exacta. Es, por tanto, una condición necesaria pero no suficiente:

Page 42: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

42

( )( )( )

e independientes , 0

, 0 no existe relación lineal pero no necesariamente independencia

, 0 e no son independientes.

X Y Cov X Y

Cov X Y

Cov X Y X Y

⇒ =

= ⇒

≠ ⇒

Esto nos indica que no podemos utilizar la covarianza como un test de independencia.

2. ( ) ( ), , .Cov X Y Cov Y X=

3. ( ) ( ), .Cov X X Var X= 4. ( ), 0,Cov X a = para cualquier constante a. 5. Si X e Y son dos variables aleatorias:

( ) ( ) ( ) ( )2 ,Var X Y Var X Var Y Cov X Y+ = + +

( ) ( ) ( ) ( ) 2 ,Var X Y Var X Var Y Cov X Y− = + − Si X e Y son independientes, dado que ( ), 0Cov X Y = se tiene que:

( ) ( ) ( )Var X Y Var X Var Y+ = +

( ) ( ) ( ) Var X Y Var X Var Y− = + Coeficiente de correlación lineal La covarianza puede ser utilizada como medida de intensidad de la relación lineal entre dos variables. Pero su valor se ve afectado por cambios de escala en las variables (cambios en las unidades de medida) y no está acotado ni inferior ni superiormente ( ( , ) ).Cov X Y−∞ ≤ ≤ +∞ Esto hace difícil determinar la intensidad de la relación. El coeficiente de correlación proporciona una medida adimensional de la fuerza de la relación lineal entre las variables, es decir, da una medida numérica del grado en que las variables están relacionadas linealmente. El coeficiente de correlación de X e Y viene dado por la siguiente expresión:

11

20 02

( , )( ) ( )

XYXY

X Y

Cov X YVar X Var Y

σ µρσ σ µ µ

= = =

Se puede demostrar que si Xσ y Yσ existen y son distintas de cero, entonces:

1 1XYρ− ≤ ≤

Page 43: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

43

La interpretación del coeficiente de correlación es la siguiente: - Si XYρ toma un valor próximo a la unidad, entonces existe una fuerte relación lineal entre

X e Y, que será directa o positiva si 0XYρ > e inversa o negativa si 0.XYρ <

- Si 1,XYρ = ± entonces existe relación lineal exacta entre X e Y (positiva o negativa, respectivamente).

- Si XYρ está próximo a cero, la relación lineal entre las variables es débil.

- Si 0XYρ = diremos que las variables no están correlacionadas linealmente, si bien puede

que exista una relación no lineal entre ellas. Si las variables aleatorias X e Y son independientes, entonces su correspondiente coeficiente de correlación es igual a 0, puesto que, como hemos visto anteriormente, independencia implica que 0 :XYσ =

0 0.XYXY

X Y X Y

σρσ σ σ σ

= = =

Al igual que ocurría con la covarianza, la proposición inversa no es cierta. Ejemplo: Sean las variables aleatorias X e Y con función de densidad conjunta:

0 1 , 0 1( , )

0 en el restox y x y

f x y+ < < < <

=

Calcule el coeficiente de correlación lineal.

XYXY

X Y

σρσ σ

=

Para calcular el coeficiente de correlación lineal necesitamos obtener las funciones de densidad marginales de las variables, para obtener sus respectivas desviaciones típicas y la covarianza:

121

00

1( ) ( , ) ( ) si 0 1 y 0 en el resto.2 2X y y

yf x f x y dy x y dy xy x x=

= = + = + = + < <

∫ ∫

[ ]13 21 1 1 2

0 0 00

1 1 7( )2 2 3 2 2 12X X

x x xE X xf x dx x x dx x dxµ = = = + = + = + =

∫ ∫ ∫

Page 44: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

44

12 4 31 1 12 2 2 3

0 0 00

1 1 5( )2 2 4 2 3 12X

x x xE X x f x dx x x dx x dx = = + = + = + =

∫ ∫ ∫

[ ]2

22 2 5 7 1112 12 144X E X E Xσ = − = − =

De manera similar, se tiene que:

121

00

1( ) ( , ) ( ) si 0 1 y 0 en el resto.2 2Y x x

xf y f x y dx x y dy xy y y=

= = + = + = + < <

∫ ∫

[ ]13 21 1 1 2

0 0 00

1 1 7( )2 2 3 2 2 12Y Y

y y yE Y yf y dy y y dy y dyµ = = = + = + = + =

∫ ∫ ∫

12 4 31 1 12 2 2 3

0 0 00

1 1 5( )2 2 4 2 3 12Y

y y yE Y y f y dy y y dy y dy = = + = + = + =

∫ ∫ ∫

[ ]2

22 2 5 7 1112 12 144Y E Y E Yσ = − = − =

Para calcular la covarianza necesitamos el momento cruzado (1,1) respecto al origen:

[ ] ( ) ( )1 1 1 1 1 1 2 2

0 0 0 0 0 0( , )E XY xyf x y dxdy xy x y dxdy x y xy dxdy= = + = + =∫ ∫ ∫ ∫ ∫ ∫

( )1 12 2 3 2 3 21 1 1 12 2

0 0 0 00 0

12 3 2 3 6 6 3

yx x

x xy

x y xy x x x xx y xy dy dx dx dx=

= =

= ==

= + = + = + = + = ∫ ∫ ∫ ∫

La covarianza viene dada por:

[ ] [ ] [ ] 1 7 7 13 12 12 144XY E XY E X E Yσ = − = − ⋅ = −

y el coeficiente de correlación:

11144 0,09.

1111 11144 144

XYXY

X Y

σρσ σ

−= = = − = −

Se concluye que existe una relación lineal inversa muy débil, ya que el coeficiente de correlación toma un valor muy próximo a cero.

Page 45: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

45

Línea de regresión La línea de regresión de Y sobre X es la esperanza condicionada de la variable Y dado un valor de la variable X. Concretamente, supongamos que X e Y son dos variables aleatorias con distribución conjunta f(x,y) y que la distribución condicional de Y, dado un valor X=x, la representamos por f(y/x). En este caso, a la esperanza condicionada de Y, dado un valor de X, [ ]/ ,E Y x se le conoce como línea de regresión de Y sobre X. Esta línea de regresión viene

dada para el caso de variables aleatorias continuas por:

[ ]( ) / ( / )x E Y x yf y x dyψ+∞

−∞

= = ∫

En general, la línea de regresión no es una constante sino que se trata de una función de x. Para cada valor concreto x, la función ( )ψ x proporciona el valor que esperado de Y dado ese valor de X. Si hubiéramos obtenido [ ]/ ,E X y es decir, la línea de regresión de X sobre Y, entonces la línea de regresión sería una función de y. Tanto en un caso como en otro, la línea de regresión puede entenderse como el lugar geométrico de las medias de las distribuciones condicionales, cuyas densidades vienen dadas por f(y/x) ó f(x/y). Téngase en cuenta que la línea de regresión no tiene porque ser una línea recta, puede tomar cualquier forma. Pero si lo fuera, entonces su expresión cuando condicionamos a X sería:

[ ]( ) / ( )YY XY X

X

x E Y x a bx xσψ µ ρ µσ

= = + = + −

que es una expresión similar a la manejada en Estadística Descriptiva. Por último, obsérvese que si X e Y son variables aleatorias independientes se tiene que

( / ) ( )Yf y x f y= y ( / ) ( )Xf x y f x= de manera que las líneas de regresión se corresponden con las esperanzas no condicionadas y, por tanto, con constantes:

[ ][ ]

( ) / [ ]

( ) / [ ]

x E Y x E Y

y E X y E X

ψ

ψ

= =

= =

Page 46: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

46

EJERCICIOS RESUELTOS

1. Una variable aleatoria X tiene la siguiente función de densidad:

2

0 6( ) 90 en el resto

kx xf x

≤ ≤=

Se pide: a) Indique si se trata de una variable discreta o continua. b) Determine el valor de k para que f(x) sea función de densidad. Represente dicha

función. c) Obtenga la función de distribución de X y represéntela gráficamente. d) Calcule las siguientes probabilidades: ( ) ( ) ( )0 1 ; 3 ; 2 .P X P X P X< ≤ > < e) Halle la media, la mediana y la moda de la distribución. f) Obtenga la varianza, la desviación típica y el coeficiente de variación.

Resolución: a) Tipo de variable: La variable X es continua puesto que su función de densidad toma valores distintos de cero en un intervalo de la recta real: 0 6.x≤ ≤

b) Valor de k y representación gráfica:

Deduciremos el valor de k teniendo en cuenta las propiedades que debe cumplir f(x) para ser función de densidad:

1) 2

( ) 0 0.9

kxf x k= ≥ ⇒ ≥

2) -

( ) 1f x dx+∞

=∫

66 2 3 3 3

- 0 0

6 0 11 ( ) 8 9 9 3 9 3 3 8

kx k x kf x dx dx k k+∞

= = = = − = ⇒ =

∫ ∫

Por tanto, la función de densidad es:

2

0 6( ) 720 en el resto

x xf x

≤ ≤=

Su representación gráfica es:

Page 47: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

47

-0,1

0,0

0,1

0,2

0,3

0,4

0,5

0,6

-2 -1 0 1 2 3 4 5 6 7 8

f(x)

x

c) Función de distribución y representación gráfica:

( )0

0 si 0

( ) ( ) si 0 6

1 si 6

x

x

F x P X x f t dt x

x

<= ≤ = ≤ ≤ >

donde:

2 33

0 0 0

1 1( )72 72 3 216

xx x t tf t dt dt x

= = =

∫ ∫

Por tanto:

3

0 si 01( ) si 0 6

2161 si 6

x

F x x x

x

<= ≤ ≤

>

Su representación gráfica es:

Page 48: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

48

-0,2

0,0

0,2

0,4

0,6

0,8

1,0

1,2

-2 -1 0 1 2 3 4 5 6 7 8

F(x)

x

d) Cálculo de probabilidades: Recordemos que, por ser X una variable aleatoria continua, se cumple que:

( ) ( ) ( ) ( )P a X b P a X b P a X b P a X b≤ ≤ = ≤ < = < ≤ = < <

• ( ) 10 1 (1) (0) (1)216

P X F F F< ≤ = − = =

• ( ) ( )333 1 3 1 (3) 1 0,875

216P X P X F> = − ≤ = − = − =

• ( )3

0

22 ( 2 2) ( 2) ( 2) (2) 0,037216

P X P X P X P X F=

< = − < < = ≤ − ≤ − = = =

e) Media, mediana, moda:

• [ ]66 2 4 4

0 0

1 6( ) 4,572 72 4 4 72x xE X xf x dx x dxµ

+∞

−∞

= = = = = = ⋅

∫ ∫

• La Mediana (Me) es el valor de la variable que cumple la condición:

( ) ( ) 0,5P X Me F Me≤ = =

( )31( ) 0,5 4,76216

F Me Me Me= = ⇒ =

• La moda (Mo) es el valor de la variable para el que la función de densidad alcanza su valor

máximo. De la inspección de la representación gráfica de esta función se deduce que 6.Mo =

Page 49: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

49

f) Varianza, desviación típica y coeficiente de variación:

• ( )66 2 5

2 2 2 2 2 2

0 0

1(4,5) (4,5) 1,3572 72 5x xVar X E X x dxσ µ

= = − = − = − =

• ( ) ( ) 1,35 1,162Desv X Var Xσ = = + = + =

• 1,162100 100 25,82%.4,5

CV σµ

= ⋅ = ⋅ =

Page 50: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

50

2. Obtenga la función generatriz de momentos y, a través de ella, la media y la varianza de la variable aleatoria continua con función de densidad:

0

( )0 en el resto

xe xf x

− >=

Resolución: • Función generatriz de momentos:

( 1) ( 1)00

0 0 0

si 11( ) 1 1 11 si 1

1 1 1

tx tx x x t x tX

tM t E e e e dx e dx e

t e e tt t t

+∞ +∞+∞− − −

+∞−∞

+∞ ≥ = = = = = − − = − = < − − −

∫ ∫

El valor de la variable auxiliar t que nos interesa para el cálculo de los momentos de la distribución es 0,t = que cumple la condición t<1. Por tanto, la función generatriz de momentos es:

1( ) 1XM t

t=

• Media:

[ ] (0)XE X Mµ ′= =

2 2

( 1) 1( )(1 ) (1 )XM t

t t−′ = − =− −

(0) 1XMµ ′= =

• Varianza:

( )2 2 22 (0)XVar X Mσ µ µ µ′ ′′= = − = −

4

2(1 )( ) (0) 2(1 )X X

tM t Mt−′′ ′′= − =−

2 2 2

2 2 1 1.σ µ µ′= − = − =

Page 51: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

51

3. La demanda diaria de un determinado producto (X, en miles de unidades) sigue la ley de probabilidad definida por la siguiente función de densidad:

1 0 2( ) 2

0 en el resto.

x xf x

− ≤ ≤=

Se pide: a) Determine la probabilidad de que la demanda diaria:

a.1) no supere las 3500 unidades. a.2) esté comprendida entre 635 y 1870 unidades.

b) Determine la mediana de X y explique su significado con respecto a la demanda del artículo.

Resolución:

"demanda diaria de un artículo (miles de unidades)"X =

1 0 2( ) 2

0 en el resto.

x xf x

− ≤ ≤=

a) Determinación de probabilidades: • ( )3,5 1P X ≤ = , ya que 3,5 es mayor que el límite superior del intervalo en el que la

función de densidad toma valores no negativos ( 0 2x≤ ≤ ).

• ( )1,8701,870 2

0,635 0,635

0,635 1,870 1 0,462.2 4x xP X dx x

≤ ≤ = − = − = ∫

b) Mediana

La mediana (Me) es el valor de la variable que cumple que ( ) 0,5 :F Me =

2 2

0 0

( ) 12 4 4

xx t t xF x dt t x = − = − = −

2

dossoluciones

2, 41( ) 0,5

0,5864xxF x xx=

= − = ⇒ =

De la condición que satisface la mediana se obtienen dos soluciones, pero se descarta el valor x=2,41 por situarse fuera del intervalo 0 2x≤ ≤ , en el que la función de densidad toma valores no nulos. Por tanto, 0,586.Me = La probabilidad de que la demanda diaria sea menor o igual que 586 unidades es del 50%. Dicho de otro modo, esa es la cantidad que habría que poner cada día a la venta para tener una probabilidad del 50% de satisfacer la demanda.

Page 52: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

52

4. En una determinada Comunidad Autónoma hay un millón de trabajadores en paro. Un estudio estadístico asegura que la duración en semanas (variable X) está bien modelizada por la siguiente distribución:

6

5

2 0( )0 en el resto.

k xf x x

< < < ∞=

Se pide: a) Obtenga el valor de k. b) Se desea pagar un subsidio especial a los parados de muy larga duración. ¿A partir de

qué semana de permanencia en paro deberá pagarse para que cubra al 20% de los parados que llevan más semanas en paro?

c) El 40% de los trabajadores en paro son mujeres y la probabilidad de permanecer en paro más de tres semanas es de 0,25 para las mujeres. ¿Cuál es la probabilidad de permanecer en paro más de tres semanas para los hombres?

d) ¿Cuál es la duración media del paro en esta Comunidad Autónoma? ¿Cuántos trabajadores en paro es probable que tengan una permanencia en paro menor a la media?

Resolución: a) Valor de k:

Deduciremos el valor de k teniendo en cuenta las propiedades que debe cumplir f(x) para ser función de densidad:

1) 6

5

2( ) 0 0.f x kx

= ≥ ⇒ ≥

2) -

( ) 1f x dx+∞

=∫

6 5 1 4 46 6 4 4

5 4-

2 21 ( ) 2 2 2 25 1 4 k

k k k

x xf x dx dx x kx k

+∞ +∞+∞ +∞ − + −+∞−

= = = = = − = ⇒ = − + −

∫ ∫

b) Valor *x tal que *( ) 0, 2 :P X x≥ = Tengamos en cuenta, por tratarse de una variable aleatoria continua, se tiene que:

( ) 1 ( ) 1 ( ).P X x P X x F x≥ = − < = − La función de distribución viene dada por:

6 5 1 4 46 6 4 4

5 42- 2 2 2

2 2( ) ( ) 2 2 2 1 .5 1 4

x xx xxt tF x f t dt dt t

t x

− + −−

= = = = = − = − − + −

∫ ∫

Por tanto,

4* * *

*4

2( ) 0,2 ( ) 0,8 1 0,8 3 semanas. P X x F x xx

≥ = ⇒ = ⇒ − = ⇒

Debe pagarse el subsidio a partir de las tres semanas en paro, para cubrir al 20% de parados con mayor duración en el desempleo.

Page 53: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

53

c) ( 3 / ) :P X H> Definición de sucesos y datos:

"mujer desempleada" ( ) 0,4 ( 3 / ) 0,25"hombre desempleado" ( ) 1 ( ) 0,6

M P M P X MH P H P M

= = > == = − =

Se pide ( 3 / ).P X H> Aplicando el Teorema de la Probabilidad Total se tiene que:

( 3) ( 3 / ) ( ) ( 3 / ) ( )P X P X H P H P X M P M> = > ⋅ + > ⋅ Por los cálculos efectuados en el apartado anterior se sabe que ( 3) 0,2.P X > = Por tanto, 0, 2 ( 3 / ) 0,6 0,25 0,4 ( 3 / ) 0,166P X H P X H= > ⋅ + ⋅ ⇒ > = d) Duración media del paro y número de trabajadores con duración de paro inferior a la

media: • Duración media del paro:

[ ]6 4 1

65

2 2

2( ) 2 2,67 semanas4 1

xE X xf x dx x dxx

+∞+∞ +∞ − +

−∞

= = = = − + ∫ ∫

• Número de trabajadores con duración de paro inferior a la media:

Primero calcularemos la proporción de trabajadores desempleados con duración de paro inferior a la media:

( ) ( )( )

4

4( ) calculada

en el apartado b)

22,67 2,67 1 0,6852,67F x

P X F< = = − =

Teniendo en cuenta que existe un millón de desempleados, el número de trabajadores con duración de paro inferior a la media es 685000 trabajadores ( )1000000 0,685 .⋅

Page 54: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

54

5. La distribución conjunta de dos variables aleatoria X e Y viene dada por la siguiente función de cuantía:

2(2 3 ) 0,1,2; 1, 2; 3( , )

0 en el resto.c x y x y x y

f x y + = = + ≤

=

Se pide: a) El valor de c para que ( , )f x y sea función de cuantía. b) La función de cuantía marginal de X. c) Calcule las siguientes probabilidades:

( ) ( ) ( ) ( )2 3 2, 1 2, 2P X P X P X Y P X Y= = = = = = d) Determine la distribución de probabilidad de la variable Y condicionada por el valor 0

de X. ¿Son las variables X e Y independientes? Resolución: a) Valor de c: Deduciremos el valor de c teniendo en cuenta las propiedades que debe cumplir ( , )f x y para ser función de densidad:

1) 2( , ) (2 3 ) 0 0.f x y c x y c= + ≥ ⇒ ≥

2) 2( , ) 1 (2 3 ) 1x y x y

f x y c x y= ⇒ + =∑∑ ∑∑

Para obtener el valor de c que cumple esta segunda condición es conveniente ayudarnos de una tabla de probabilidades conjuntas. A la hora de construirla es necesario tener presente que los valores de X y de Y con probabilidad no nula son 0,1,2; 1, 2 con 3x y x y= = + ≤ :

1 2 0 3c 6c 1 5c 8c 2 11c 0

La suma de esas probabilidades conjuntas tiene que ser igual a la unidad. Por tanto:

1 2

13 5 11 6 8 1 33Y Y

c c c c c c= =

+ + + + = ⇒ =

b) Función de densidad marginal de X:

( ) ( , )Xy

f x f x y=∑

Para x=0 y x=1: 2

2 2 2 2

1

1 1 1( ) (2 3 ) 2 3 2 6 4 933 33 33

y

Xy

f x x y x x x=

=

= + = + + + = + ∑

Para x=2: [ ]1 11 1( ) (2,1) 8 333 33 3Xf x f= = + = =

X Y

Page 55: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

55

Obsérvese que se cumple que ( ) 1.X

xf x =∑

c) Cálculo de probabilidades:

( )

( )

( )

( )

12 (2)3

3 (3) 012, 1 (2,1)3

2, 2 0

X

X

P X f

P X f

P X Y f

P X Y

= = =

= = =

= = = =

= = =

d) ( / 0).f Y x = ¿Son las variables independientes?

3(0, ) 133( / 0) para 1, 2 y 0 en el resto.9(0) 3

33X

yf yf Y x y yf

= = = = =

• Las variables son independientes si se cumple cualquiera de estas tres condiciones para

todo x y para todo y:

1) ( , ) ( ) ( ) 2) ( ) ( / ) 3) ( ) ( / )X Y X Yf x y f x f y f x f X Y y f y f Y X x= ⋅ = = = =

Si encontramos un par de valores ( ),x y para los que no se cumplen concluiremos que las variables no son independientes. Para el par (2,1) se tiene que:

1( 2, 1) (2,1) [apartado c)]3

P X Y f= = = =

( ) 12 (2) [apartado c)]3XP X f= = =

( )2 2

2

0 0

1 191 (1) ( , ) (2 3)33 33

x x

Yx x

P Y f f x y x= =

= =

= = = = + =∑ ∑

Vemos que 1 1 19(2,1) (2) (1) .3 3 33X Yf f f= ≠ ⋅ = ⋅ Por tanto, las variables aleatorias no son

independientes.

Page 56: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

56

6. Las variables aleatorias X e Y representan, respectivamente, las cuotas de mercado de dos productos A y B fabricados por una misma empresa. Supongamos que su función de densidad conjunta es:

0 1; 0 1

( , )0 en el resto.x y x y

f x y+ ≤ ≤ ≤ ≤

=

Se pide: a) Compruebe que ( , )f x y es función de densidad. b) Calcule los valores esperados de las cuotas de mercado. Proporcione sendas medidas

relativas de dispersión y comente los resultados. c) Obtenga la probabilidad de que la cuota de mercado del producto A sea igual a la cuota

de mercado del producto B y ambas iguales a 0,5. d) Obtenga la función de densidad de la cuota de mercado del producto A condicionada a

una cuota de mercado para el producto B de 0,5. e) ¿Son las cuotas de mercado de ambos productos independientes entre sí? f) Obtenga el coeficiente de correlación lineal entre las variables. Comente el resultado. g) ¿Cuál sería el valor esperado de la cuota de mercado del producto B para una cuota de

mercado del 20% para el producto A? Resolución: a) Comprobación de que ( , )f x y es función de densidad: Debemos comprobar si ( , )f x y cumplen las siguientes condiciones:

1) ( , ) 0.f x y ≥ Se cumple para 0 1; 0 1x y≤ ≤ ≤ ≤

2) ( , ) 1.x y

f x y dxdy =∫ ∫ Se cumple ya que:

1 111 1 12 2

0 0 0 00 0

1 1( , ) ( ) 12 2 2 2

y xyx x x

x y x y x xy x

y xf x y dxdy x y dxdy xy dx x dx x= === = =

= = = == =

= + = + = + = + = ∫ ∫ ∫ ∫ ∫ ∫

Por tanto, ( , )f x y es función de densidad.

b) Valores esperados de las cuotas de mercado y medidas relativas de dispersión.

• Valor esperado de la cuota de mercado del producto A:

121

00

1( ) ( , ) ( ) si 0 1 y 0 en el resto.2 2X y y

yf x f x y dy x y dy xy x x=

= = + = + = + < <

∫ ∫

[ ]13 21 1 1 2

0 0 00

1 1 7( )2 2 3 2 2 12X X

x x xE X xf x dx x x dx x dxµ = = = + = + = + =

∫ ∫ ∫

• Coeficiente de variación de X:

Page 57: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

57

12 4 31 1 12 2 2 3

0 0 00

1 1 5( )2 2 4 2 3 12X

x x xE X x f x dx x x dx x dx = = + = + = + =

∫ ∫ ∫

[ ]2

22 2 5 7 1112 12 144X E X E Xσ = − = − =

11

11144100 100 100 47,38%7 712

XX

X

CV σµ

+ += ⋅ = ⋅ = ⋅ =

De manera similar, podemos obtener la cuota de mercado esperada del producto B y su coeficiente de variación. Pero si observamos que en la función de densidad conjunta las dos variables “entran” de la misma forma, podemos concluir por “simetría” que las dos variables tienen las mismas características (posición, dispersión, etc.). Por tanto:

1( ) si 0 1 y 0 en el resto.2Yf y y y= + < <

[ ] 712YE Y µ= = 2 5

12E Y = 2 11

144Yσ = 100 47,38%YY

Y

CV σµ

= ⋅ =

Vemos que en ambos casos la desviación típica supone menos del 50% de la media, por lo que concluimos que ambas cuotas medias son representativas de sus respectivas distribuciones. c) ( 0,5; 0,5)P X Y= = Teniendo en cuenta que las variables aleatorias son continuas, la probabilidad solicitada es igual a cero. d) ( / 0,5) :f x Y =

( , )( / ) 0 1 0 11( )2

Y

f x y x yf x y x yf y y

+= = ≤ ≤ ≤ ≤

+

1

12( / 0,5) 1 1 22 2

xf x Y x

+= = = +

+ para 0 1x≤ ≤

e) Comprobación de independencia: Las variables son independientes si se cumple cualquiera de estas tres condiciones para todo x y para todo y:

1) ( , ) ( ) ( ) 2) ( ) ( / ) 3) ( ) ( / )X Y X Yf x y f x f y f x f X Y y f y f Y X x= ⋅ = = = =

Page 58: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

58

Comprobemos si se cumple la primera de ellas:

1 1 ( ) ( ) ( , )2 2X Yf x f y x y x y f x y ⋅ = + + ≠ + =

Por tanto, las cuotas de mercado no son independientes. f) Coeficiente de correlación lineal:

XYXY

X Y

σρσ σ

= donde [ ]XY X YE XYσ µ µ= −

[ ] ( ) ( )1 1 1 1 1 1 2 2

0 0 0 0 0 0( , )E XY xyf x y dxdy xy x y dxdy x y xy dxdy= = + = + =∫ ∫ ∫ ∫ ∫ ∫

( )1 12 2 3 2 3 21 1 1 12 2

0 0 0 00 0

12 3 2 3 6 6 3

yx x

x xy

x y xy x x x xx y xy dy dx dx dx=

= =

= ==

= + = + = + = + = ∫ ∫ ∫ ∫

La covarianza viene dada por:

[ ] [ ] [ ] 1 7 7 13 12 12 144XY E XY E X E Yσ = − = − ⋅ = −

y el coeficiente de correlación:

11144 0,09.

1111 11144 144

XYXY

X Y

σρσ σ

−= = = − = −

Las variables presentan una asociación lineal negativa pero muy débil, puesto que el coeficiente está muy próximo a cero. g) [ ]/ 0, 2E Y x = Se solicita el valor que toma la línea de regresión de Y sobre X para x=2. Vamos a obtener la expresión de la línea de regresión y después particularizaremos para ese valor:

[ ]/ / ( / )Y Xy

E Y X yf y x dyµ = = ∫

( , )( / ) 0 1 0 11( )

2X

f y x x yf y x x yf x x

+= = ≤ ≤ ≤ ≤

+

Page 59: Variable aleatoria y Modelos probabilísticos

Estadística I - TEMA 5: Variable Aleatoria GADE - Curso 2014/2015

59

11 1 2 3

/0 0 0

1 1 1 1 3 2( )1 1 1 12 3 2 3 6 32 2 2 2

yy y

Y Xy y y

x y y y x xy dy y x y dy xxx x x x

µ== =

= = =

+ + = = + = + = + = + + + + +∫ ∫

Por tanto, /3 26 3Y X

xx

µ +=

+ para 0 1.x≤ ≤ Obsérvese que la línea de regresión no es una línea

recta. Para x=2 se tiene que:

[ ] / 0,23 0,2 2/ 0,2 0,619.6 0,2 3Y XE Y x µ =

⋅ += = = =

⋅ +

Vemos que la cuota de mercado esperada del producto B dada una cuota de mercado del 20% para el producto A es del 61,9%.