UNIDAD 5: UTILICEMOS PROBABILIDADES. Distribuciones de probabilidad Introducción Estudiaremos aquí en qué consiste una distribución de probabilidades y los distintos tipos de variables que aparecen en el trabajo con probabilidad. Además, se conocerán con cierto detalle dos tipos de distribución de probabilidad: la binomial, como distribución especial de variable discreta, y la normal, como principal de las distribuciones probabilísticas para variable continua. El tema de las distribuciones implica no sólo conocer sus peculiaridades, sino también calcular probabilidades. El caso de la distribución normal supone obtener probabilidades con ayuda de la tabla, la cual tendrá que ser manejada con soltura. La distribución normal es la más importante por su gran utilidad en la inferencia estadística y porque son muchas las variables que siguen o se aproximan a su patrón entre otros aspectos. Objetivos: Que el alumno o la alumna pueda: 1. Definir una distribución de probabilidades 2. Distinguir entre variable discreta y variable continua. 3. Obtener probabilidades para valores específicos de la variable 4. Enlistar características de una distribución normal 5. Definir y calcular valores de z 6. Determinar la probabilidad de que una observación esté entre dos puntos, utilizando la distribución normal estándar 7. Determinar la probabilidad de que una observación esté por arriba o por abajo de un valor, utilizando la . . distribución normal estándar. 1. Tipos de variable En primer año vimos que una variable cuantitativa puede ser discreta o continua. Una variable discreta es aquella que sólo puede tomar ciertos valores. Por ejemplo, cuando a alguien se le pregunta cuántos hermanos tiene, responderá con números enteros: 1, 2, 3, 4... No podrá responder diciendo que tiene tres y medio hermanos. Una variable continua es aquella que puede tomar cualquier valor dentro de un intervalo. Este valor depende de la precisión del instrumento de medición. Para el caso, si se pregunta por la masa de una barra de oro, la respuesta puede ser 4.0524 kilogramos. O si se pregunta por la estatura, la respuesta puede ser 1.75 metros. En el caso de un automóvil que se mueve de 60 km/h a 80 km/h, éste pasa por infinitas velocidades. Lo que se debe tener presente es que en una variable continua no hay saltos: no pasamos de 2 a 3, sino que podemos tomar cualquier valor entre 2 y 3; por ejemplo 2.25 Objetivos conceptuales. Conceptualizar qué es una variable discreta y qué es una variable continua. Objetivos procedimentales. Dada una variable, determinar si es continua o discreta.
16
Embed
UNIDAD 5: UTILICEMOS PROBABILIDADES · Obtener probabilidades para valores específicos de la variable 4. Enlistar características de una distribución normal 5. Definir y calcular
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
UNIDAD 5: UTILICEMOS PROBABILIDADES.
Distribuciones de probabilidad
Introducción
Estudiaremos aquí en qué consiste una distribución de probabilidades y los distintos tipos de variables
que aparecen en el trabajo con probabilidad. Además, se conocerán con cierto detalle dos tipos de
distribución de probabilidad: la binomial, como distribución especial de variable discreta, y la normal,
como principal de las distribuciones probabilísticas para variable continua.
El tema de las distribuciones implica no sólo conocer sus peculiaridades, sino también calcular
probabilidades. El caso de la distribución normal supone obtener probabilidades con ayuda de la tabla, la
cual tendrá que ser manejada con soltura.
La distribución normal es la más importante por su gran utilidad en la inferencia estadística y porque son
muchas las variables que siguen o se aproximan a su patrón entre otros aspectos.
Objetivos:
Que el alumno o la alumna pueda:
1. Definir una distribución de probabilidades 2. Distinguir entre variable discreta y variable continua. 3. Obtener probabilidades para valores específicos de la variable 4. Enlistar características de una distribución normal
5. Definir y calcular valores de z
6. Determinar la probabilidad de que una observación esté entre dos puntos, utilizando la distribución
normal estándar
7. Determinar la probabilidad de que una observación esté por arriba o por abajo de un valor, utilizando
la . . distribución normal estándar.
1. Tipos de variable .
En primer año vimos que una variable cuantitativa puede ser discreta o continua.
Una variable discreta es aquella que sólo puede tomar ciertos valores. Por ejemplo,
cuando a alguien se le pregunta cuántos hermanos tiene, responderá con números
enteros: 1, 2, 3, 4... No podrá responder diciendo que tiene tres y medio hermanos.
Una variable continua es aquella que puede tomar cualquier valor dentro de un
intervalo. Este valor depende de la precisión del instrumento de medición.
Para el caso, si se pregunta por la masa de una barra de oro, la respuesta puede ser
4.0524 kilogramos. O si se pregunta por la estatura, la respuesta puede ser 1.75
metros. En el caso de un automóvil que se mueve de 60 km/h a 80 km/h, éste pasa
por infinitas velocidades.
Lo que se debe tener presente es que en una variable continua no hay saltos: no
pasamos de 2 a 3, sino que podemos tomar cualquier valor entre 2 y 3; por ejemplo
2.25
Objetivos conceptuales. Conceptualizar qué es una variable discreta y qué es una variable continua. Objetivos procedimentales. Dada una variable, determinar si es continua o discreta.
Una forma fácil para determinar si una variable es discreta o continua es la
siguiente: si es el resultado de contar es discreta; y si es el resultado de medir es
continua.
2. Distribución de probabilidades .
Se tiene una distribución de probabilidades cuando se conocen todos los valores posibles que
una variable aleatoria puede tomar y la probabilidad de cada uno de esos valores.
Gildaberto Bonilla nos presenta el ejemplo del lanzamiento de 4 monedas, o lo que es lo mismo,
lanzar 4 veces una moneda. El diagrama de árbol nos da todos los posibles resultados:
Si la variable aleatoria es el aparecimiento de cara en los 4 lanzamientos, dicha
variable toma los siguientes valores: 0, 1, 2, 3 ó 4. Es decir, puede NO aparecer una
cara o pueden aparecer 1, 2, 3 ó 4. Al observar los 16 casos, vemos que sólo en un
caso no aparece la cara, y sólo en un
caso aparecen las 4. También
observamos que 2 caras aparecen en 6
casos. En la tabla siguiente se resume
el resultado.
No de caras Casos Probabilidad
0 1 1 / 16
1 4 4 / 16
2 6 6 / 16
3 4 4 / 16
4 1 1 / 16
Esta es una distribución de probabilidades, dado que se conocen
todos los valores posibles que la variable aleatoria puede tomar y
la probabilidad de cada uno de esos valores. Para nuestro caso, la
probabilidad de cada evento es 1/16, pues existen 16 posibles
resultados. La probabilidad es la misma para todos porque son
eventos independientes.
Es oportuno aclarar que 2 eventos son independientes cuando el
resultado de uno no influye en el resultado del otro. Por ejemplo,
si al lanzar un dado obtenemos 4, este resultado no influye en el
segundo lanzamiento, que también nos puede dar 4. Distinto es
sacar una canica de una urna de 5 y no devolverla. En la segunda
extracción, habrá sólo 4 canicas, lo que influirá en el resultado.
No es lo mismo sacar una canica de un total de 5, que de un total
de 4.
Cara: Corona:
Los datos de la tabla aparecen en un
diagrama de barras, que se utiliza para
variables discretas.
6
5
4
3
2
1
0 1 2 3 4
Objetivos conceptuales. Comprender lo que es una distribución de probabilidades y lo que son eventos independientes
Es importante hacer notar que la suma de
las probabilidades es la unidad: 1/16 + 4/16 + 6/16 + 4/16 + 1/16 =
(1 + 4 + 6 + 4 + 1)/16 = 16/16 = 1
Es importante recalcar que la variable aparecimiento de cara es una variable
discreta, pues toma valores enteros. La cara puede aparecer CERO veces, o también
1, 2, 3 ó 4 veces. Pero nunca aparecerá una vez y media (1.5)
3. Distribución binomial .
En el ejemplo del lanzamiento de la moneda, existen sólo 2 posibilidades: cara o
corona. Además, la probabilidad para cada evento es la misma: 1/16. Esto se debe a
que son eventos independientes. Cuando se dan estas 2 condiciones se dice que se
trata de un experimento binomial, o de una distribución binomial.
Otra distribución binomial es la de hacer una extracción de una canica blanca, con
reemplazo, de una urna con 5 canicas: 2 blancas y 3 negras. En este caso sólo hay 2
posibilidades: blanca o negra. Además, la probabilidad de que sea blanca es
SIEMPRE 2/5, pues son eventos independientes (la canica se remplaza: vuelve a la
urna)
Si P es la probabilidad de éxito y Q la probabilidad de fracaso, entonces Q = 1 – P.
Para nuestro caso Q = 1 – 2/5 = 3/5.
Volvamos a la urna y hagamos 10 extracciones (con reemplazo), ¿cuál será la probabilidad de
tener éxito en 3 ocasiones?... Se calcula de la siguiente manera:
10!
Para este caso específico, se tiene que: = 120 (2/5)3 (3/5)
7 = 0.215
En general, la probabilidad de tener éxito x veces en n experimentos es:
En la tabla siguiente se muestran las probabilidades para diversos números de éxitos.
Exitos Probabilidad
0 0.006
1 0.04
2 0.121
3 0.215
4 0.251
5 0.2
6 0.111
10 C 3 P
3 Q
10 – 3
3! (10 – 3)!
10 C 3 P
3 Q
10 – 3
P(x) = n C x P
x Q
n – x
Recordemos que: 10 C 3 =
Objetivos conceptuales. Conceptualizar lo que es una distribución binomial. Objetivos procedimentales. Calcular la probabilidad en una distribución normal
Objetivos actitudinales. Reflexionar sobre los eventos de la vida cotidiana que implican eventos probabilísticos.
7 0.042
8 0.01
9 0.001
10 0.0001
Ejemplo. Resolver cada caso.
1. En una urna hay 20 canicas: 10 blancas y 10 negras. Si se hacen 10 extracciones (con reemplazo),
encontremos las probabilidades de obtener cero blanca, una blanca, dos blancas... 10 blancas.
2. Se lanza una moneda 5 veces, encontremos las probabilidades de obtener de cero a 5 caras _______
3. Un tirador con arco tiene una probabilidad de 0.8 de dar en el blanco. Si hace 12 disparos, cuál es la
probabilidad de acertar 10 veces _______
4. En una urna hay 20 canicas: 8 blancas, 7 negras y 5 rojas. ¿Cuál es la probabilidad de obtener 3
blancas en 5 extracciones? _______
4b. En una urna hay 20 canicas: 7 blancas, 6 negras y 7 rojas. ¿Cuál es la probabilidad de obtener 3
blancas en 5 extracciones? _______
4c. En una urna hay 20 canicas: 6 blancas, 6 negras y 8 rojas. ¿Cuál es la probabilidad de obtener 3
blancas en 5 extracciones? _______
4d. En una urna hay 20 canicas: 5 blancas, 6 negras y 9 rojas. ¿Cuál es la probabilidad de obtener 3
blancas en 5 extracciones? _______
Solución.
El total de extracciones es 10. Esto implica 10 experimentos: n = 10. Necesitamos tener
desde cero éxito hasta 10 éxitos. Es decir que x variará desde cero hasta 10. Además, la
probabilidad de éxito en cada evento es 0.5, pues hay 10 blancas y 10 negras. Es decir que P =
0.5 y Q = 0.5 En la tabla siguiente se encuentran las probabilidades para cada valor de x.
Blancas Probabilidad
0 0.001
1 0.01
2 0.044
3 0.117
4 0.205
5 0.246
6 0.205
7 0.117
8 0.044
9 0.01
10 0.001
Se lanza 5 veces: n = 5. x variará desde cero hasta 5. En cada evento, la probabilidad de
obtener una cara es 0.5 En la tabla se muestra la probabilidad para cada x,.
Caras Probabilidad
0 0.031
1 0.156
2 0.312
Es importante observar cómo se distribuyen las probabilidades. Vemos que son iguales la probabilidad de: 0 y 10, 1 y 9, 2 y 8, 3 y
7, 4 y 6. Para x = 5 se obtiene la máxima probabilidad. Esta forma
se debe a que la probabilidad de blanca y de negra son iguales: 0.5 Al graficar los pares ordenados (éxito, probabilidad), utilizando líneas, se obtiene lo siguiente:
Observemos de nuevo cómo se
repiten las probabilidades: 0 y 5, 1
y 4, 2 y 3.
3 0.312
4 0.156
5 0.031
En este caso n = 12: número de disparos. Necesitamos conocer la probabilidad de acertar 10
veces; es decir que x = 10. Como la probabilidad de acierto es 0.8, entonces P = 0.8; por lo
tanto
Q = 0.2
Se tiene n C x P
x Q
n – x = 12 C 10 P
10 Q
2 = 66(0.8)
10 (0.2)
2 = 0.283
Vemos que hay 8 canicas blancas, 7 negras y 5 rojas. Se podría pensar en 3 posibilidades:
blanca, negra o roja. Pero se reducen a 2 posibilidades: es blanca o no es blanca. La
probabilidad de que salga una blanca es 8/20 = 0.4, P = 0.4 Se realizarán 5 extracciones: n = 5.
Se necesita saber la probabilidad de que en 3 de ellas salga una blanca.
Se tiene n C x P
x Q
n – x = 5 C 3 P
3 Q
5
-3 = 10 (0.4)
3 (0.6)
2 = 0.2304
Actividad 1. Resuelve cada caso.
1. En una urna hay 10 canicas: 2 blancas y 8 negras. Si se hacen 12 extracciones, cuál es la
probabilidad de sacar una blanca en 3 ocasiones. ___________________
2. En una urna hay 10 canicas: 2 blancas y 8 negras. Si se hacen 12 extracciones, cuál es la
probabilidad de sacar una blanca en 4 ocasiones. ___________________
3. En una urna hay 10 canicas: 2 blancas y 8 negras. Si se hacen 12 extracciones, cuál es la
probabilidad de sacar una blanca en 5 ocasiones. ___________________
4. En una urna hay 10 canicas: 2 blancas y 8 negras. Si se hacen 12 extracciones, cuál es la
probabilidad de sacar una blanca en 6 ocasiones. ___________________
5. En una urna hay 10 canicas: 3 blancas y 7 negras. Si se hacen 12 extracciones, cuál es la
probabilidad de sacar una blanca en 3 ocasiones. ___________________
6. En una urna hay 10 canicas: 4 blancas y 6 negras. Si se hacen 12 extracciones, cuál es la
probabilidad de sacar una blanca en 3 ocasiones. ___________________
7. En una urna hay 10 canicas: 5 blancas y 5 negras. Si se hacen 12 extracciones, cuál es la
probabilidad de sacar una blanca en 3 ocasiones. ___________________
8. En una urna hay 10 canicas: 6 blancas y 4 negras. Si se hacen 12 extracciones, cuál es la
probabilidad de sacar una blanca en 3 ocasiones. ___________________
9. Un tirador novato tiene 0.4 de probabilidad de dar en el círculo central de un disco de tiro. Si
hace 15 tiros ¿cuál es la probabilidad de que acierte en 6, 8 y 10 ocasiones? ___________________
___________________ ___________________
10. Un tirador medalla de oro tiene 0.2 de probabilidad de fracasar en dar en el círculo central
de un disco de tiro. Si hace 8 tiros ¿cuál es la probabilidad de que acierte en 4 ocasiones?
___________________
11. Un basquetbolista falla 3 de cada 10 tiros libres al aro. Si efectúa 12 tiros, ¿cuál es la
probabilidad de que acierte en 5 ocasiones? ___________________
12. Se tiene un tablero con 6 orificios blancos, 5 negros y 7 rojos. Se lanza al tablero una canica
7 veces. ¿Cuál es la probabilidad de que caiga en un orificio negro en 3 ocasiones? ___________________
13. Se rifarán 5 objetos de entre 8 bicicletas, 5 cocinas, 12 ventiladores y 7 mesas. En una urna
se halla una bolita por cada premio. Si se hacen 5 extracciones (con reemplazo), ¿cuál es la
probabilidad de que salgan 2 ventiladores? ___________________
14. Un examen consta de 10 preguntas de selección múltiple. Por cada pregunta hay 5 opciones
y sólo una es la verdadera. ¿Cuál es la probabilidad de que una estudiante acierte 4 preguntas?
__________________
15. Un examen consta de 10 preguntas de selección múltiple. Por cada pregunta hay 4 opciones
y sólo una es la verdadera. ¿Cuál es la probabilidad de que una estudiante acierte 4 preguntas?
___________________
discusión 1. Se tienen en un cilindro 5 canicas blancas y 5 negras. Se hacen 5
extracciones y se obtiene para las blancas una probabilidad de 0.3125 ¿Cuántas veces salió la
blanca? _______________________
4. Distribución normal .
Recordemos el diagrama de barras de la página 28.
Se ha construido para una variable discreta. Si trazamos una curva por todos los
puntos superiores de cada barra, conseguimos una curva que se aproxima a la
siguiente:
Esta curva se obtiene para variables continuas. Se conoce como distribución normal o curva
normal. El estudio de esta curva se centra en el área que encierra.
Objetivos conceptuales. Comprender la distribución de probabilidades en una curva normal. Objetivos procedimentales. Calcular probabilidades en distribuciones normales.
Objetivos actitudinales. Reflexionar, después de leer el ejemplo, sobre la importancia del ejercicio físico.
Ocurre que muchas distribuciones de variables continuas tienen el mismo comportamiento
general. Variables que tienen un comportamiento normal son pesos, estaturas, velocidades,
tiempos, volúmenes...
La curva normal se extiende indefinidamente hacia los lados, pero nunca toca al eje X, es decir
que dicho eje es una asíntota. Esto no es de mucha importancia, pues el área en los extremos es
de poco valor para el análisis.
Como se observa, la curva tiene la forma de una campana. Además, es siempre simétrica. Esto
significa que una mitad es el reflejo en un espejo de la otra mitad. ¿Qué implica esta simetría?
Observa la normal siguiente:
P = 0.5 P = 0.5
La probabilidad en una mitad es 0.5, por lo tanto en la otra mitad es también 0.5 De
aquí resulta que el área encerrada por la campana es igual a la unidad.
En la curva anterior, cero es la media aritmética.
Se dice que una población es normal si cumple con las siguientes características:
1. La población se distribuye simétricamente a ambos lados de la media. Una mitad es menor
que la media y la otra mitad es mayor.
2. Aproximadamente el 68% de la población se encuentra en el entorno de la media, a
una desviación típica de distancia.
3. Los elementos de la población decrecen uniformemente a partir de la media.
Un ejemplo sencillo nos introducirá en el uso de la curva normal.
Ejemplo. En una feria deportiva, miles de habitantes de San Salvador participaron en una
carrera. Al finalizar, los datos obtenidos se presentaron en la curva normal que se muestra.
Analicemos los datos de la curva.
25% 25%
15% 15% 8% 8%
2% 2%
18 25 35 45 55 65 72 Minutos
200
5
-4 -3 -2 -1 0 1 2 3 4
Podemos observar que el 50% de los corredores se tardaron entre 35 y 55 minutos.
Evidentemente allí se agrupa la mayoría. Es probable que ese grupo esté formado por personas
sanas, que practican algún deporte, pero que lo hacen por salud física.
El 80% se tardó entre 25 y 65 minutos. Aquí están incluidas personas más ágiles y también
personas bastante lentas.
El 80% se calcula sumando todos los porcentajes: 15% + 25% + 25% + 15% = 80%.
El 96% se tardó entre 18 y 72 minutos. Aquí están incluidas personas muy ágiles, pues algunas
de ellas se tardaron 18 minutos en el recorrido. Seguramente son atletas profesionales:
futbolistas, basquetbolistas, nadadores... Pero también están incluidas personas muy lentas, pues
algunas de ellas se tardaron 72 minutos en el recorrido. Quizá se trate de personas
extremadamente obesas o con algún problema respiratorio.
El 100% se tardó entre menos de 18 minutos o más de 72. Se incluyen en el total de personas
algunas que se tardaron menos de 18 minutos. Son, con seguridad, corredores profesionales,
talvez medallistas de juegos olímpicos. Pero también están incluidas, en el total, personas que se
tardaron más de 72 minutos. Quizás se trata de personas extremadamente gordas y que,
seguramente, se tomaron un descanso en el trayecto.
También se observa que 200 personas llegaron a la meta en 45 minutos. Es decir que la mayoría
se agrupa en torno de la media aritmética (45). Además, sólo 5 llegaron en 18 minutos y sólo 5
llegaron en 72 minutos. Es decir que son pocas las personas muy veloces y también son muy
pocas las personas muy lentas.
Cálculo de probabilidades en distribuciones normales
Ya se dijo que el área encerrada por la campana representa la probabilidad total (=1).
Un segmento de área representa una probabilidad determinada.
Las curvas que se muestran están dadas para una misma media aritmética y una misma
desviación típica. Puede observarse, a simple vista, que el área de la derecha representa una
probabilidad mayor.
Las curvas anteriores corresponden a una misma media aritmética y a una misma desviación
típica. Estas variables son las que generan la curva normal. Esto significa que la normal para
una media () y una desviación típica (σ) determinadas es única: sólo existe una distribución
normal para una desviación típica y una media determinadas. La desviación típica define la
altura: a mayor desviación típica, menor altura. La media desplaza la curva hacia la derecha o
hacia la izquierda. Esto se muestra en los gráficos siguientes.
1 2 3 4 5 6 7 8 9 10 11 12 7
= 6
σ = 8
= 6
σ = 4
1 2 3 4 5 6 7 8 9 10 11 12 7
= 10
σ = 4
= 6
σ = 4
1 2 3 4 5 6 7 8 9 10 11 12 7
= 5
σ = 4
= 9
σ = 8
1 2 3 4 5 6 7 8 9 10 11 12 7
= 9
σ = 8
= 5
σ = 8
Cuando se conocen la desviación típica y la media, es posible determinar el área bajo la curva
normal.
Existen tablas con valores distintos de desviación típica y media aritmética. Aquí presentamos
una para = 0 y σ = 1.
La tabla representa el área de la mitad de la curva. Es decir, una probabilidad de 0.5 En efecto,