PRUEBAS PARAMÉTRICAS Prof. Willer David Chanduvi Puicón ENEI PRUEBA DE HIPÓTESIS PARA UNA MEDIA POBLACIONAL En la investigación es frecuente que se quiera conocer si la media poblacional de una variable aumentó, disminuyó o no cambió con relación a una situación anterior. Se puede querer saber, por ejemplo, si el contenido de proteínas totales en la sangre de los animales de una población silvestre aumentó al finalizar un período en el cual la oferta de alimentos fue abundante; o si el tratamiento con una solución clorada disminuyó el número promedio de bacterias en el agua usada para el consumo humano en cierta región; o verificar si la aplicación de una droga altera el valor promedio de la presión arterial de los conejos usados en pruebas de laboratorio. La respuesta a cada una de estas situaciones se puede lograr poniendo a prueba la hipótesis nula de que la media poblacional es igual a un valor determinado, μ = μ o . Sin embargo el proceso de prueba de hipótesis para una media poblacional, al igual que en el caso de la estimación de μ, depende de varios aspectos: i) de la distribución probabilística que siga la variable estudiada; ii) del conocimiento de la varianza poblacional, y iii) del tamaño de la muestra. A continuación, se presenta un ejemplo de una prueba para la cola inferior. La Federal Trade Commission, FTC, realiza periódicamente estudios estadísticos con objeto de comprobar las afirmaciones de los fabricantes acerca de sus productos. Por ejemplo, en la etiqueta de una lata grande de Hilltop Coffee dice que la lata contiene 3 libras de café. La FTC sabe que el proceso de producción de Hilltop no permite llenar las latas con 3 libras exactas de café por lata, incluso si la media poblacional del peso de llenado de todas las latas es de 3 libras por lata. Sin embargo, mientras la media poblacional del peso de llenado sea por lo menos 3 libras por lata, los derechos del consumidor 1
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
PRUEBAS PARAMÉTRICASProf. Willer David Chanduvi Puicón ENEI
PRUEBA DE HIPÓTESIS PARA UNA MEDIA POBLACIONAL
En la investigación es frecuente que se quiera conocer si la media poblacional de una variable
aumentó, disminuyó o no cambió con relación a una situación anterior. Se puede querer saber,
por ejemplo, si el contenido de proteínas totales en la sangre de los animales de una población
silvestre aumentó al finalizar un período en el cual la oferta de alimentos fue abundante; o si el
tratamiento con una solución clorada disminuyó el número promedio de bacterias en el agua
usada para el consumo humano en cierta región; o verificar si la aplicación de una droga altera
el valor promedio de la presión arterial de los conejos usados en pruebas de laboratorio. La
respuesta a cada una de estas situaciones se puede lograr poniendo a prueba la hipótesis nula de
que la media poblacional es igual a un valor determinado, μ = μo. Sin embargo el proceso de
prueba de hipótesis para una media poblacional, al igual que en el caso de la estimación de μ,
depende de varios aspectos: i) de la distribución probabilística que siga la variable estudiada; ii)
del conocimiento de la varianza poblacional, y iii) del tamaño de la muestra.
A continuación, se presenta un ejemplo de una prueba para la cola inferior.
La Federal Trade Commission, FTC, realiza periódicamente estudios
estadísticos con objeto de comprobar las afirmaciones de los fabricantes
acerca de sus productos. Por ejemplo, en la etiqueta de una lata grande de
Hilltop Coffee dice que la lata contiene 3 libras de café. La FTC sabe que el
proceso de producción de Hilltop no permite llenar las latas con 3 libras
exactas de café por lata, incluso si la media poblacional del peso de llenado
de todas las latas es de 3 libras por lata. Sin embargo, mientras la media
poblacional del peso de llenado sea por lo menos 3 libras por lata, los
derechos del consumidor estarán protegidos. Por tanto, la FTC interpreta que
la información de la etiqueta de una lata grande de café Hilltop tiene una
media poblacional del peso de llenado de por lo menos 3 libras por lata.
A continuación, estudiaremos mediante ejemplos las distintas situaciones o casos que se pueden
presentar en la prueba de hipótesis sobre una media poblacional.
PRUEBA DE HIPÓTESIS ACERCA DE LA MEDIA POBLACIONAL CUANDO LA
MUESTRA PROVIENE DE UNA POBLACIÓN DISTRIBUIDA NORMALMENTE Y CON
VARIANZA CONOCIDA.
Ejemplo:
Un médico traumatólogo afirma que el contenido de calcio en los huesos de mujeres que
padecen osteoporosis después de aplicársele cierto tratamiento es mayor al valor promedio
observado para la población femenina que padece esta enfermedad, el cual se sabe es igual a
1
PRUEBAS PARAMÉTRICASProf. Willer David Chanduvi Puicón ENEI
270 mg/g con una desviación de 120 mg/g. Para probar su premisa el investigador determinó el
contenido de calcio en los huesos de 36 individuos que fueron sometidos al tratamiento y pudo
determinar que dicha muestra arroja un valor promedio de calcio igual a 310 mg/g. La
concentración de calcio es una variable que se distribuye normalmente.
Solución:
Las hipótesis de investigación son las siguientes:
H 0 : El tratamiento para la osteoporosis no tiene ningún efecto.
H 1: El tratamiento para la osteoporosis aumenta los niveles de calcio en los huesos.
Planteamiento de Hipótesis Estadísticas:
H 0 : μ≤ 270
H 1: μ>270
Elegimos un nivel de significancia de 0,05.
Puesto que el parámetro involucrado en la prueba es la media poblacional μ, y la variable se
distribuye normalmente con varianza conocida lo más conveniente es usar como estadístico de
prueba la media muestral en su forma derivada Z.
z= x−μσ√n
Cálculos:
z= x−μσ√n
=310−270120√36
=2
Z(1−α )=Z(1−0,05)=Z(0,95)=1.65
Decisión: Como z=2>z(0,95 )=1.65 el valor del estadístico de prueba se encuentra dentro de la
zona de rechazo. Por lo tanto se concluye que los datos proporcionan suficiente evidencia para
rechazar la hipótesis nula.
Conclusión: La información obtenida de la muestra permite afirmar que el tratamiento aplicado
a los pacientes enfermos de osteoporosis aumenta el nivel de calcio en los tejidos óseos, a un
nivel de significancia de 0,05.
2
PRUEBAS PARAMÉTRICASProf. Willer David Chanduvi Puicón ENEI
PRUEBA DE HIPÓTESIS ACERCA DE LA MEDIA POBLACIONAL CUANDO LA
MUESTRA PROVIENE DE UNA POBLACIÓN DISTRIBUIDA NORMALMENTE, CON
VARIANZA DESCONOCIDA Y TAMAÑO DE MUESTRA GRANDE (n> 30).
Ejemplo:
Un entomólogo sospecha que en cierta zona endémica para el dengue el valor de la tasa neta
reproductiva (Ro) de una población del mosquito Aedes aegypti vector de dicha enfermedad, ha
cambiado en relación con el valor determinado hace 5 años el cual era igual a 205 individuos.
Con tal propósito determinó el valor de Ro a 40 hembras criadas en el laboratorio y
pertenecientes a una cepa desarrollada a partir de mosquitos capturados en la zona estudiada.
Los resultados fueron los siguientes:
El investigador sabe que la variable se distribuye normalmente y quiere someter a prueba su
hipótesis no queriendo equivocarse en más del 5% de las veces.
Solución:
Las hipótesis de investigación son las siguientes:
H 0 : La tasa neta de reproducción no ha cambiado.
H 1: La tasa neta de reproducción se modificó después de cinco años.
Planteamiento de Hipótesis Estadísticas:
H0 : μ=205
H 1: μ≠ 205
Elegimos un nivel de significancia de 0,05.
Puesto que el parámetro involucrado en la prueba es la media poblacional μ, y la variable se
distribuye normalmente con varianza desconocida y el tamaño de la muestra grande lo más
conveniente es usar como estadístico de prueba la media muestral en su forma derivada Z. El
valor de la desviación de la muestra se usa para estimar el valor de σ
3
PRUEBAS PARAMÉTRICASProf. Willer David Chanduvi Puicón ENEI
z= x−μs√n
Cálculos:
Media: 202,9
Desviación estándar: 36,17
Estadístico de Prueba:
z= x−μs√n
=203−20536,17√40
=−0,35
Z(1−α /2)=Z(1−0,025)=Z(0,975)=± 1.96
Decisión: Como z=−0,35se encuentra dentro de la zona de No rechazo de la Hipótesis nula.
Por lo tanto, se concluye que los datos no proporcionan suficiente evidencia para rechazar la
hipótesis nula.
Conclusión: No existe suficiente evidencia para afirmar que la tasa de reproducción de la
población de mosquito se había modificado, a la luz de la información proporcionada por la
muestra, a un nivel de significancia de 0,05.
PRUEBA DE HIPÓTESIS ACERCA DE LA MEDIA POBLACIONAL CUANDO LA
MUESTRA PROVIENE DE UNA POBLACIÓN DISTRIBUIDA NORMALMENTE, CON
VARIANZA DESCONOCIDA Y TAMAÑO DE MUESTRA PEQUEÑO (n < 30).
Ejemplo.
Un ecofisiólogo vegetal desea verificar si el contenido de nitrógeno en las hojas jóvenes de la
especie Rhizophora mangle, es menor en las plantas que viven en una zona ambientalmente
protegida con relación al de plantas que viven en una zona que está siendo afectada por la
contaminación con fertilizantes y cuyo valor promedio se cuantificó en 14.6 mg/g de nitrógeno.
El análisis de 25 hojas jóvenes provenientes de la zona protegida produjo los resultados
siguientes:
4
PRUEBAS PARAMÉTRICASProf. Willer David Chanduvi Puicón ENEI
Si la concentración de nitrógeno se distribuye normalmente, ¿apoya la evidencia proporcionada
por la muestra la presunción que las plantas de la zona protegida contienen menos nitrógeno? El
error tipo I no debe ser mayor a 0.01.
Solución:
Las hipótesis de investigación son las siguientes:
H 0 : La concentración de nitrógeno en las hojas jóvenes de Rhizophora mangle en ambas
regiones es la misma.
H 1: La concentración de nitrógeno en las hojas jóvenes de Rhizophora mangle es menor en la
región protegida.
Planteamiento de Hipótesis Estadísticas:
H 0 : μ=14.6
H 1: μ<14.6
Elegimos un nivel de significancia de 0,01.
Puesto que el parámetro involucrado en la prueba es la media poblacional μ, y la variable se
distribuye normalmente con varianza desconocida y el tamaño de la muestra es peueño lo más
conveniente es usar como estadístico de prueba la media muestral en su forma derivada T . El
valor de la desviación de la muestra se usa para estimar el valor de σ
T= x−μs√n
Cálculos:
Media: 10.48
Desviación estándar: 2,41
Estadístico de Prueba:
T= x−μs√n
= 10,48−14,62,41√25
=−8,55
t(1−α ,n−1)= t(1−0,01 ;25−1)=t(0,99; 24)=−2,492
5
PRUEBAS PARAMÉTRICASProf. Willer David Chanduvi Puicón ENEI
Decisión: Como t=−8,55<−t ( 0,99 ;24)=−2,492el valor del estadístico de prueba se encuentra
dentro de la zona de rechazo de la hipótesis nula. Por lo tanto se concluye que los datos
proporcionan suficiente evidencia para rechazar la hipótesis nula.
De acuerdo a la información obtenida de la muestra se puede afirmar que la concentración de
nitrógeno en las hojas jóvenes de Rhizophora mangle es menor en la región protegida.
PRUEBA DE HIPÓTESIS ACERCA DE LA MEDIA POBLACIONAL CUANDO LA
MUESTRA PROVIENE DE UNA POBLACIÓN CON DISTRIBUCIÓN NO NORMAL Y
TAMAÑO DE MUESTRA GRANDE (n≥ 30).
Cuando la muestra proviene de una población con distribución no normal pero el tamaño de la
muestra es grande se puede aplicar el Teorema del Límite Central y considerar que la media
muestral se distribuye normalmente. Si la desviación poblacional es conocida se usa
Z= ( x−μ )( σ /√n ) como estadístico de prueba. En caso de no conocerse la desviación poblacional se
utiliza la desviación de la muestra y Z=( x−μ )( s /√n )
será el estadístico de prueba usado.
Ejemplo.
En cierto nervio del cuerpo humano, los impulsos eléctricos viajan a una velocidad promedio de
4.3 m / seg con una desviación igual a 1.2 m /seg. Un fisiólogo observó que la velocidad
promedio de conducción del impulso eléctrico en 45 individuos con una distrofia fue de
3.7 m /seg. Basado en estos resultados el investigador presume que con relación a los
individuos sanos en los individuos con distrofia el impulso eléctrico viaja a menor velocidad en
el nervio estudiado. ¿Soportan ésta hipótesis los resultados obtenidos?
Solución:
Las hipótesis de investigación son las siguientes:
H 0 : En los individuos con distrifobia la velocidad de transmisión del impulso nervioso es igual
a la observación en individuos normales.
6
PRUEBAS PARAMÉTRICASProf. Willer David Chanduvi Puicón ENEI
H 1: En los individuos con distrifobia la velocidad de transmisión del impulso nervioso es
menor a la observada en individuos normales.
Planteamiento de Hipótesis Estadísticas:
H 0 : μ≥ 4,3
H 1: μ<4,3
Elegimos un nivel de significancia de 0,05.
Aunque no se conoce la distribución de la variable, como el tamaño de la muestra es grande se
aplica el Teorema del Límite Central. Por lo tanto se puede considerar que la media muestral se
distribuye normalmente y lo más conveniente es usar Z como estadístico de prueba.
Z= x−μσ√n
Calculamos el estadístico de prueba:
Z= x−μσ√n
=3,7−4,31,2√45
=−3,33
z(1−α )=Z (0,95)=−1,65
Decisión:
Como z=−3,33<−z (0,95)=−1,65el valor del estadístico de prueba se encuentra dentro de la
zona de rechazo de la hipótesis nula. Por lo tanto se concluye que los datos proporcionan
suficiente evidencia para rechazar la hipótesis nula.
Los datos soportan la suposición del investigador que en los individuos con distrofia la
velocidad de transmisión del impulso nervioso es menor a la observada en individuos normales.
Ejemplo.
Una compañía productora de leche pasteurizada tiene como norma no aceptar leche cruda con
un contenido de grasa superior a los 34 g /100 g. Una muestra de 36 litros de leche obtenidos de
otras tantas vacas pertenecientes a una misma finca, dio un valor medio del contenido de grasa
7
PRUEBAS PARAMÉTRICASProf. Willer David Chanduvi Puicón ENEI
en la leche de 35.2 g /100 g con una desviación de 4.1 g/100 g. ¿Puede ser aceptada la leche
por la pasteurizadora? La compañía admite un nivel de error del 0.01.
Solución:
Las hipótesis de investigación son las siguientes:
H 0 : El contenido promedio de grasa en la leche es igual al valor máximo permitido para su
procesamiento.
H 1: El contenido promedio de grasa en la leche es superior al valor máximo permitido para su
procesamiento.
Planteamiento de Hipótesis Estadísticas:
H 0 : μ≤ 4,3
H 1: μ>4,3
Elegimos un nivel de significancia de 0,01.
Aunque no se conoce la distribución de la variable, como el tamaño de la muestra es grande se
aplica el Teorema del Límite Central. Por lo tanto se puede considerar que la media muestral se
distribuye normalmente y lo más conveniente es usar Z como estadístico de prueba y la
desviación muestral como estimador de σ .
Z= x−μs
√n
Calculamos el estadístico de prueba:
Z= x−μs
√n
=35,2−344,1√36
=1,75
z(1−α )=Z (0,99)=2,33
Decisión:
Como z=1,75<−z ( 0,99)=2,33el valor del estadístico de prueba se encuentra dentro de la zona
de rechazo de la hipótesis nula. Por lo tanto se concluye que los datos proporcionan suficiente
evidencia para rechazar la hipótesis nula.
8
PRUEBAS PARAMÉTRICASProf. Willer David Chanduvi Puicón ENEI
Se puede concluir que el contenido promedio de grasa en la leche de la finca tiene un valor igual
al valor máximo permitido para su procesamiento.
Ejercicio
Pruebe la hipótesis de que el contenido promedio en recipientes de un lubricante para autos en
particular es de 10 litros si los contenidos de una muestra aleatoria de 10 recipientes son:
10,2 9,7 10,1 10,3 10,19,8 9,9 10,4 10,3 9,8
Utilice un nivel de significancia de 0,05 y suponga que la distribución de los contenidos es
normal.
PRUEBA DE HIPÓTESIS PARA LA COMPARACIÓN DE DOS MEDIAS
POBLACIONALES.
Posiblemente la situación más frecuente en la investigación en el campo de las ciencias sea la de
decidir entre dos alternativas. Por lo general cuando se requiere escoger entre dos métodos,
determinar si un tratamiento fue más efectivo que otro o decidir si existen diferencias para una
misma variable entre dos grupos de individuos, se recurre a una prueba de hipótesis para dos
medias poblacionales. Esta prueba consiste básicamente en determinar si dos muestras estiman
la misma media poblacional, ya sea porque se supone que las muestras provienen de una misma
población o de poblaciones diferentes con la misma media. El procedimiento de docimasia a
seguir depende del conocimiento que se tenga de varios aspectos como son: la distribución de
probabilidades de la variable estudiada, las varianzas poblacionales y el tamaño de las muestras.
Las diferentes situaciones y procedimientos se mostraran a través de algunos ejemplos.
PRUEBA DE HIPÓTESIS PARA DOS MEDIAS POBLACIONALES CUANDO LAS MUESTRAS PROVIENEN DE POBLACIONES DISTRIBUIDAS NORMALMENTE Y CON VARIANZAS CONOCIDAS.
Ejemplo:
De acuerdo a los estudios efectuados sobre el contenido de estroncio en los seres humanos se
sabe que ésta variable se distribuye normalmente con varianza σ2 = 144. Los mismos estudios
indican que el contenido de este elemento en los huesos disminuye con la edad de las personas.
En una investigación relacionada con éste problema, un químico determinó mediante la
espectrofotometría de absorción atómica, el contenido de estroncio en muestras de huesos
9
PRUEBAS PARAMÉTRICASProf. Willer David Chanduvi Puicón ENEI
fracturados de pacientes femeninos pertenecientes a dos grupos etarios diferentes. Los
Proporcione un intervalo de 95% de confianza para la diferencia entre las medias poblacionales diarias de los dos aeropuertos. Verifique a un nivel de significancia de 0.05 si existen o no diferencias entre estas dos empresas de transporte de paquetería.
10. El consejo universitario compara las puntuaciones obtenidas en la prueba de aptitudes
escolares (SAT, por sus siglas en inglés) de acuerdo con el nivel de enseñanza de los
padres de los estudiantes que presentan este examen. La hipótesis de investigación es
que los estudiantes cuyos padres tienen un nivel más alto de estudios obtendrán mejores
puntuaciones en el SAT. En el 2003 la media general en la prueba oral fue 507 (The
World Almanac 2004). Acontinuación se presentan las puntuaciones obtenidas en el
examen verbal en dos muestras independientes de estudiantes. La primera muestra
corresponde a las puntuaciones de estudiantes cuyos padres tienen una licenciatura. La
segunda corresponde a las puntuaciones de estudiantes cuyos padres terminaron la
Con un nivel de confianza de 0.05 ¿se puede llegar a la conclusión de que los miembros
dl club del libro del mes pasan más tiempo, en promedio, viendo televisión que
leyendo?
12. Las relaciones precio rendimiento de 1997 y las estimadas para 1998 se observan en la
tabla siguiente para una muesra de 12 empresas en la bolsa
EmpresaRelación P/R Relación P/R
1997 1998Coca cola 40 32Walt Disney 33 23Du pont 24 16Eastman Kodak 21 13General Electric 30 23General Mills 25 19IBM 19 14Merck 29 21McDonald's 20 17Motorola 35 20Philip Morriis 17 13
28
PRUEBAS PARAMÉTRICASProf. Willer David Chanduvi Puicón ENEI
Xerox 20 17
¿Hay algún cambio en la media poblacional de P/R para el periodo de dos años?.
Emplee un nivel de significancia de 0.05.
13. Una empresa de investigación de mercado emplea una muestra de individuos para calificar el potencial de compra de un determinado producto antes y después de que los individuos vean un comercial de televisión acerca del mismo. La calificación del potencial de compra se hace con una escala del 0 al 10, con los valores más altos indicando un mayor potencial de compra. En la hipótesis nula se establece que la media de las calificaciones de “después” será menor o igual a la media de las calificaciones “antes”. El rechazo de esta hipótesis indica que el comercial mejora la media de la calificación al potencial de compra. Use alfa igual a 0.05 y los datos de la tabla siguiente para probar esta hipótesis y haga un comentario sobre la utilidad del comercial.
6 56 47 74 33 59 87 56 6
Antes Después
14. En los últimos tiempos hay una cantidad cada vez mayor de opciones de
entretenimiento que compiten por el tiempo de los consumidores. En 2004, la televisión
por cable y el radio superaron a la televisión abierta, a la música grabada y a los
periódicos, convirtiéndose en los medios de entretenimiento más usados. Con una
muestra de 15 individuos se obtienen los datos de las horas por semana que ven
televisión por cable y de las horas por semana que escuchan la radio.
29
PRUEBAS PARAMÉTRICASProf. Willer David Chanduvi Puicón ENEI
a. Use como nivel de significancia 0.05 y haga una prueba para la diferencia entre las medias poblacionales de la cantidad de horas de televisión por cable y de la cantidad de horas de radio.
b. ¿Cuál es la media muestral de la cantidad de horas por semana empleadas en ver televisión por cable?
c. ¿Cuál es la media muestral de la cantidad de horas por semana empleadas en escuchar radio? ¿Cuál de estos medios tiene mayor uso?