Pruebas paramétricas

PRUEBAS PARAMÉTRICASProf. Willer David Chanduvi Puicón ENEI

PRUEBA DE HIPÓTESIS PARA UNA MEDIA POBLACIONAL

En la investigación es frecuente que se quiera conocer si la media poblacional de una variable

aumentó, disminuyó o no cambió con relación a una situación anterior. Se puede querer saber,

por ejemplo, si el contenido de proteínas totales en la sangre de los animales de una población

silvestre aumentó al finalizar un período en el cual la oferta de alimentos fue abundante; o si el

tratamiento con una solución clorada disminuyó el número promedio de bacterias en el agua

usada para el consumo humano en cierta región; o verificar si la aplicación de una droga altera

el valor promedio de la presión arterial de los conejos usados en pruebas de laboratorio. La

respuesta a cada una de estas situaciones se puede lograr poniendo a prueba la hipótesis nula de

que la media poblacional es igual a un valor determinado, μ = μo. Sin embargo el proceso de

prueba de hipótesis para una media poblacional, al igual que en el caso de la estimación de μ,

depende de varios aspectos: i) de la distribución probabilística que siga la variable estudiada; ii)

del conocimiento de la varianza poblacional, y iii) del tamaño de la muestra.

A continuación, se presenta un ejemplo de una prueba para la cola inferior.

La Federal Trade Commission, FTC, realiza periódicamente estudios

estadísticos con objeto de comprobar las afirmaciones de los fabricantes

acerca de sus productos. Por ejemplo, en la etiqueta de una lata grande de

Hilltop Coffee dice que la lata contiene 3 libras de café. La FTC sabe que el

proceso de producción de Hilltop no permite llenar las latas con 3 libras

exactas de café por lata, incluso si la media poblacional del peso de llenado

de todas las latas es de 3 libras por lata. Sin embargo, mientras la media

poblacional del peso de llenado sea por lo menos 3 libras por lata, los

derechos del consumidor estarán protegidos. Por tanto, la FTC interpreta que

la información de la etiqueta de una lata grande de café Hilltop tiene una

media poblacional del peso de llenado de por lo menos 3 libras por lata.

A continuación, estudiaremos mediante ejemplos las distintas situaciones o casos que se pueden

presentar en la prueba de hipótesis sobre una media poblacional.

PRUEBA DE HIPÓTESIS ACERCA DE LA MEDIA POBLACIONAL CUANDO LA

MUESTRA PROVIENE DE UNA POBLACIÓN DISTRIBUIDA NORMALMENTE Y CON

VARIANZA CONOCIDA.

Ejemplo:

Un médico traumatólogo afirma que el contenido de calcio en los huesos de mujeres que

padecen osteoporosis después de aplicársele cierto tratamiento es mayor al valor promedio

observado para la población femenina que padece esta enfermedad, el cual se sabe es igual a

1


270 mg/g con una desviación de 120 mg/g. Para probar su premisa el investigador determinó el

contenido de calcio en los huesos de 36 individuos que fueron sometidos al tratamiento y pudo

determinar que dicha muestra arroja un valor promedio de calcio igual a 310 mg/g. La

concentración de calcio es una variable que se distribuye normalmente.

Solución:

Las hipótesis de investigación son las siguientes:

H 0 : El tratamiento para la osteoporosis no tiene ningún efecto.

H 1: El tratamiento para la osteoporosis aumenta los niveles de calcio en los huesos.

Planteamiento de Hipótesis Estadísticas:

H 0 : μ≤ 270

H 1: μ>270

Elegimos un nivel de significancia de 0,05.

Puesto que el parámetro involucrado en la prueba es la media poblacional μ, y la variable se

distribuye normalmente con varianza conocida lo más conveniente es usar como estadístico de

prueba la media muestral en su forma derivada Z.

z= x−μσ√n

Cálculos:

z= x−μσ√n

=310−270120√36

=2

Z(1−α )=Z(1−0,05)=Z(0,95)=1.65

Decisión: Como z=2>z(0,95 )=1.65 el valor del estadístico de prueba se encuentra dentro de la

zona de rechazo. Por lo tanto se concluye que los datos proporcionan suficiente evidencia para

rechazar la hipótesis nula.

Conclusión: La información obtenida de la muestra permite afirmar que el tratamiento aplicado

a los pacientes enfermos de osteoporosis aumenta el nivel de calcio en los tejidos óseos, a un

nivel de significancia de 0,05.

2



MUESTRA PROVIENE DE UNA POBLACIÓN DISTRIBUIDA NORMALMENTE, CON

VARIANZA DESCONOCIDA Y TAMAÑO DE MUESTRA GRANDE (n> 30).

Ejemplo:

Un entomólogo sospecha que en cierta zona endémica para el dengue el valor de la tasa neta

reproductiva (Ro) de una población del mosquito Aedes aegypti vector de dicha enfermedad, ha

cambiado en relación con el valor determinado hace 5 años el cual era igual a 205 individuos.

Con tal propósito determinó el valor de Ro a 40 hembras criadas en el laboratorio y

pertenecientes a una cepa desarrollada a partir de mosquitos capturados en la zona estudiada.

Los resultados fueron los siguientes:

El investigador sabe que la variable se distribuye normalmente y quiere someter a prueba su

hipótesis no queriendo equivocarse en más del 5% de las veces.

Solución:


H 0 : La tasa neta de reproducción no ha cambiado.

H 1: La tasa neta de reproducción se modificó después de cinco años.


H0 : μ=205

H 1: μ≠ 205



distribuye normalmente con varianza desconocida y el tamaño de la muestra grande lo más

conveniente es usar como estadístico de prueba la media muestral en su forma derivada Z. El

valor de la desviación de la muestra se usa para estimar el valor de σ

3


z= x−μs√n

Cálculos:

Media: 202,9

Desviación estándar: 36,17

Estadístico de Prueba:

z= x−μs√n

=203−20536,17√40

=−0,35

Z(1−α /2)=Z(1−0,025)=Z(0,975)=± 1.96

Decisión: Como z=−0,35se encuentra dentro de la zona de No rechazo de la Hipótesis nula.

Por lo tanto, se concluye que los datos no proporcionan suficiente evidencia para rechazar la

hipótesis nula.

Conclusión: No existe suficiente evidencia para afirmar que la tasa de reproducción de la

población de mosquito se había modificado, a la luz de la información proporcionada por la

muestra, a un nivel de significancia de 0,05.


MUESTRA PROVIENE DE UNA POBLACIÓN DISTRIBUIDA NORMALMENTE, CON

VARIANZA DESCONOCIDA Y TAMAÑO DE MUESTRA PEQUEÑO (n < 30).

Ejemplo.

Un ecofisiólogo vegetal desea verificar si el contenido de nitrógeno en las hojas jóvenes de la

especie Rhizophora mangle, es menor en las plantas que viven en una zona ambientalmente

protegida con relación al de plantas que viven en una zona que está siendo afectada por la

contaminación con fertilizantes y cuyo valor promedio se cuantificó en 14.6 mg/g de nitrógeno.

El análisis de 25 hojas jóvenes provenientes de la zona protegida produjo los resultados

siguientes:

4


Si la concentración de nitrógeno se distribuye normalmente, ¿apoya la evidencia proporcionada

por la muestra la presunción que las plantas de la zona protegida contienen menos nitrógeno? El

error tipo I no debe ser mayor a 0.01.

Solución:


H 0 : La concentración de nitrógeno en las hojas jóvenes de Rhizophora mangle en ambas

regiones es la misma.

H 1: La concentración de nitrógeno en las hojas jóvenes de Rhizophora mangle es menor en la

región protegida.


H 0 : μ=14.6

H 1: μ<14.6



distribuye normalmente con varianza desconocida y el tamaño de la muestra es peueño lo más

conveniente es usar como estadístico de prueba la media muestral en su forma derivada T . El

valor de la desviación de la muestra se usa para estimar el valor de σ

T= x−μs√n

Cálculos:

Media: 10.48

Desviación estándar: 2,41

Estadístico de Prueba:

T= x−μs√n

= 10,48−14,62,41√25

=−8,55

t(1−α ,n−1)= t(1−0,01 ;25−1)=t(0,99; 24)=−2,492

5


Decisión: Como t=−8,55<−t ( 0,99 ;24)=−2,492el valor del estadístico de prueba se encuentra

dentro de la zona de rechazo de la hipótesis nula. Por lo tanto se concluye que los datos

proporcionan suficiente evidencia para rechazar la hipótesis nula.

De acuerdo a la información obtenida de la muestra se puede afirmar que la concentración de

nitrógeno en las hojas jóvenes de Rhizophora mangle es menor en la región protegida.


MUESTRA PROVIENE DE UNA POBLACIÓN CON DISTRIBUCIÓN NO NORMAL Y

TAMAÑO DE MUESTRA GRANDE (n≥ 30).

Cuando la muestra proviene de una población con distribución no normal pero el tamaño de la

muestra es grande se puede aplicar el Teorema del Límite Central y considerar que la media

muestral se distribuye normalmente. Si la desviación poblacional es conocida se usa

Z= ( x−μ )( σ /√n ) como estadístico de prueba. En caso de no conocerse la desviación poblacional se

utiliza la desviación de la muestra y Z=( x−μ )( s /√n )

será el estadístico de prueba usado.

Ejemplo.

En cierto nervio del cuerpo humano, los impulsos eléctricos viajan a una velocidad promedio de

4.3 m / seg con una desviación igual a 1.2 m /seg. Un fisiólogo observó que la velocidad

promedio de conducción del impulso eléctrico en 45 individuos con una distrofia fue de

3.7 m /seg. Basado en estos resultados el investigador presume que con relación a los

individuos sanos en los individuos con distrofia el impulso eléctrico viaja a menor velocidad en

el nervio estudiado. ¿Soportan ésta hipótesis los resultados obtenidos?

Solución:


H 0 : En los individuos con distrifobia la velocidad de transmisión del impulso nervioso es igual

a la observación en individuos normales.

6


H 1: En los individuos con distrifobia la velocidad de transmisión del impulso nervioso es

menor a la observada en individuos normales.


H 0 : μ≥ 4,3

H 1: μ<4,3


Aunque no se conoce la distribución de la variable, como el tamaño de la muestra es grande se

aplica el Teorema del Límite Central. Por lo tanto se puede considerar que la media muestral se

distribuye normalmente y lo más conveniente es usar Z como estadístico de prueba.

Z= x−μσ√n

Calculamos el estadístico de prueba:

Z= x−μσ√n

=3,7−4,31,2√45

=−3,33

z(1−α )=Z (0,95)=−1,65

Decisión:

Como z=−3,33<−z (0,95)=−1,65el valor del estadístico de prueba se encuentra dentro de la

zona de rechazo de la hipótesis nula. Por lo tanto se concluye que los datos proporcionan

suficiente evidencia para rechazar la hipótesis nula.

Los datos soportan la suposición del investigador que en los individuos con distrofia la

velocidad de transmisión del impulso nervioso es menor a la observada en individuos normales.

Ejemplo.

Una compañía productora de leche pasteurizada tiene como norma no aceptar leche cruda con

un contenido de grasa superior a los 34 g /100 g. Una muestra de 36 litros de leche obtenidos de

otras tantas vacas pertenecientes a una misma finca, dio un valor medio del contenido de grasa

7


en la leche de 35.2 g /100 g con una desviación de 4.1 g/100 g. ¿Puede ser aceptada la leche

por la pasteurizadora? La compañía admite un nivel de error del 0.01.

Solución:


H 0 : El contenido promedio de grasa en la leche es igual al valor máximo permitido para su

procesamiento.

H 1: El contenido promedio de grasa en la leche es superior al valor máximo permitido para su

procesamiento.


H 0 : μ≤ 4,3

H 1: μ>4,3



aplica el Teorema del Límite Central. Por lo tanto se puede considerar que la media muestral se

distribuye normalmente y lo más conveniente es usar Z como estadístico de prueba y la

desviación muestral como estimador de σ .

Z= x−μs

√n

Calculamos el estadístico de prueba:

Z= x−μs

√n

=35,2−344,1√36

=1,75

z(1−α )=Z (0,99)=2,33

Decisión:

Como z=1,75<−z ( 0,99)=2,33el valor del estadístico de prueba se encuentra dentro de la zona

de rechazo de la hipótesis nula. Por lo tanto se concluye que los datos proporcionan suficiente

evidencia para rechazar la hipótesis nula.

8


Se puede concluir que el contenido promedio de grasa en la leche de la finca tiene un valor igual

al valor máximo permitido para su procesamiento.

Ejercicio

Pruebe la hipótesis de que el contenido promedio en recipientes de un lubricante para autos en

particular es de 10 litros si los contenidos de una muestra aleatoria de 10 recipientes son:

10,2 9,7 10,1 10,3 10,19,8 9,9 10,4 10,3 9,8

Utilice un nivel de significancia de 0,05 y suponga que la distribución de los contenidos es

normal.

PRUEBA DE HIPÓTESIS PARA LA COMPARACIÓN DE DOS MEDIAS

POBLACIONALES.

Posiblemente la situación más frecuente en la investigación en el campo de las ciencias sea la de

decidir entre dos alternativas. Por lo general cuando se requiere escoger entre dos métodos,

determinar si un tratamiento fue más efectivo que otro o decidir si existen diferencias para una

misma variable entre dos grupos de individuos, se recurre a una prueba de hipótesis para dos

medias poblacionales. Esta prueba consiste básicamente en determinar si dos muestras estiman

la misma media poblacional, ya sea porque se supone que las muestras provienen de una misma

población o de poblaciones diferentes con la misma media. El procedimiento de docimasia a

seguir depende del conocimiento que se tenga de varios aspectos como son: la distribución de

probabilidades de la variable estudiada, las varianzas poblacionales y el tamaño de las muestras.

Las diferentes situaciones y procedimientos se mostraran a través de algunos ejemplos.

PRUEBA DE HIPÓTESIS PARA DOS MEDIAS POBLACIONALES CUANDO LAS MUESTRAS PROVIENEN DE POBLACIONES DISTRIBUIDAS NORMALMENTE Y CON VARIANZAS CONOCIDAS.

Ejemplo:

De acuerdo a los estudios efectuados sobre el contenido de estroncio en los seres humanos se

sabe que ésta variable se distribuye normalmente con varianza σ2 = 144. Los mismos estudios

indican que el contenido de este elemento en los huesos disminuye con la edad de las personas.

En una investigación relacionada con éste problema, un químico determinó mediante la

espectrofotometría de absorción atómica, el contenido de estroncio en muestras de huesos

9


fracturados de pacientes femeninos pertenecientes a dos grupos etarios diferentes. Los

resultados fueron los siguientes:

35 - 44 Años 45 - 54 Años

40.45 48.2155.15 23.3767.59 25.4280.58 41.9478.09 40.6568.09 44.75

72.06 51.69

Niveles de estroncio

¿Esto resultados apoyan la hipótesis de la disminución de los niveles de estroncio en el tejido

óseo al incrementar la edad de las personas? Use α=0,03

Solución:


H 0 : El contenido de estroncio en los huesos no se modifica con la edad de las personas.

H 1: El contenido de estroncio en los huesos disminuye con la edad de las personas.


H 0 : μ1≤ μ2

H 1: μ1>μ2


Puesto que la variable concentración de estroncio se distribuye normalmente con varianza

conocida y como se trata de una prueba de hipótesis sobre la diferencia de dos medias

poblacionales se puede usar el estadístico de prueba Z.

Z=( x1−x2 )−( μ1−μ2 )

√ σ12

n1+

σ22

n2

Cálculos necesarios:

Media de las muestras: x1=66,0 x2=39,43

Varianzas: σ 12=σ2

2=144

Estadístico de prueba:

10


Z=( x1−x2 )−( μ1−μ2 )

√ σ12

n1+

σ22

n2

=66,0−39,43

√ 1447

+ 1447

=4,14

Región Crítica:

z(1−α )=Z (0,97 )=1,88

Decisión:

Como z=4,14>z (0,97 )=1,88el valor del estadístico de prueba se encuentra dentro de la zona de

rechazo de la hipótesis nula. Por lo tanto se concluye que los datos proporcionan suficiente


Se puede concluir que la evidencia aportada por la muestra apoya la hipótesis de la disminución

del nivel de estroncio en los huesos de las personas con la edad, a un nivel de significancia de

0,03.

PRUEBA DE HIPÓTESIS PARA DOS MEDIAS POBLACIONALES CUANDO LAS

MUESTRAS PROVIENEN DE POBLACIONES DISTRIBUIDAS NORMALMENTE,

CON VARIANZAS DESCONOCIDAS Y TAMAÑO DE MUESTRAS GRANDES (n1 Y

n2 ≥ 30).

Ejemplo.

En el Departamento de Toxicología del Ministerio de Salud se necesita saber si el contenido de

nicotina en dos marcas de cigarrillos importados es la misma. Con el propósito de resolver la

situación se le determina el contenido de nicotina a un lote de cigarrillos de cada marca,

encontrándose los resultados siguientes:

11


Si se sabe que la cantidad de nicotina se distribuye normalmente, determine con un nivel de

significancia de 0,10; si las dos marcas tienen la misma cantidad de nicotina.

Solución:


H 0 : La cantidad de nicotina en los cigarrillos de las dos marcas es la misma.

H 1: La cantidad de nicotina en los cigarrillos de las dos marcas es diferente.


H 0 : μ1=μ2

H 1: μ1≠ μ2


Puesto que el parámetro involucrado en la prueba es la diferencia de medias poblacionales

μ1−μ2, y como la variable se distribuye normalmente con varianza desconocida y tamaño de la

muestra grande lo más conveniente es usar como estadístico de prueba la diferencia de medias

muestrales en su forma derivada Z. El valor de las varianzas s12 y s2

2 de las muestras se usa para

estimar el valor de σ 12 y σ 2

2

Z=( x2−x1 )−( μ2−μ1 )

√ s12

n1+

s22

n2


Varianzas: s12=(2,3)2=5,29 ; s2

2=(2,9 )2=8,41


Z=( x2−x1 )−( μ2−μ1 )

√ s12

n1+

s22

n2

= 24,0−25,2

√ 5,2949

+ 8,4136

=−2,06

Región Crítica:

12


−z(1−α /2)=−Z (0,95 )=1,65

Decisión:

Como z=−2,06<z (0,95)=−1,65el valor del estadístico de prueba se encuentra dentro de la



Se puede concluir que la evidencia aportada por la muestra apoya como hipótesis que el

contenido de nicotina en las dos marcas es diferente, a un nivel de significancia de 0,10


MUESTRAS PROVIENEN DE POBLACIONES DISTRIBUIDAS NORMALMENTE,

CON VARIANZAS DESCONOCIDAS Y TAMAÑO DE MUESTRAS PEQUEÑAS (n1 y

n2 < 30).

Cuando se presenta una situación de éste tipo, es necesario considerar adicionalmente si las dos

varianzas poblacionales, aunque desconocidas, son iguales o diferentes. Si se supone que las

varianzas son iguales se debe utilizar como estadístico de prueba a:

T=( x2−x1)−( μ2−μ1 )

√ sp2

n1+

s p2

n2

Donde:

sp2=

( n1−1 ) S12−(n2−1 ) S2

2

n1+n2−2

Si se presume que las varianzas son diferentes, y si la prueba de hipótesis para la diferencia de

medias es de dos colas, se debe usar como estadístico de prueba a:

T=( x2−x1)−( μ2−μ1 )

√ s22

n2+

s12

n1

Y se utiliza t∗¿ como valor crítico para la zona de rechazo.

13


t (1−α /2)¿ =

( s12

n1)t (1−α /2 ;n1−1)+( s2

2

n2)t (1−α /2 ;n2−1 )

( s12

n1)+( s2

2

n2)

Ejemplo:

En un estudio sobre la condición ecológica de los ríos altiandinos, se determinó la temperatura

del agua en ríos de páramo (> 2800 m.s.n.m.) y de selva nublada (1800 < m.s.n.m. < 2800),

obteniéndose los resultados siguientes:

Rios 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16Páramo 10.5 15.0 14.5 8.5 7.5 13.5 15.0 11.5 17.0 13.0 13.5 14.5 13.5 15.0 10.5 10.0Selva 19.5 17.0 13.5 9.0 12.0 16.5 16.5 18.0 18.0 18.0 12.0 16.0 12.0 14.5 16.5 17.0

Temperatura del agua (° C)

Conociendo que la temperatura del agua es una variable que se distribuye normalmente, se

quiere saber si los ríos de selva son más calientes.

Solución:


H 0 : La temperatura del agua en los ríos es la misma en las dos unidades ecológicas.

H 1: La temperatura del agua es mayor en los ríos de la zona de selva.


H 0 : μ1≤ μ2

H 1: μ1>μ2



μ1−μ2, y como la variable se distribuye normalmente con varianza desconocida y el tamaño de

la muestra es pequeño, para poder elegir el estadístico de prueba a usar, se debe en primer lugar

determinar si las varianzas poblacionales se pueden considerar iguales o diferentes. Para esto se

puede hacer uso de las reglas prácticas para la comparación de varianzas.

Como α=0,05 y RV =s2

2

s12=

(2,9 )2

(2,66 )2=1,19 es menor a 2,5 se concluye que las dos varianzas

son iguales. Por lo tanto, se debe utilizar como estadístico de prueba a:

14


T=( x2−x1)−( μ2−μ1 )

√ sp2

n1+

s p2

n2


Varianzas Ponderadas:

sp2=

( n1−1 ) S12−(n2−1 ) S2

2

n1+n2−2=

(16−1 ) (2,66 )2+ (16−1 ) (2,9 )2

16+16−2=7,74


T=( x2−x1)−( μ2−μ1 )

√ sp2

n1+

s p2

n2

¿ (15,38−12,69 )−0

√ 7,7416 + 7,74

16

=2,73

Región Crítica:

t(1−α ;n 1+n 2−2)=t (0,95 ;30)=1,697

Decisión:

Como T=2,73<t (0,95 ;30 )=1,697el valor del estadístico de prueba se encuentra dentro de la



Se puede concluir que la temperatura del agua es mayor en los ríos de selva nublada que en los

ríos de páramo, a un nivel de significancia de 0,05.

Ejemplo:

Un investigador que trabaja sobre la interacción insecto/planta piensa que las plantas

cianogénicas, es decir las que producen HCN, tienden a ser rechazadas por los insectos

15


herbívoros no especializados. Para poner a prueba ésta hipótesis se efectuó un experimento en el

cual se le ofreció a las larvas de un insecto generalista hojas de una planta cianogénica como la

parchita (Passiflora capsularis) y hojas de una planta no cianogénica como la espinaca (Spinacia

olerácea). Como una medida de la aceptación o rechazo del alimento ofrecido se determinó el

peso de tejido foliar consumido por las larvas de la polilla Spodoptera frugiperda. Los

resultados fueron los siguientes:

Sabiendo que la variable peso de hoja consumida se distribuye normalmente se quiere

determinar si la sospecha del investigador es cierta para un α=0,01

Solución:


H 0 : La presencia de sustancias cianogénicas no interfiere el consumo de tejido vegetal por los

insectos herbívoros no especialistas.

H 1: La presencia de sustancias cianogénicas disminuye el consumo de tejido vegetal por los

insectos herbívoros no especialistas.


H0 : μ1≥ μ2

H 1: μ1<μ2



μ1−μ2, y como la variable se distribuye normalmente con varianzas desconocidas y el tamaño

de la muestra es pequeño, para poder elegir el estadístico de prueba a usar, se debe en primer

lugar determinar si las varianzas poblacionales se pueden considerar iguales o diferentes. Para

esto se puede hacer uso de las reglas prácticas para la comparación de varianzas.

Como α=0,01 y RV =s2

2

s12=

(20,13 )2

(8,28 )2=5,9 es mayor a 3,5 se concluye que las dos varianzas

son diferentes. Por lo tanto, se debe utilizar como estadístico de prueba a:

16


T=( x2−x1)−( μ2−μ1 )

√ s22

n2+

s12

n1

T=(74,70−124,44 )−(0 )

√ (20,13)2

5+(8,28)2

5

=−49,749,73

=−5,11

t(0,99)¿ =

( s12

n1)t (0,99 ; 4)+( s2

2

n2)t (0,99 ; 4 )

( s12

n1)+( s2

2

n2)

=¿

( (20,13 )2

5 )(3,747)+( (8,28 )2

5 )(3,747)

((20,13)2

5 )+( (8,28)2

5 )=3,75

Región Crítica:

−t(0,99)=−3,75

Decisión:

Como T=−5,11< t ( 0,99)=−3,75el valor del estadístico de prueba se encuentra dentro de la



Se puede concluir que las larvas de Spodoptera frugiperda tienden a rechazar los tejidos de

plantas cianogénicas, a un nivel de significancia de 0,01.

17



MUESTRAS PROVIENEN DE POBLACIONES CON DISTRIBUCIÓN NO NORMAL

Y TAMAÑO DE MUESTRAS GRANDES (n1 y n2 ≥ 30).

Cuando las muestras provienen de dos poblaciones con distribución no normal pero el tamaño

de las muestras es grande se puede aplicar el Teorema del Límite Central y considerar que la

diferencia de medias muestrales x2−x1, se distribuye normalmente. Si las varianzas

poblacionales se conocen el estadístico de prueba a usar es:

Z=( x2−x1 )−( μ2−μ1 )

√ σ12

n1+

σ22

n2

En caso de no conocerse las varianzas poblacionales, estas se sustituyen por las varianzas de las

muestras y el estadístico de prueba a usar es:

Z=( x2−x1 )−( μ2−μ1 )

√ s12

n1+

s22

n2

Ejemplo:

Se sabe que el contenido de calcio en los huesos de los animales de cierta especie se distribuye

normalmente con una varianza σ 12= 57.6 para las hembras y una varianza σ 2

2= 51.2 para los

machos. Con el propósito de determinar si existen diferencias en el contenido de calcio entre

machos y hembras se le determinó a 31 hembras y 33 machos el contenido de calcio en el tejido

óseo encontrándose que para la muestra de hembras el valor promedio fue de 400.45 μg/g y para

la muestra de machos fue de 395.24 μg/g. ¿Cuál debe ser la respuesta? Use α=0,05.

Solución:


H 0 : El contenido de calcio en los huesos de los animales de los dos sexos es el mismo.

H 1: El contenido de calcio en los huesos de los animales de los dos sexos es diferente.


H 0 : μ1=μ2

H 1: μ1≠ μ2


18



aplica el Teorema del Límite Central. Por lo tanto se puede considerar que la diferencia de

medias muestrales se distribuye normalmente y lo más conveniente es usar Z como estadístico

de prueba.

Z=( x2−x1 )−( μ2−μ1 )

√ σ22

n2+

σ12

n1

Z=(400,45−395,24 )−(0 )

√ 57,631 +

51,233

=2,83

Región Crítica:

z(1−α /2)=z(0,975)=1,96

Decisión:

Como Z=2,83>z (0,975 )=1,96el valor del estadístico de prueba se encuentra dentro de la zona

de rechazo de la hipótesis nula. Por lo tanto se concluye que los datos proporcionan suficiente


Se puede afirmar que el nivel de calcio en los huesos de los animales de los dos sexos es

diferente, con un nivel de significancia de 0,05.

Ejemplo:

En una investigación sobre el papel que juega el marsupial Marmosa robinsoni sobre la

dispersión de semillas de dos especies de cactus, se piensa que este animal prefiere las semillas

de uno de los dos tipos de cactus que hay en la zona de estudio. Para averiguar si esto es cierto,

se determinó bajo condiciones de laboratorio la cantidad (grs) de pulpa del fruto de las dos

especies de cactus que fue consumida por el marsupial. Los resultados encontrados fueron los

siguientes:

19


Si se acepta un 0,01 como máxima probabilidad de equivocarse ¿cuál de las dos especies es

preferida por la marmosa?

Solución:


H 0 : La marmosa no tiene preferencia por ninguno de los dos tipos de frutos.

H 1: La marmosa prefiere uno de los dos tipos de frutos.


H 0 : μ1=μ2

H 1: μ1≠ μ2



aplica el Teorema del Límite Central. Por lo tanto se puede considerar que la diferencia de

medias muestrales se distribuye normalmente. Se puede usar Z como estadístico de prueba y

estimar las varianzas poblacionales a partir de las desviaciones de las muestras.

Z=( x2−x1 )−( μ2−μ1 )

√ s22

n2+

s12

n1

Z= (19,99−21,20 )− (0 )

√(2,37)2

32+

(1,47)2

38

=−2,51

Región Crítica:

z(1−α /2)=z(0,995)=2,58

Decisión:

Como −z0,995=−1,96<z=−2,51<z0,995=1,96el valor del estadístico de prueba se encuentra

dentro de la zona de no rechazo de la hipótesis nula. Por lo tanto se concluye que los datos no

proporcionan suficiente evidencia para rechazar la hipótesis nula.

20


Se puede afirmar que no existe suficiente evidencia para afirmar que la marmosa no tiene

preferencia por ninguno de los dos frutos.

PRUEBA DE HIPÓTESIS PARA DOS MEDIAS POBLACIONALES USANDO

OBSERVACIONES APAREADAS.

La efectividad con la cual las pruebas de hipótesis pueden detectar diferencias entre dos medias

poblacionales, depende de que las dos muestras sean independientes, es decir que los valores

obtenidos en cada una unidad de muestra no afecten los valores de la otra muestra. Además, la

variación dentro de las muestras no debe ser tan grande que impida detectar las eventuales

diferencias entre las medias. Si se pone atención a las ecuaciones de los estadísticos de prueba

usados para comparar dos medias poblacionales, es fácil deducir la importancia de la variación

dentro de las muestras. Cualquier aumento de la variación dentro de las muestras disminuye el

valor del estadístico de prueba, anulando cualquier pequeña diferencia que pudiera existir entre

las medias muestrales, diferencia que eventualmente podría permitir rechazar H0. Por ejemplo,

cuando se obtienen dos muestras pequeñas de poblaciones normales con las mismas varianzas,

el valor del estadístico:

T=( x1−x2)−( μ1−μ2 )

√ sp2

n1+

s p2

n2

Disminuirá a medida que incrementa el valor de sp2 , aumentando su probabilidad de caer en la

zona de aceptación de H0 y por lo tanto de rechazar la hipótesis alternativa de diferencia entre

las medias.

La variabilidad dentro de cada muestra está compuesta por la variación aleatoria debido a los

métodos de medición, el ambiente y las diferencias naturales entre los individuos. Igualmente la

variabilidad entre las muestras tiene estos mismos componentes de variación más la variación

añadida o controlada por el investigador. Pero en muchas ocasiones están presentes factores

extraños al experimento que aumentan la variabilidad dentro y entre las muestras que ocultan

cualquier pequeña diferencia entre las medias muestrales que pudiera haber conducido a

rechazar la hipótesis nula.

21


El ejemplo siguiente puede ilustrar la influencia de estos factores extraños en ocultar diferencias

existentes entre dos medias poblacionales o por el contrario mostrar diferencias donde no

existen. Para comprobar cuál de dos fertilizantes es mejor, se siembran dos parcelas con maíz.

Al suelo de una parcela se le añade el fertilizante A y al de la otra parcela el fertilizante B. Una

prueba de hipótesis puede determinar que la producción de las dos parcelas es diferente y

concluirse que uno de los fertilizantes es mejor, sin embargo la diferencia puede deberse a la

acción de los factores ambientales que no son controlados.

Otro resultado posible es que se acepte la hipótesis nula de no diferencia entre los fertilizantes,

cuando realmente hay diferencia y la misma quedó encubierta por la variabilidad originada por

los factores extraños. Una manera de superar estas dificultades es apareando las observaciones

de las muestras. Esto significa que las unidades muestrales donde se quiere medir el efecto de

las variables controladas por el investigador sean lo más parecida posibles. En el ejemplo de los

fertilizantes, tendrían que ubicarse los cultivos en parcelas muy parecidas en cuanto a las

condiciones ambientales. Otras maneras de aparear, es usando un mismo individuo y medir la

respuesta antes y después de aplicársele un tratamiento. Si no es posible usar el mismo sujeto se

buscan pares de individuos muy parecidos en cuanto a edad, sexo, peso, raza, estatura, etc.

También se puede dividir un mismo material en dos partes y efectuar las experiencias que

interesan, como probar la eficiencia de dos métodos de medición.

Una vez que se tienen las muestras emparejadas, en lugar de trabajar individualmente con cada

una, es mejor usar la diferencia entre las respuestas, d i=x i 1−x i 2

Los diferentes valores de d ise diferencias entre sí principalmente por los efectos del factor

controlado por el investigador, puesto que la sustracción del valor de una observación al valor

de la otra observación, elimina la mayor parte de la variación debido a los factores extraños.

Si las muestras provienen de poblaciones distribuidas normalmente la media D de las

diferencias d i=x i 1−x i 2 es una variable aleatoria que se distribuye normalmente alrededor de

una media μd con una desviación sd=sd

√n

22


Bajo esta nueva situación, la hipótesis nula a contrastar sería μd=0 lo que equivale a contrastar

la hipótesis nula μ1−μ2=0 Por lo tanto, cuando las observaciones son pareadas; H 0 : μd=0 y

H 1: μd ≠ 0 son las hipótesis a plantear.

El estadístico de prueba a usar es: T=( d−μd ) /(sd /√n ) y la zona de rechazo sería:

ZR= {T /−t1−α /2; n−1>T >t 1−α /2 ;n−1 }

Ejemplo:

La β-dimetil digoxina es una droga que afecta el ritmo cardíaco. En un estudio efectuado para

determinar los efectos agudos de esta droga se determinó la frecuencia cardiaca a 10 acures

(Cavia porcellus) antes y después de la administración de la droga. En la tabla siguiente se

muestran los resultados.

Sabiendo que la frecuencia cardíaca de los acures se distribuye normalmente, determine con un

nivel de significación igual 0.05 si la droga altera dicha variable.

Solución:


H 0 : μd=0

H 1: μd ≠ 0


Puesto que se trata de la comparación de muestras apareadas el estadístico de prueba es:

T=(d−μd )

sd

√n


Media: d=30

Desviación estándar: sd=28,28

23



T=(d−μd )

sd

√n

=30−028,28√10

=3,35

Región Crítica:

ZNR={T /−t1−α /2 ;n−1<T< t1−α /2 ;n−1 }=¿¿¿

Decisión:

Como t=3,35>t 0,975 ;9=2,26el valor del estadístico de prueba se encuentra dentro de la zona

de rechazo de la hipótesis nula. Por lo tanto se concluye que los datos no proporcionan


De acuerdo a la información obtenida de la muestra se puede afirmar que la droga altera la

frecuencia cardiaca de los acures, a un nivel de significancia de 0,05.

Utilice estos mismos datos y haga una prueba de hipótesis para dos medias considerando las

muestras en forma independiente (sin aparear) y compare los resultados. Observe los cambios

que se producen en la desviación de los estadísticos de prueba usados en los dos

procedimientos.

LISTA DE EJERCICIOS

1. Los niveles de audiencia (en miles de personas) de un programa de televisión, medidos

en 10 emisiones elegidas aleatoriamente, han sido los siguientes:

682 553 555 666 649 522 568 700 552

Suponiendo que los niveles de audiencia siguen una distribución normal, ¿Se podría

afirmar, con un 95% de confianza, que la audiencia media del programa es de 600.000

espectadores por programa?

2. La longitud media de una barra de equilibrio es 43 milímetros. El supervisor de

producción sospecha que la máquina que produce las barras se ha desajustado, y le pide

al departamento de ingeniería que investigue esto. El departamento de ingeniería toma

una muestra aleatoria de 12 barras y mide cada una de ellas. Los resultados de las

24


mediciones se presentan a continuación. ¿Es razonable concluir que la longitud de las

barras ha variado? Utilice un nivel de significancia de 0.05.

42 39 42 45 43 40 39 41 40 42 43 42

3. El cloro líquido que se usa en las piscinas para combatir el crecimiento de algas tiene

una vida de almacenamiento relativamente corta. Según los registros la duración media

de almacenamiento de un depósito de 5 galones es 2160 horas (90 días) Como

experimento se le agregó al cloro una sustancia para prolongar su vida de

almacenamiento. En una muestra de 9 galones las vidas de almacenamiento encontradas

fueron las siguientes:

2159 2170 2180 2179 2160 2167 2171 2181 2185

¿Esta sustancia ha incrementado la vida de almacenamiento del cloro? Utilice un alfa de

0.05

4. Una empresa encuestadora se queja que un agente realiza en promedio 53 encuestas por

semana. Se ha introducido un método más moderno de realizar las encuestas y la

empresa quiere evaluar su efectividad. Los números de encuestas realizadas en una

semana por una muestra aleatoria de agentes son:

53 57 50 55 5854 60 52 59 6260 60 51 59 56

A un nivel de significancia de 0.05 ¿se puede concluir que la cantidad media de

entrevistas realizadas por los agentes es superior a 53 por semana?

5. La Asociación de Relojes Suiza asegura que sus relojes jamás se adelantarán o se

atrasarán en una semana. En una muestra de 18 relojes se encontraron los siguientes

segundos de adelanto (+) o de atraso (-) por semana ¿es razonable concluir que el

adelanto o atraso de estos relojes es cero? Utilice un alfa de 0.05

6. Una compañía de taxis está tratando de decidir si el uso de neumáticos radiales en lugar

de otros comunes con cinturón mejora la economía del combustible. Se equiparon doce

autos con neumáticos radiales y recorrieron una trayectoria de prueba prescrita. Sin

cambiar de conductores, se equipó a los mismos vehículos con neumáticos regulares y

de nuevo recorrieron el mismo trayecto. Se registró el consumo de gasolina, en

kilómetros por litro, como sigue:

AutomóvilKilómetros por litro

Radiales Normales1 4.2 4.12 4.7 4.93 6.6 6.2

25


4 7 6.95 6.7 6.86 4.5 4.47 5.7 5.78 6 5.89 7.4 6.910 4.9 4.711 6.1 612 5.2 4.9

En el nivel de significancia de 0,05 ¿puede concluirse que los vehículos equipados con

neumáticos radiales dan una mejor economía de combustible que aquellos equipados

con neumáticos normales? Suponga que las poblaciones están normalmente

distribuidas.

7. Los siguientes datos representan los tiempos de duración de las películas producidas por

dos compañías cinematográficas.

Compañía

1 102 86 98 109 922 81 165 97 134 92 87 114

Tiempo (minutos

Se desea verificar si el tiempo de duración promedio de las películas producidas por la

compañía dos excede al de las de la compañía uno. Utilice un nivel de significancia de

0,05 y asuma que las distribuciones de los tiempos son aproximadamente normales.

-0.38 -0.20 -0.38 -0.32 0.32 -0.23 0.30 0.25 -0.10-0.37 -0.61 -0.48 -0.47 -0.64 -0.04 -0.20 -0.68 0.05

8. Se seleccionan dos muestras aleatorias e independientes del número de puestos de

trabajo creados en el último mes por diferentes empresas de dos sectores económicos.

La información suministrada por las muestras es la siguiente:

Sextor A 13 14 21 19 15 15Sector B 18 19 20 22 31 26

Con el fin de conocer el impacto de las nuevas modalidades de contratación en ambos

sectores y suponiendo que el número de empleos creados siguiera en ambos sectores

distribuciones normales con varianzas iguales: ¿Podríamos afirmar con un 99% de

confianza, que ambos sectores son similares en cuanto al número medio de empleos

creados en el último mes?

26


9. FedEx y United Parcel Service (UPS) son las dos empresas de transporte de paquetería

más importantes del mundo en cuanto a volumen e ingresos (The Wall Street Journal,

27 de enero de 2004). De acuerdo con el Consejo Internacional de Aeropuertos, el

aeropuerto internacional de Memphis (FedEx) y el aeropuerto internacional de

Louisville (UPS) son dos de los 10 mayores aeropuertos de carga del mundo. Las

muestras aleatorias siguientes muestran las toneladas de carga por día que pasan por

estos aeropuertos. Los datos están dados en miles de toneladas.

9.1 15.1 8.8 10.0 7.5 10.58.3 9.1 6.0 5.8 12.1 9.34.7 5.0 4.2 3.3 5.52.2 4.1 2.6 3.4 7.0

Memphis

Louisville

Proporcione un intervalo de 95% de confianza para la diferencia entre las medias poblacionales diarias de los dos aeropuertos. Verifique a un nivel de significancia de 0.05 si existen o no diferencias entre estas dos empresas de transporte de paquetería.

10. El consejo universitario compara las puntuaciones obtenidas en la prueba de aptitudes

escolares (SAT, por sus siglas en inglés) de acuerdo con el nivel de enseñanza de los

padres de los estudiantes que presentan este examen. La hipótesis de investigación es

que los estudiantes cuyos padres tienen un nivel más alto de estudios obtendrán mejores

puntuaciones en el SAT. En el 2003 la media general en la prueba oral fue 507 (The

World Almanac 2004). Acontinuación se presentan las puntuaciones obtenidas en el

examen verbal en dos muestras independientes de estudiantes. La primera muestra

corresponde a las puntuaciones de estudiantes cuyos padres tienen una licenciatura. La

segunda corresponde a las puntuaciones de estudiantes cuyos padres terminaron la

preparatoria, pero no tienen una licenciatura.

485 487 442 492534 533 580 478650 526 479 425554 410 486 485550 515 528 390572 578 524 535497 448592 469

Con Licenciatura

Con Preparatoria

11. Se llevó a cabo una encuesta entre los miembros del Club del libro del mes, para

verificar si pasan más tiempo viendo televisión que leyendo. Suponga que en una

27


muestra de 15 encuestados se obtuvieron las horas semanales que se dedican a ver

televisión y las que se dedican a la lectura.

Encuestados Televisión Leyendo

1 10 62 14 163 16 84 18 105 15 106 14 87 10 148 12 149 4 7

10 8 811 16 512 5 1013 8 314 19 1015 11 6

Con un nivel de confianza de 0.05 ¿se puede llegar a la conclusión de que los miembros

dl club del libro del mes pasan más tiempo, en promedio, viendo televisión que

leyendo?

12. Las relaciones precio rendimiento de 1997 y las estimadas para 1998 se observan en la

tabla siguiente para una muesra de 12 empresas en la bolsa

EmpresaRelación P/R Relación P/R

1997 1998Coca cola 40 32Walt Disney 33 23Du pont 24 16Eastman Kodak 21 13General Electric 30 23General Mills 25 19IBM 19 14Merck 29 21McDonald's 20 17Motorola 35 20Philip Morriis 17 13

28


Xerox 20 17

¿Hay algún cambio en la media poblacional de P/R para el periodo de dos años?.

Emplee un nivel de significancia de 0.05.

13. Una empresa de investigación de mercado emplea una muestra de individuos para calificar el potencial de compra de un determinado producto antes y después de que los individuos vean un comercial de televisión acerca del mismo. La calificación del potencial de compra se hace con una escala del 0 al 10, con los valores más altos indicando un mayor potencial de compra. En la hipótesis nula se establece que la media de las calificaciones de “después” será menor o igual a la media de las calificaciones “antes”. El rechazo de esta hipótesis indica que el comercial mejora la media de la calificación al potencial de compra. Use alfa igual a 0.05 y los datos de la tabla siguiente para probar esta hipótesis y haga un comentario sobre la utilidad del comercial.

6 56 47 74 33 59 87 56 6

Antes Después

14. En los últimos tiempos hay una cantidad cada vez mayor de opciones de

entretenimiento que compiten por el tiempo de los consumidores. En 2004, la televisión

por cable y el radio superaron a la televisión abierta, a la música grabada y a los

periódicos, convirtiéndose en los medios de entretenimiento más usados. Con una

muestra de 15 individuos se obtienen los datos de las horas por semana que ven

televisión por cable y de las horas por semana que escuchan la radio.

29


1 22 25 9 21 212 8 10 10 23 233 25 29 11 14 154 22 19 12 14 185 12 13 13 14 176 26 28 14 16 157 22 23 15 24 238 19 21 16

Individuo Tv Radio Individuo Tv Radio

a. Use como nivel de significancia 0.05 y haga una prueba para la diferencia entre las medias poblacionales de la cantidad de horas de televisión por cable y de la cantidad de horas de radio.

b. ¿Cuál es la media muestral de la cantidad de horas por semana empleadas en ver televisión por cable?

c. ¿Cuál es la media muestral de la cantidad de horas por semana empleadas en escuchar radio? ¿Cuál de estos medios tiene mayor uso?

30

Pruebas paramétricas

Documents