Capítulo 8 Contrastes de Hipótesis 8.1. Introducción. Conceptos básicos Una hipótesis estadística es una afirmación acerca de una característica poblacional formu- lada en base a los parámetros de su distribución. Existen diversos tipos de hipótesis : - Hacen referencia a un parámetro de una población. Por ejemplo, consideremos el rendimiento obtenido en un proceso químico,X, con dis- tribución N (µ, σ), siendo µ desconocido. Podríamos plantear las siguientes hipótesis: µ = 90 µ 6= 90 µ> 90 µ< 90 Si la hipótesis asigna un único valor al parámetro se le llama hipótesis simple, en ca- so contrario, hipótesis compuesta. En este ejemplo, la primera es simple y el resto son compuestas. - Comparan parámetros de varias poblaciones. Por ejemplo, supongamos que queremos contrastar si el fumar provoca cáncer. Esto equiv- ale a contrastar si la proporción de fumadores con cáncer, p 1 , es significativamente mayor que la proporción de no fumadores con cáncer, p 2 . 119
21
Embed
Contrastes de Hipótesisdmontoro/Metodos/Temas/Tema8.pdf · 122 Capítulo 8. Contrastes de Hipótesis Seleccionamos una muestra de tamaño ny el estadístico de contraste bajo H0
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Capítulo 8
Contrastes de Hipótesis
8.1. Introducción. Conceptos básicos
Una hipótesis estadística es una afirmación acerca de una característica poblacional formu-
lada en base a los parámetros de su distribución.
Existen diversos tipos de hipótesis:
- Hacen referencia a un parámetro de una población.
Por ejemplo, consideremos el rendimiento obtenido en un proceso químico,X, con dis-
tribución N(µ, σ), siendo µ desconocido. Podríamos plantear las siguientes hipótesis:
µ = 90
µ 6= 90µ > 90
µ < 90
Si la hipótesis asigna un único valor al parámetro se le llama hipótesis simple, en ca-
so contrario, hipótesis compuesta. En este ejemplo, la primera es simple y el resto son
compuestas.
- Comparan parámetros de varias poblaciones.
Por ejemplo, supongamos que queremos contrastar si el fumar provoca cáncer. Esto equiv-
ale a contrastar si la proporción de fumadores con cáncer, p1, es significativamente mayor
que la proporción de no fumadores con cáncer, p2.
119
120 Capítulo 8. Contrastes de Hipótesis
Contrastar una hipótesis es comparar lo que dice la hipótesis con la información que nos
proporciona una muestra. Si hay coincidencia, dentro de un margen de error admisible entre la
hipótesis planteada (hipótesis nula, H0) y la información muestral entonces la mantendremos
como cierta, en caso contrario la rechazaremos. Rechazar una hipótesis es sustituirla por otra
que sea capaz de explicar la realidad observada en la muestra (hipótesis alternativa, H1).
Por ejemplo, supongamos que nos planteamos si el rendimiento del proceso puede ser en
media del 90%, H0 : µ = 90. Realizamos una serie de pruebas y el rendimiento medio muestral
resulta ser−x = 75, menor que 90. La información muestral parece ir más a favor de H1 : µ < 90
que de H0 : µ = 90.
Una cosa en la que hay que hacer hincapié es la siguiente: nunca podemos afirmar el que
una hipótesis sea verdadera o falsa, ya que para ello tendríamos que tener observaciones de
toda la población. Por lo tanto, al realizar un contraste y tomar una decisión siempre cabe
la posibilidad de equivocarnos. Existen dos tipos de errores asociados a cualquier contraste:
error tipo I, que tiene lugar cuando rechazamos H0 siendo cierta, y error tipo II, que ocurre si
aceptamos H0 siendo falsa.
H0 cierta H0 falsa
Acepto H0 No hay error Error tipo II
Rechazo H0 Error tipo I No hay error
A la probabilidad de que ocurra el error tipo I se le llama nivel de significación del contraste,
que denotamos por α y que fijamos antes de realizar un contraste. A la probabilidad de error
tipo II la denotamos por β.
A 1− α se le llama nivel de confianza, y a 1− β potencia del test.
α = P (error tipo I)=P (rechazar H0 /H0 es cierta) ,
β = P (error tipo II)=P (aceptar H0 /H0 es falsa)
Lógicamente, a medida que uno disminuye el otro aumenta.
Un ejemplo clásico es el siguiente: supongamos que un juez tiene que declarar a un individuo
culpable o inocente.
H0 : inocente
H1 : culpable
8.2. Pasos a seguir para realizar un contraste 121
Si rechaza H0 declara culpable al individuo, y si la acepta lo declara inocente. Comete un
error de tipo I si declara culpable al acusado siendo inocente, y un error de tipo II si lo declara
inocente siendo culpable. Desde el punto de vista moral parece más grave el primer error, de
ahí que en un contraste se fije el nivel de significación α y se minimice β.
8.2. Pasos a seguir para realizar un contraste
1. Planteamos la hipótesis nula H0 (de tipo igualdad) y la alternativa H1(a favor de la
información muestral).
H0 : θ = θ0
H1 : θ 6= θ0
θ < θ0
θ > θ0
2. Fijamos el nivel de significación del contraste α.Generalmente se fija en 0.05, 0.01 o 0.1.
3. Determinamos una medida de discrepancia entre la hipótesis nula y la información mues-
tral. Esta medida estará en función de la diferencia del valor que especifica H0 para el
parámetro y el estimador muestral del parámetro, y tendrá distribución conocida. A tal
medida la llamamos estadístico de contraste bajo H0.
4. Determinamos la discrepancia máxima que estamos dispuestos a admitir para aceptar H0.
Este valor dependerá de la distribución del estadístico de contraste bajo H0, del nivel de
significación α especificado y del tipo de hipótesis alternativa que tengamos. Delimita las
regiones de aceptación y rechazo de H0.
5. Concluimos: si el estadístico de contraste observado (empírico) cae en la región de rechazo,
rechazamos H0, en caso contrario, la mantendremos como cierta.
Ejemplo 8.1: Sea X → N(µ, σ) con µ, σ desconocidas, y sobre µ planteamos el siguiente
contraste:
H0 : µ = 90
H1 : µ > 90
Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.
122 Capítulo 8. Contrastes de Hipótesis
Seleccionamos una muestra de tamaño n y el estadístico de contraste bajo H0 (suponiendo
H0 cierta) es:
T =
−X − 90
S√n
→ tn−1,
ya que Z =−X−µσ√n
→ N(0, 1), χ2 =(n− 1)S2
σ2→ χ2n−1, son independientes, y T =
Zrχ2
n− 1
.
Observemos que valores observados en−X mucho mayores que 90 irían claramente a favor
de H1 (en contra de H0). A su vez tales valores llevarían a un estadístico de contraste T
muy grande y positivo. En consecuencia, valores muy grandes y positivos en T nos llevarían a
rechazar H0.(siendo cierta). De ahí que la región de rechazo esté en este caso en la cola de la
derecha (de la distribución tn−1) y presente un aréa igual a α (probabilidad de rechazar H0
siendo cierta). El valor que delimita la región de rechazo es por lo tanto t1−α,n−1. Entonces
rechazaremos H0 si el estadístico de contraste observado, t, es mayor o igual que t1−α,n−1.
A la probabilidad de que el estadístico de contraste teórico, este caso T, sea mayor que el
observado, en este caso t, se le llama p-valor. Por lo tanto, el criterio de rechazo en base al
p-valor será: rechazar H0 siempre que el p-valor sea menor o igual que α.
Supongamos que una muestra seleccionada de tamaño 20 nos proporciona una media−x = 98
y una desviación típica s = 2,21. El estadístico observado es por tanto
t =98− 902,21√20
= 16,188
Para un nivel de significación α = 0,05, t1−α,n−1 = t0,95,19 = 1,73. Como 16,188 no es mayor
que 1,73 no podemos rechazar H0.
Ejemplo 8.2: Sobre el ejemplo anterior, consideremos ahora la hipótesis alternativa H1 :
µ < 90.
H0 : µ = 90
H1 : µ < 90
En este caso, valores en−X mucho menores que 90 irían a favor de H1 (en contra de H0).
Por lo tanto, valores muy grandes en valor absoluto y negativos en el estadístico de contraste
llevarían a rechazar H0. La región de rechazo está ahora en la cola de la izquierda, y el valor
que la delimita es tα,n−1. Rechazamos entonces H0 si t ≤ tα,n−1.
8.3. Contrastes de hipótesis clásicos 123
Si observamos una muestra de tamaño 20 y se obtiene una media muestral−x = 83 y una
desviación típica s = 1,96, el estadístico observado es:
t = −3,068,
y tα,n−1 = t0,05,19 = −1,73. Como −3,068 es menor que −1,73, rechazamos H0 para un nivel
de significación del 5%. Por lo tanto, el rendimiento medio es significativamente menor que 90.
Ejemplo 8.3: Consideremos por último la hipótesis alternativa H1 : µ 6= 90.
H0 : µ = 90
H1 : µ 6= 90
En este caso valores en el estadístico muy grandes en valores absoluto, negativos y positivos,
llevarían a rechazar H0. Existen ahora por lo tanto dos regiones de rechazo, una a la izquierda y
otra a la derecha, cada una de las cuales engloba un área de α/2. Los valores que las delimitan
son respectivamente tα/2,n−1 =-t1−α/2,n−1 y t1−α/2,n−1. Rechazamos H0 si t ≤-t1−α/2,n−1 o t≥ t1−α/2,n−1.
Para una muestra de tamaño 20 con media−x = 80 y desviación muestral s = 1,86,
t = −24,044,
y t1−α/2,n−1 = t0,975,19 = 2,09. Como −24,044 es menor que −2,09, rechazamos H0 para un
nivel de significación del 5%. El rendimiento medio es significativamente distinto de 90.
8.3. Contrastes de hipótesis clásicos
8.3.1. Contraste para la media de una normal con varianza conocida
Sea X1,X2, ...,Xn una muestra aleatoria de una población X → N(µ, σ), σ conocida.
Hipótesis nula Estadístico de contraste
H0 : µ = µ0 Z =X − µ0σ/√n
Hipótesis alternativa Criterios de rechazo
H1 : µ 6= µ0
H1 : µ > µ0
H1 : µ < µ0
Z ≤ zα/2 o Z ≥ z1−α/2
Z ≥ z1−α
Z ≤ zα
Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.
124 Capítulo 8. Contrastes de Hipótesis
Ejemplo 8.4: Los sistemas de escape de emergencia para las tripulaciones de aeronaves son
impulsados por un combustible sólido. Una de las características de este producto es la rapidez
de combustión, que se supone con distribución Normal. Las especificaciones requieren que la
rapidez promedio de combustión sea de 50 cm/s. Se sabe que la rapidez estándar de la rapidez
de combustión es σ = 2cm/s. El experimentador decide especificar una probabilidad para el
error tipo I de α = 0,05. Selecciona una muestra aleatoria de tamaño 25 y se obtiene una media
muestral de 53.1 cm/s. ¿A qué conclusiones llega?.
Planteamos el siguiente contraste:
H0 : µ = 50
H1 : µ 6= 50
con varianza conocida.
El estadístico de contraste es:
Z =53,1− 502/√25
= 7,75
Rechazamos H0 si Z ≤ zα/2 o Z ≥ z1−α/2, siendo zα/2 = z0,025 = −1,96 y z1−α/2 =
z0,975 = 1,96. Por lo tanto, rechazamos H0 para un nivel de significación del 5%. La rapidez de
combustión es significativamente distinta de 50 cm/s.
8.3.2. Contraste para la media de una normal con varianza descono-
cida
Sea X1,X2, ...,Xn una muestra aleatoria de una población X → N(µ, σ), σ desconocida.
Hipótesis nula Estadístico de contraste
H0 : µ = µ0 T =X − µ0S/√n
Hipótesis alternativa Criterios de rechazo
H1 : µ 6= µ0
H1 : µ > µ0
H1 : µ < µ0
T ≤ tα/2,n−1 o T ≥ t1−α/2,n−1
T ≥ t1−α,n−1
T ≤ tα,n−1
8.3. Contrastes de hipótesis clásicos 125
Ejemplo 8.5: Un artículo publicado en la revista Materials Engineering describe los resul-
tados de pruebas de resistencia a la adhesión de 22 especímenes de aleación U-700. La carga
para la que cada especimen falla es la siguiente (en MPa):
19.8 18.5 17.6 16.7 15.8
15.4 14.1 13.6 11.9 11.4
11.4 8.8 7.5 15.4 15.4
19.5 14.9 12.7 11.9 11.4
10.1 7.9
¿Sugieren los datos que la carga promedio de fallo es mayor que 10 MPa?. Realizar el
contraste a un 10% de significación.
El contraste a realizar es:
H0 : µ = 10
H1 : µ > 10
con varianza σ2 desconocida.
La media y desviación típica muestrales resultan 13.71 y 3.55 respectivamente, con lo cual:
t =13,71− 103,55/
√22
= 4,90
Dado que t = 4,90 > t1−α,n−1 = t0,95,21 = 1,72, rechazamos H0 al 5% de significación. La
carga promedio de fallo es significativamente mayor que 10.
8.3.3. Contraste para la varianza de una normal con media conocida
Sea X1,X2, ...,Xn una muestra aleatoria de una población X → N(µ, σ), con µ conocida.
Hipótesis nula Estadístico de contraste
H0 : σ2 = σ20 χ2 =
Pni=1 (xi − µ)2
σ20
Hipótesis alternativa Criterios de rechazo
H1 : σ2 6= σ20
H1 : σ2 > σ20
H1 : σ2 < σ20
χ2 ≤ χ2α/2,n o χ2 ≥ χ21−α/2,n
χ2 ≥ χ21−α,n
χ2 ≤ χ2α,n
Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.
126 Capítulo 8. Contrastes de Hipótesis
8.3.4. Contraste para la varianza de una normal con media descono-
cida
Sea X1,X2, ...,Xn una muestra aleatoria de una población X → N(µ, σ), con µ desconocida.
Hipótesis nula Estadístico de contraste
H0 : σ2 = σ20 χ2 =
(n− 1)S2σ20
Hipótesis alternativa Criterios de rechazo
H1 : σ2 6= σ20
H1 : σ2 > σ20
H1 : σ2 < σ20
χ2 ≤ χ2α/2,n−1 o χ2 ≥ χ21−α/2,n−1
χ2 ≥ χ21−α,n−1
χ2 ≤ χ2α,n−1
Ejemplo 8.6: Un fabricante de detergente líquido está interesado en la uniformidad de la
máquina que utiliza para llenar las botellas. De manera específica, es deseable que la varianza
del proceso de llenado sea menor que 0.01, de otro modo existe un porcentaje mayor que el
deseable de botellas con un contenido menor de detergente. Supóngase que la distribución del
volumen de llenado es aproximadamente Normal. Al tomar una muestra aleatoria de 20 botellas
se obtiene una varianza muestral de 0.0153. ¿Tiene el fabricante problemas en el proceso de
llenado de las botellas?. Realizar el contraste al 5% de significación.
El contraste a realizar es:
H0 : σ2 = 0,01
H1 : σ2 > 0,01
con media desconocida.
El estadístico de contraste resulta:
χ2 =19 ∗ 0,01530,01
= 29,07
Puesto que 29.07 no es mayor que χ21−α,n−1 = χ20,95,19 = 30,14, no podemos rechazar H0,
no hay suficiente evidencia empírica para concluir que la varianza del proceso de llenado es
superior a la deseada.
8.3. Contrastes de hipótesis clásicos 127
8.3.5. Contraste para el cociente de varianzas de dos normales inde-
pendientes con medias conocidas
Sea X1,X2, ...,Xn1 una muestra aleatoria de una población X → N(µ1, σ1), y Y1, Y2, ..., Yn2
una muestra aleatoria de una población Y → N(µ2, σ2). Ambas poblaciones se suponen inde-
pendientes.
Hipótesis nula Estadístico de contraste
H0 : σ21 = σ22 F =
Pn1i=1 (xi − µ1)
2 /n1Pn2i=1 (yi − µ2)
2 /n2
Hipótesis alternativa Criterios de rechazo
H1 : σ21 6= σ21
H1 : σ21 > σ22
H1 : σ21 < σ22
F ≤ 1/f1−α/2,n2,n1 o F ≥ f1−α/2,n1,n2F ≥ f1−α,n1,n2
F ≤ 1/f1−α,n2,n1
8.3.6. Contraste para el cociente de varianzas de dos normales inde-
pendientes con medias desconocidas
Sea X1,X2, ...,Xn1 una muestra aleatoria de una población X → N(µ1, σ1), y Y1, Y2, ..., Yn2
una muestra aleatoria de una población Y → N(µ2, σ2). Ambas poblaciones se suponen inde-
pendientes.
Hipótesis nula Estadístico de contraste
H0 : σ21 = σ22 F =
S21S22
Hipótesis alternativa Criterios de rechazo
H1 : σ21 6= σ22
H1 : σ21 > σ22
H1 : σ21 < σ22
F ≤ 1/f1−α/2,n2−1,n1−1 o F ≥ f1−α/2,n1−1,n2−1
F ≥ f1−α,n1−1,n2−1
F ≤ 1/f1−α,n2−1,n1−1
8.3.7. Contraste para la diferencia de medias de dos normales inde-
pendientes con varianzas conocidas
Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.
128 Capítulo 8. Contrastes de Hipótesis
Sea X1,X2, ...,Xn1 una muestra aleatoria de una población X → N(µ1, σ1), y Y1, Y2, ..., Yn2
una muestra aleatoria de una población Y → N(µ2, σ2). Ambas poblaciones se suponen inde-
pendientes.
Hipótesis nula Estadístico de contraste
H0 : µ1 − µ2 = δ0 Z =X − Y − δ0s
σ21n1+
σ22n2
Hipótesis alternativa Criterios de rechazo
H1 : µ1 − µ2 6= δ0
H1 : µ1 − µ2 > δ0
H1 : µ1 − µ2 < δ0
Z ≤ zα/2 o Z ≥ z1−α/2
Z ≥ z1−α
Z ≤ zα
8.3.8. Contraste para la diferencia de medias de dos normales inde-
pendientes con varianzas desconocidas pero iguales
Sea X1,X2, ...,Xn1 una muestra aleatoria de una población X → N(µ1, σ), y Y1, Y2, ..., Yn2
una muestra aleatoria de una población Y → N(µ2, σ). Ambas poblaciones se suponen inde-
pendientes.
Hipótesis nula Estadístico de contraste
H0 : µ1 − µ2 = δ0 T =X − Y − δ0sS2p
µ1
n1+1
n2
¶Hipótesis alternativa Criterios de rechazo
H1 : µ1 − µ2 6= δ0
H1 : µ1 − µ2 > δ0
H1 : µ1 − µ2 < δ0
T ≤ tα/2,n o T ≥ t1−α/2,n
T ≥ t1−α,n
T ≤ tα,n
,
donde
n = n1 + n2 − 2S2p =
(n1 − 1)S21 + (n2 − 1)S22n
8.3. Contrastes de hipótesis clásicos 129
Ejemplo 8.7: Se analizan dos catalizadores para determinar la forma en la que afectan
el rendimiento promedio de un proceso químico. De manera específica, el catalizador 1 es el
que se está empleando en este momento, pero el catalizador 2 también es aceptable. Como el
catalizador 2 es más caro, sólo interesará emplearlo siempre y cuando aumente el rendimiento
promedio del proceso. Se hace una prueba piloto, y los rendimientos obtenidos en% son los
siguientes:
Catalizador 1 Catalizador 2
91.5 89.19
94.18 90.95
92.18 90.46
95.39 93.21
91.79 97.19
89.07 97.04
94.72 91.07
89.21 92.75
(a) Contrastar al 10% de significación si la variabilidad en el rendimiento del proceso puede
considerarse independiente del catalizador empleado.
El contraste es:
H0 : σ21 = σ22
H1 : σ21 6= σ22
con medias desconocidas.
El estadístico de contraste resulta:
F =S21S22
=5,688
8,901= 0,639
Como F no es menor que 1/f1−α/2,n2−1,n1−1 = 1/f0,95,7,7 = 0,264 ni F es mayor que
f1−α/2,n1−1,n2−1 = f0,95,7,7 = 3,79, no podemos rechazar H0, por lo tanto, la variabilidad
en el rendimiento del proceso puede considerarse independiente del catalizador empleado.
(b) Contrastar al 5% si interesa emplear el catalizador 2.
Veamos si el catalizador 2 aumenta el rendimiento promedio del proceso.
Delia Montoro Cazorla. Dpto. de Estadística e I.O. Universidad de Jaén.
130 Capítulo 8. Contrastes de Hipótesis
Planteamos entonces el siguiente contraste:
H0 : µ1 − µ2 = 0
H1 : µ1 − µ2 < 0
con varianzas desconocidas pero iguales (según el contraste realizado anteriormente).
T =X − Y − δ0sS2p
µ1
n1+1
n2
¶ =92,255− 92,733− 0s7,295
µ1
8+1
8
¶ = −0,354
Como T no es menor que tα,n = t0,05,14 = −1,761 no podemos rechazar H0 para un nivel
de significación del 5%. Por lo tanto, el catalizador 2 no aumenta significativamente el
rendimiento promedio del proceso.
8.3.9. Contraste para la diferencia de medias de dos normales rela-
cionadas (muestras apareadas) con varianzas desconocidas pero
iguales
Sea X1,X2, ...,Xn una muestra aleatoria de una población X → N(µ1, σ), apareada con
una muestra Y1, Y2, ..., Yn de una población Y → N(µ2, σ).
Hipótesis nula Estadístico de contraste
H0 : µ1 − µ2 = δ0 T =D − δ0q
S2Dn
Hipótesis alternativa Criterios de rechazo
H1 : µ1 − µ2 6= δ0
H1 : µ1 − µ2 > δ0
H1 : µ1 − µ2 < δ0
T ≤ tα/2,n−1 o T ≥ t1−α/2,n−1
T ≥ t1−α,n−1
T ≤ tα,n−1
donde D = X − Y .
Ejemplo 8.8: Se desea comparar dos métodos para predecir la resistencia al corte de vigas
de placa de acero. Con este fin se selecciona una muestra de 9 vigas, a las que se aplican los
8.3. Contrastes de hipótesis clásicos 131
dos métodos. Los datos se presentan en la siguiente tabla: