-
5/20/2018 Pruebas de Hip tesis Actual
1/28
Instituto Tecnolgico de Len
Material didctico/Pruebas de hiptesisElabor Lic. Lilia A. Vzquez
Gutirrez Pgina 1
3 PRUEBAS DE HIPTESIS
Las dos actividades principales de la estadstica inferencial son
el uso de datos
para 1. Estimar un parmetro poblacional (como hicimos en la
unidad anterior), y2. Probar una hiptesis o afirmacin con respecto
a un parmetro poblacional(como veremos en esta unidad).
DEFINICIN:
La prueba de hiptesis comienza con una suposicin, llamada
hiptesis, que se
hace respecto a un parmetro de poblacin. Despus recolectamos
datos demuestra, para decidir qu tan probable es que sea correcto
nuestro parmetro depoblacin.
Para probar la validez de la suposicin se recolectan datos de
muestra y sedetermina la diferencia entre el valor hipottico y el
valor real de la media de dichamuestra; despus se juzga si la
diferencia obtenida es significativa o no.
Mientras ms pequea sea la diferencia entre el valor hipottico y
el real, mayorser la probabilidad de que el valor hipottico para la
media sea correcto.
Mientras mayor sea la diferencia entre el valor hipottico y el
real, ms pequeaser la probabilidad de que el valor hipottico para
la media sea correcto.
En la prueba de hiptesis, las soluciones infalibles son la
excepcin, no la regla.
Ya sea que se acepte o se rechace una hiptesis, no se puede
estarabsolutamente seguro de que la decisin sea correcta; por
consiguiente se tieneque aprender cmo enfrentar la incertidumbre en
la toma de decisiones.
No podemos aceptar o rechazar una hiptesis sobre un parmetro de
poblacinsimplemente por intuicin. Ms bien necesitamos aprender cmo
decidir
objetivamente si aceptamos o rechazamos una corazonada, con base
en lainformacin acerca de la muestra.
Es importante no olvidar que las hiptesis son proposiciones
sobre la poblacin noproposiciones sobre la muestra.
HIP TESIS: es una aseveracin o afirmacin acerca de una propiedad
de unaoblacin.
-
5/20/2018 Pruebas de Hip tesis Actual
2/28
Instituto Tecnolgico de Len
Material didctico/Pruebas de hiptesisElabor Lic. Lilia A. Vzquez
Gutirrez Pgina 2
COMPONENTES DE UNA PRUEBA DE HIPTESIS
HIPTESIS NULA: denotada por Ho es la afirmacin de que el valor
de unparmetro de poblacin (como una media o una proporcin) es igual
a un valor
aseverado. Las siguientes son hiptesis nulas tpicas: La hiptesis
nula se prueba en forma directa, en el sentido de que suponemos
quees verdadera, y llegamos a una conclusin para rechazar o no
rechazarla.HIPTESIS ALTERNATIVA: denotada por es la afirmacin de
que elparmetro tiene un valor que, de alguna manera, difiere de la
hiptesis nula. Lahiptesis alternativa debe emplear alguno de estos
smbolos: >, < o . A
continuacin se presentan seis ejemplos diferentes de hiptesis
alternativas queincluyen medias y proporciones:
Medias: Proporciones:
Nota sobre el uso del smbolo de igualdad en : realizamos la
prueba dehiptesis suponiendo que la media o proporcin es igual a
algn valorespecificado, por consiguiente usamos el signo de =.
Nota sobre la identificacin de la afirmacin original puede
convertirseen hiptesis nula, en la hiptesis alternativa o tal vez
no corresponda con exactituda ninguna de las dos.Por ejemplo, en
ocasiones probamos la validez de la aseveracin de alguien ms,como
la afirmacin de la Coca-Cola de que la cantidad media de las latas
conCoca-Cola es de al menos 12 onzas. Esta afirmacin puede
expresarse essmbolos tales como . Si la aseveracin original es
falsa, entonces . La hiptesis alternativa se vuelve , pero la
hiptesis nula es .Estadstico de prueba:es un valor que se utiliza
para tomar la decisin sobre lahiptesis nula, y se calcula
convirtiendo el estadstico muestral (como la media ola proporcin
muestral ) en una puntuacin (como z o t), bajo el supuesto de quela
hiptesis nula es verdadera.
Emplearemos los siguientes estadsticos de prueba:
-
5/20/2018 Pruebas de Hip tesis Actual
3/28
Instituto Tecnolgico de Len
Material didctico/Pruebas de hiptesisElabor Lic. Lilia A. Vzquez
Gutirrez Pgina 3
Estadstico de prueba para proporciones: Estadstico de prueba
para medias:
El estadstico de prueba para una media usa una distribucin
normal o ladistribucin t de Student, dependiendo de los requisitos
que se satisfagan. Seusarn los mismos criterios descritos en la
estimacin (para distribucin t n
-
5/20/2018 Pruebas de Hip tesis Actual
4/28
Instituto Tecnolgico de Len
Material didctico/Pruebas de hiptesisElabor Lic. Lilia A. Vzquez
Gutirrez Pgina 4
Al examinar la hiptesis alternativa, podemos determinar si la
prueba es de coladerecha, izquierda o de dos colas. La cola
corresponder a la regin crtica quecontiene los valores que entrarn
en conflicto, de manera significativa con lahiptesis nula.
Criterio de decisin: la decisin de rechazar o no rechazar la
hiptesis nula suelerealizarse por medio del mtodo tradicional o
mtodo clsico o de valor crtico.Mtodo de valor crtico: Rechace Hosi
el estadstico de prueba cae dentro de la
regin crtica.No rechace Hosi el estadstico de prueba no cae
dentrode la regin crtica.
Redaccin de la conclusin final: la conclusin de rechazar o no la
hiptesisnula es adecuada para aquellos que tenemos en buen juicio
de tomar un curso deestadstica, pero debemos emplear trminos
sencillos y sin tecnicismos alestablecer el verdadero significado
de la conclusin.
Aceptacin/ no rechazo:algunos libros de texto dicen aceptar la
hiptesis nulaen vez de no rechazar la hiptesis nula. Ya sea que
usemos el trmino aceptar ono rechazar, debemos reconocer que no
estamos probando la hiptesis nula;nicamente estamos diciendo que la
evidencia muestral no es lo suficientementefuerte como para
justificar el rechazo de la hiptesis nula. (Cuando un jurado
noencuentra evidencia suficiente para sentenciar a un sospechoso,
emite unveredicto de no culpabilidad y no un veredicto de
inocencia). El trmino aceptar es
-
5/20/2018 Pruebas de Hip tesis Actual
5/28
Instituto Tecnolgico de Len
Material didctico/Pruebas de hiptesisElabor Lic. Lilia A. Vzquez
Gutirrez Pgina 5
un poco confuso, ya que parece indicar incorrectamente que la
hiptesis nula hasido probada. (Es confuso decir que existe
evidencia suficiente para aceptar lahiptesis nula). La frase no
rechazar dice con mayor correccin que la evidenciadisponible no es
lo suficientemente fuerte para justificar el rechazo de la
hiptesisnula. En este curso emplearemos la terminologa no rechaza
la hiptesis nula, en
vez de aceptar la hiptesis nula.
Mltiples negativos: Cuando se establece la conclusin final en
trminos notcnicos, es posible enunciar afirmaciones correctas con
hasta tres trminosnegativos. Ejemplo: No existe evidencia
suficiente para justificar el rechazo de laaseveracin de que no hay
diferencia entre 0.5 y la proporcin poblacional. Lasconclusiones
con demasiados trminos negativos resultan confusas, por lo que
esaconsejable volver a redactarlas en una forma comprensible, pero
teniendocuidado de no alterar el significado. Por ejemplo, en vez
de decir no exist eevidencia suficiente para justificar el rechazo
de la aseveracin de que no existendiferencias entre 0.5 y la
proporcin poblacional, los siguientes seran mejores
enunciados:
No se rechaza la aseveracin de que la proporcin poblacional es
igual a0.5.
Hasta no obtener evidencia ms firme, continuamos suponiendo que
laproporcin poblacional es igual a 0.5.
PASOS PARA ESTABLECER UNA PRUEBA DE HIPOTESIS
PASO 1.- Debemos establecer el valor supuesto o hipottico del
parmetro depoblacin antes de comenzar.
La suposicin que deseamos probar se conoce como hiptesis NULA,
la cual sedenota con Ho. Esta hiptesis, es la afirmacin sobre una o
ms caractersticaspoblacionales que al inicio suponemos cierta (es
decir, la creencia a priori).
Suponiendo que se quiere probar la hiptesis nula de que la media
poblacional ()es igual a 500; se escribe: Ho: = 500. Si los
resultados de la muestra norespaldan la Ho, se concluye que se
cumple alguna otra cosa.
Siempre que se rechaza la Ho, la conclusin aceptada se llama
hiptesisalternativa (H1).
Ejemplo:
Dada Ho: = 200 (La hiptesis nula es que la media poblacional es
igual a 200)
Se consideran tres hiptesis alternativas posibles:H1: 200 (La
hiptesis alternativa es que la no es igual a 200)
-
5/20/2018 Pruebas de Hip tesis Actual
6/28
Instituto Tecnolgico de Len
Material didctico/Pruebas de hiptesisElabor Lic. Lilia A. Vzquez
Gutirrez Pgina 6
H1: > 200 (La hiptesis alternativa es que la es mayor que
200) H1: < 200 (La hiptesis alternativa es que la es menor que
200)
El propsito de la prueba de hiptesis no es cuestionar el valor
calculado delestadstico de muestra, sino hacer un juicio con
respecto a la diferencia entre ese
estadstico de muestra y un parmetro de poblacin hipottico.
PASO 2.- Despus de establecer las hiptesis nula y alternativa
respectivamente,se debe determinar qu criterio utilizaremos para
decidir aceptar o rechazar la Ho.Es decir se debe determinar que
diferencia debe haber entre y que seconsidere razonable; a dicha
diferencia, establecida por nosotros, se le llamaNIVEL DE
SIGNIFICANCIA. Si suponemos que la hiptesis nula es
correcta,entonces el nivel de significancia indicar el porcentaje
de medias muestrales queestn fuera de ciertos lmites, en estimacin
el nivel de confianza indicaba elporcentaje de medias que caan
dentro de los lmites de confianza definidos.
NOTA: siempre que afirmamos que NO rechazamos la , en realidad
nosreferimos a que no hay diferencia significativa para rechazarla.
Cuando los datos
No hay diferenciasignificativa entre y ,
por lo tanto NO
RECHAZAMOS la H
H1
Nivel de significancia de 0.025
H1
Nivel de significancia de 0.025
Ho
Nivel de confianza de 0.95
Media poblacional
hipottica
Hay una diferencia significativa entre y
por lo tanto rechazamos la
si la
cae en estas dos regiones
-
5/20/2018 Pruebas de Hip tesis Actual
7/28
Instituto Tecnolgico de Len
Material didctico/Pruebas de hiptesisElabor Lic. Lilia A. Vzquez
Gutirrez Pgina 7
de la muestra no hacen que rechacemos una nos comportaremos como
si esahiptesis fuera cierta.
Es posible probar una hiptesis a cualquier nivel de
significancia; solo quemientras ms alto sea el nivel de
significancia que se use para probar una
hiptesis, mayor ser la probabilidad de rechazar una cuando es
cierta, esdecir cometer error tipo I, veamos en que consiste dicho
error.ERROR TIPO I: se refiere al rechazo de una cuando es cierta.
Tambin esconocido como o nivel de significancia.
ERROR TIPO II: es el hecho de no rechazar una cuando es falsa.
Tambin esconocido como .
NO Rechazo
0.50
Nivel de significancia de 0.01
Nivel de significancia de 0.10
Nivel de significancia de 0.50
Misma media en diferentes niveles de significancia puede ser
rechazada o no rechazada.
Regin de aceptacin muy amplia, por lo tanto no se
rechazaranHofalsas y ciertas; poca seguridad al decidir si rechazar
o no
rechazar.
Regin de aceptacin media, equilibrada tal vez; es
equilibrio es decidido por los tomadores de decisio
por medio de exmenes de costos o desventajas
vinculadas con ambos tipos de errores.
Regin de aceptacin bastante reducida, por lo
tanto, rara vez aceptaremos una Hocuando sea
falsa; pero como precio de esta seguridad,frecuentemente
rechazaremos una Hocuando sea
cierta.
Rechazo
0.005
Rechazo
0.005
Rechazo
0.05
Rechazo
0.05
Rechazo
0.25
NO Rechazo
0.99
Rechazo
0.25
NO Rechazo
0.50
-
5/20/2018 Pruebas de Hip tesis Actual
8/28
Instituto Tecnolgico de Len
Material didctico/Pruebas de hiptesisElabor Lic. Lilia A. Vzquez
Gutirrez Pgina 8
La hiptesis nula y alternativa son afirmaciones opuestas acerca
de la poblacin.Una de las dos hiptesis es verdadera, pero no ambas.
Lo ideal es que la pruebade hiptesis lleve a la aceptacin de la
Hocuando esta es verdadera y al rechazode Ho cuando la misma es
falsa. Por desgracia, las conclusiones correctas nosiempre son
posibles. Como la prueba de hiptesis se basa en una
informacinmuestral debe tenerse en cuenta que existe la posibilidad
de error.
Por tanto, al probar cualquier hiptesis estadstica, existen
cuatro situacionesdiferentes que determinan si la decisin final es
correcta o errnea.
HiptesisNula
Investigador
No rechazaHo
RechazaHo
Ho es verdadera Decisincorrecta
ErrorTipo I
Ho es falsa ErrorTipo II
Decisincorrecta
PASO 3.- Decisin sobre el tipo de distribucin a utilizar en la
prueba dehiptesis.
Despus de decidir el nivel de significancia a utilizar, la
siguiente tarea consiste endeterminar la distribucin de
probabilidad adecuada. En la siguiente tabla semuestran las
condiciones para usar la distribucin normal y t en la prueba
dehiptesis respecto a medias:
Desviacin estndarpoblacional () conocida
Desviacin estndarpoblacional () desconocida
n > 30 Distribucin normalTabla z
Distribucin normalTabla z
n 30 Distribucin normal
Tabla z
Distribucin t
Tabla t
-
5/20/2018 Pruebas de Hip tesis Actual
9/28
Instituto Tecnolgico de Len
Material didctico/Pruebas de hiptesisElabor Lic. Lilia A. Vzquez
Gutirrez Pgina 9
PASO 4. Realizar la distribucin, es decir determinar lmites de
la regin deaceptacin y rechazo, graficar posiciones de valores,
tanto estandarizados comocrticos.
Regla de rechazo bilateral: Si zcal< z/2o si zcal> z/2
PASO 5.- Comparamos valores y los interpretamos.
Usaremos el siguiente ejemplo para ilustrar mejor los paso antes
descritos.
PRUEBA DE HIPTESIS PARA LA MEDIA
Ejemplo:
Un fabricante suministra los ejes traseros para los camiones del
correo; estos ejesdeben soportar 80,000 lbs por pulgada cuadrada en
pruebas de carga, pero un ejeexcesivamente fuerte eleva los costos
de produccin de manera significativa. Lalarga experiencia indica
que la desviacin estndar de la fuerza de sus ejes es de4,000 lbs
por pulgada cuadrada. El fabricante selecciona una muestra de 100
ejesde la produccin, los prueba y encuentra que la capacidad de
carga media de la
muestra es de 79,600 lbs por pulgada cuadrada.
Si el fabricante de ejes utiliza un nivel de significancia de
0.05 en la prueba,satisfarn los ejes los requerimientos de
carga?
RESUMEN DEL PROCESO DE 5 PASOS
1.- Establezca sus hiptesis; decida si es una prueba de dos
extremos o de uno solo.Seleccione un nivel de significancia
apropiado para esta decisin.
2.- Decida qu distribucin (t o z) es la apropiada y encuentre el
(los) valor (es) crtico(s) para elnivel de significancia escogido
de la tabla adecuada.
3.- Calcule el error estndar del estadstico de muestra. Use el
error estndar para convertir el
valor observado del estadstico de muestra a un valor
estandarizado.
4.- Esboce la distribucin y marque la posicin del valor de
muestra estandarizado y del (de los)valor(es) crtico(s) para la
prueba.
5.- Compare el valor del estadstico de muestra estandarizado con
el (los) valor(es) crtico(s)para esta prueba e interprete el
resultado.
-
5/20/2018 Pruebas de Hip tesis Actual
10/28
Instituto Tecnolgico de Len
Material didctico/Pruebas de hiptesisElabor Lic. Lilia A. Vzquez
Gutirrez Pgina 10
SOLUCIN:
Intervalo de confianza: 80,000 1.96 (400); 80,000784, por lo
tanto: Lmiteinferior 79,216a Lmite superior 80,784.
La est dada en escala sin procesar; pero los valores crticos
(lmites) usanvalores estandarizados de z; es decir (1.96 en este
caso), lo cual son dosescalas distintas y no podemos compararlas
directamente cuando probamoshiptesis; as que debemos convertir uno
de ellos a escala del otro.
En vez de convertir los valores crticos z a la escala original o
sin procesar, paraobtener nmeros directamente comparables con el
valor observado de convertimos a escala estandarizada utilizando la
frmula de la distribucinmuestral de medias:
= 80,000 lbs = 4,000 lbs
n = 100 ejes
= 79,600 lbsNS = 0.05
Ho: = 80,000
H1: 80,000
Error estndar: Requerimos conocer los lmites de confianza, para
ello, seusa
, es
la media poblacional hipottica, debido a que
dichos lmitesestn en torno a o sea a la hiptesis nula, no ala .
Por otro lado, el valor de z se obtiene de las tablas dedistribucin
normal, lo cual indica a cuantas desviaciones estndarpor arriba
(z>0) o por debajo (z
-
5/20/2018 Pruebas de Hip tesis Actual
11/28
Instituto Tecnolgico de Len
Material didctico/Pruebas de hiptesisElabor Lic. Lilia A. Vzquez
Gutirrez Pgina 11
Retomando los valores del ejemplo mencionado, tenemos que:
Indica que la
est a una desviacin estndar por debajo de la . Y como -1
desviacin estndar cae dentro del rea de aceptacin, se concluye
que no sedebe rechazar Ho; el fabricante debe considerar que sus
ejes satisfacen losrequerimientos de carga.
En realidad los dos mtodos conducen a las mismas conclusiones
perotrabajaremos con el mtodo estandarizado, ya que como dijimos al
principio, no se
juzga la cantidad, sino la ubicacin de la media muestral .Debido
a que concluimos no rechazar la hiptesis nula ya que es verdadera,
nocometimos error tipo I.
Ejemplo: McGraw Hill supone que la vida de su prensa rotativa es
de 14,500horas, con una desviacin estndar de 2,100 horas. De una
muestra de 25prensas, la compaa encuentra una media de muestra de
13,000 horas. A unnivel de significancia de 0.01 Debera concluir la
compaa que la vida promediode las prensas es menor que las
hipotticas 14,500 horas?
SOLUCION:
= 14,500 hras = 2,100 hras
n = 25 prensas= 13,000 hrasNS = 0.01
Ho: = 14,500
H1: < 14,500
Error estndar: Intervalo de confianza: 14,500 2.32 (420);
14,500974.40, porlo tanto: Lmite inferior es 13,525.60
13,526 = 14,500
-2.32 0
-3.57
.49 .50
0.01
= 13,000 hras
-
5/20/2018 Pruebas de Hip tesis Actual
12/28
Instituto Tecnolgico de Len
Material didctico/Pruebas de hiptesisElabor Lic. Lilia A. Vzquez
Gutirrez Pgina 12
INTERPRETACIN: la vida promedio de las prensas si es menor de
14,500 horas,por lo tanto se rechaza la hiptesis nula.
PRUEBA DE HIPTESIS A PARTIR DE DOS MUESTRAS
Ahora utilizaremos datos muestrales de dos muestras
independientes parasometer a prueba hiptesis acerca de dos medias,
dos proporciones y la relacinde varianzas. Comenzaremos por ver la
prueba de hiptesis para la diferencia demedias.
PRUEBA DE HIPTESIS PARA DIFERENCIA DE MEDIAS CON Y
DESCONOCIDAS
Requisitos
1. y se desconocen y no se hace una suposicin sobre l igualdad
de y.2. Las dos muestras son independientes.3. Ambas muestras son
aleatorias simples.4. Los tamaos muestrales no son grandes ( y ) o
ambas
muestras provienen de distribuciones normales.
Estadstico de prueba de hiptesis:
Grados de libertad: cuando calcule valores crticos, utilice gl =
el menor de .Ejemplo:
Los Revenue Commissioners de Irlanda realizaron un concurso de
promocin. Acontinuacin se muestran las edades de los solicitantes
que tuvieron xito y de losque no tuvieron xito. Algunos de los
solicitantes que no tuvieron xito paraobtener la promocin se
quejaron de que hubo discriminacin por edad en lacompetencia.
Maneje los datos como muestras de poblaciones ms grandes yutilice
un nivel de significancia de 0.05 para poner a prueba la aseveracin
de quelos solicitantes sin xito provienen de una poblacin con una
edad media mayorque la de los solicitantes exitosos. Con base en
ese resultado, parece haberdiscriminacin por la edad?
-
5/20/2018 Pruebas de Hip tesis Actual
13/28
Instituto Tecnolgico de Len
Material didctico/Pruebas de hiptesisElabor Lic. Lilia A. Vzquez
Gutirrez Pgina 13
Edades de solicitantes sin xito Edades de solicitantes con
xito34 37 37 38 41 42 43 44 44 45 27 33 36 37 38 38 39 42 42 4345
45 46 48 49 53 53 54 54 55 43 44 44 44 45 45 45 45 46 4656 57 60 47
47 48 48 49 49 51 51 52 54
SOLUCIN: Verificamos que los requisitos se satisfagan: los
valores de las dosdesviaciones estndar poblacionales se desconocen,
y no estamos haciendo unasuposicin de igualdad entre ellas. las dos
muestras son independientes porquelos valores de una muestra no
estn apareados con valores de la otra muestra.Podemos suponer que
las muestras son aleatorias simples. Ambas muestras sonpequeas,
podemos suponer que ambas provienen de distribuciones normales.
Procedemos con la prueba de hiptesis.
La aseveracin de que en los solicitantes sin xito tienen una
edad media mayorque la edad media de los solicitantes con xito se
expresa simblicamente como
. Si la aseveracin original es falsa, entonces .La hiptesis
alternativa es la expresin que no contiene igualdad, y la
hiptesisnula es una expresin de igualdad, de manera que tenemos
(Aseveracin original)Ahora procedemos con la suposicin de que o
.El nivel de significancia es .Puesto que tenemos dos muestras
independientes y estamos probando unaaseveracin acerca de dos
medias poblacionales, utilizamos una distribucin t conel estadstico
de prueba dado anteriormente. El estadstico de prueba se
calculacomo sigue:
Como estamos utilizando una distribucin t, los valores crticos
de t = 1.717 seencuentran es la tabla de dicha distribucin. (Con un
rea de 0.05 en la coladerecha, buscamos el valor t correspondiente
a 22 grados de libertad, que es elms pequeo de y [o el ms pequeo de
22 y 29]). El estadstico deprueba, el valor crtico y la regin
crtica se muestran a continuacin.
-
5/20/2018 Pruebas de Hip tesis Actual
14/28
Instituto Tecnolgico de Len
Material didctico/Pruebas de hiptesisElabor Lic. Lilia A. Vzquez
Gutirrez Pgina 14
Puesto que el estadstico de prueba no se ubica dentro de la
regin crtica, no serechaza la hiptesis nula (o INTERPRETACIN: no
existe evidencia suficiente para sustentar la aseveracin
de que la edad media de los solicitantes sin xito es mayor que
la edad media delos solicitantes con xito. Con base en esta prueba
de hiptesis, no parece existirdiscriminacin por edad.
PRUEBA DE HIPTESIS PARA DIFERENCIA DE MEDIAS CON Y CONOCIDAS
En realidad, las desviaciones estndar poblacionales y casi nunca
seconocen, pero si son conocidas, el estadstico de prueba est
basado en unadistribucin normal y no en una distribucin t. veamos
los siguientes requisitos:
Requisitos:1. Se conocen las dos desviaciones estndar
poblacionales.2. Las dos muestras son independientes.3. Ambas
muestras son aleatorias simples.4. Los dos tamaos muestrales son
grandes (con y ) y las dos
muestras provienen de poblaciones que tienen distribuciones
normales.
Si los requisitos anteriores se satisfacen, el estadstico de
prueba es:
El procedimiento es el mismo que para la distribucin t, descrito
anteriormente.
= 1.717Estadstico de prueba de
datos muestrales t = 1.678
Se rechaza No se rechaza
-
5/20/2018 Pruebas de Hip tesis Actual
15/28
Instituto Tecnolgico de Len
Material didctico/Pruebas de hiptesisElabor Lic. Lilia A. Vzquez
Gutirrez Pgina 15
PRUEBA DE HIPTESIS PARA LA PROPORCIN
Nuevamente, por medio del siguiente ejemplo veremos el proceso
de probarhiptesis para la proporcin.
Ejemplo:
Se ha visto que las redes de contacto son uno de los medios ms
eficaces paraconseguir empleo.
Por medio de los contactos, el individuo que busca un empleo se
vincula con otrose intercambia informacin a travs de una red
informal de personas.
Una encuesta reciente incluy a 703 sujetos elegidos al azar, los
cuales tenan unempleo. De ellos, el 61% dio que haba conseguido el
trabajo por medio del
contacto con amigos y parientes.
Utilice los datos muestrales, con un nivel de significancia de
0.05, para probar laaseveracin de que la mayora de los empleados
(ms del 50%) consiguen sutrabajo por medio de redes de
contactos.
SOLUCIN:
= 0.50n = 703 personas
= 0.61
NS = 0.05
Ho: p= 0.50
H1: p> 0.50
Error estndar: Intervalo de confianza: 0.50
1.64 (0.0188); 0.50
0.0309, por lo
tanto: Lmite superior es 0.531
= 0.50 0.531
0 1.64 5.851
.45.50
0.05
= 0.61
-
5/20/2018 Pruebas de Hip tesis Actual
16/28
Instituto Tecnolgico de Len
Material didctico/Pruebas de hiptesisElabor Lic. Lilia A. Vzquez
Gutirrez Pgina 16
INTERPRETACIN: existe suficiente evidencia muestral para
sustentar laaseveracin de que la mayora de los empleados consiguen
trabajo por medio deredes de contactos.
PRUEBA DE HIPTESIS PARA DIFERENCIA DE PROPORCIONES
Si bien esta seccin se basa en proporciones, podemos utilizar
los mismosmtodos para tratar con probabilidades o podemos tratar
con porcentajesutilizando los equivalentes decimales
correspondientes.
Cuando se prueba una hiptesis acerca de dos proporciones
poblacionales ocuando se construye un estimado del intervalo de
confianza de la diferencia entredos proporciones poblacionales, los
requisitos y la notacin son los siguientes.Observe que cuando se
prueba la hiptesis nula de , no hay necesidad deestimar los
parmetros individuales
y
, sino que estimamos su valor comn
con la proporcin muestral agrupada que se describe a
continuacin.
Requisitos1. Tenemos proporciones de dos muestras aleatorias
simples que son
independientes. (las muestras son independientes si los valores
muestralesseleccionados de una poblacin no estn relacionados ni
apareados dealguna forma con los valores muestrales seleccionados
de la otrapoblacin).
2. Para ambas muestras, el nmero de xitos es de al menos 5 y el
nmerode fracasos es de al menos 5.
Notacin para dos proporciones
Para la proporcin 1 permitimos que
= proporcin poblacional= tamao muestral= nmero de xito en la
muestra (La proporcin muestral) Los significados correspondientes
a
,
,
,
,
son los mismos que los
anteriores, solo que stos provienen de la poblacin 2.
Proporcin muestral agrupada: esta proporcin se denota por y est
dada por:
-
5/20/2018 Pruebas de Hip tesis Actual
17/28
Instituto Tecnolgico de Len
Material didctico/Pruebas de hiptesisElabor Lic. Lilia A. Vzquez
Gutirrez Pgina 17
Denotamos el complemento de como , de manera que .Estadstico de
prueba para dos proporciones (con )
Donde: supuesto en la hiptesis nula y
Utilizamos la tabla de distribucin normal, con base en el nivel
de significancia ,obtenemos los valores crticos utilizando los
procedimientos ya mencionados en laseccin anterior.
El siguiente ejemplo ayudar a aclarar los papeles que desempean
, , , ,etc. En especfico, usted debe reconocer que bajo el supuesto
de igualdad deproporciones, el mejor estimado de la proporcin comn
se obtiene al combinarambas muestras en una muestra grande, de
manera que es el estimador de laproporcin poblacional comn.
Ejemplo:
El sndrome del tnel carpiano es un padecimiento comn de la
mueca,producido por la presin en un nervio. Con frecuencia es el
resultado del usoconstante de movimientos de mueca repetitivos,
como los que se asocian al usodel teclado. De los distintos
tratamientos disponibles, dos son los ms comunes:aplicar un
entablillado o practicar una ciruga. El tratamiento de entablillado
tiene laventaja de no ser invasivo, de ser ms sencillo, ms rpido y
mucho menoscostoso. Sin embargo, estas ventajas justifican optar
por el tratamiento delentablillado en vez del tratamiento
quirrgico? Un factor crucial es el xito del
tratamiento. En una prueba aleatoria controlada se identific a
156 pacientes consndrome del tnel carpiano, a los que se trat con
entablillado o ciruga. Estospacientes fueron evaluados un ao
despus. El xito se defini comocompletamente recuperado o con una
gran mejora, y se determin, despusde un ao, que de los 73 pacientes
que fueron tratados con ciruga, 67 resultaronexitosos. De los 83
pacientes tratados con entablillados, 60 resultaron exitosos.
-
5/20/2018 Pruebas de Hip tesis Actual
18/28
Instituto Tecnolgico de Len
Material didctico/Pruebas de hiptesisElabor Lic. Lilia A. Vzquez
Gutirrez Pgina 18
Estos resultados se muestran a continuacin:
Tratamiento del sndrome del tnel carpianoTratamiento
Ciruga Entablilladoxito un ao despus deltratamiento
67 60
Nmero total de sujetostratados
73 83
Porcentaje de xito 92% 72%
Utilice los datos muestrales de la tabla anterior, con un nivel
de significancia de0.05 para probar la aseveracin de que la tasa de
xito de la ciruga es mejor quela tasa de xito del entablillado.
SOLUCIN: primero debemos verificar que se satisfagan los
requisitosnecesarios. Dado el diseo de este experimento es
razonable suponer que setrata de una muestra aleatoria simple.
Adems, el grupo de tratamiento con cirugaes independiente del grupo
de tratamiento con entablillado. Para el segundorequisito, observe
que el grupo de tratamiento con ciruga tiene 67 xitos en
73pacientes, de manera que existen 6 fracasos. Por lo tanto, el
grupo de tratamientocon ciruga tiene al menos 5 xitos y al menos 5
fracasos. Por otra parte, el grupode tratamiento con entablillado
tiene 60 xitos en 83 pacientes, de manera que elnmero de fracasos
es 23. Por lo tanto, el grupo de tratamiento con entablilladotiene
al menos 5 xitos y al menos 5 fracasos. Para cada una de las dos
muestrasrevisamos que al menos 5 xitos y al menos 5 fracasos. La
verificacin de los
requisitos se complet con xito y procedemos con la prueba de
hiptesis.
En los siguientes pasos estipulamos que los pacientes sometidos
a cirugaconstituyen la muestra 1, y que los pacientes tratados con
entablillado constituyenla muestra 2.
1. La aseveracin de una mayor proporcin de xitos en el grupo
detratamiento con ciruga se expresa como . Si es falso,entonces .
Puesto que nuestra aseveracin de no contieneigualdad, se convierte
en la hiptesis alternativa. La hiptesis nula es laafirmacin de
igualdad, entonces tenemos:
(Aseveracin original)2. El nivel de significancia es 3.
Utilizaremos la distribucin normal (con el estadstico de prueba
dado con
anterioridad). Estimamos el valor comn de y con el estimado de
lamuestra agrupada , calculado como se indica a continuacin, con
espacios
-
5/20/2018 Pruebas de Hip tesis Actual
19/28
Instituto Tecnolgico de Len
Material didctico/Pruebas de hiptesisElabor Lic. Lilia A. Vzquez
Gutirrez Pgina 19
decimales adicionales para minimizar errores de redondeo en
clculosposteriores.
Con , se deduce que
4. Ahora podemos calcular el valor del estadstico de prueba:
5. Calculamos el valor crtico. Con un nivel de significancia en
unaprueba de cola derecha, basada en una distribucin normal, nos
remitimosa la tabla de distribucin normal, para encontrar que un
rea de enla cola derecha corresponde al valor crtico de . En la
siguientefigura podemos observar que el estadstico de prueba se
localiza en laregin crtica limitada por el valor crtico de . Por lo
tantorechazamos la hiptesis nula y concluimos que hay suficiente
evidenciapara sustentar la aseveracin de que la ciruga es ms
exitosa que elentablillado.
PRUEBA DE HIPTESIS PARA VARIANZA
A continuacin veremos cmo realizar una prueba de hiptesis
respecto de unadesviacin estndar poblacional o varianza poblacional
2. Para lo cualutilizaremos la distribucin chi cuadrada, que se
explic en la unidad 3.
El estadstico de prueba para probar la hiptesis acerca de o
2es:
z = 3.12 (estadstico de prueba)
-
5/20/2018 Pruebas de Hip tesis Actual
20/28
Instituto Tecnolgico de Len
Material didctico/Pruebas de hiptesisElabor Lic. Lilia A. Vzquez
Gutirrez Pgina 20
Utilizaremos la tabla de distribucin chi cuadrada, con gl = n1
para el nmero degrados de libertad.
En la unidad 3 sealamos las siguientes propiedades de la
distribucin chicuadrada.
1. Todos los valores son no negativos y la distribucin no es
simtrica.2. Todos los valores crticos se encuentran en la tabla de
dicha distribucin,
utilizando grados de libertad = n1.
La tabla est basada en reas acumulativas de la zona derecha.
Para obtener losvalores crticos en la tabla, primero se localiza el
rengln correspondiente alnmero apropiado de grados de libertad
(donde gl = n 1). Luego, se utiliza el
nivel de significancia para determinar la columna correcta. Los
siguientesejemplos se basan en un nivel de significancia de = 0.05,
pero se puede emplearcualquier otro nivel de significancia de
manera similar.
Prueba de cola derecha: Puesto que el rea a la derecha del valor
crtico es0.05, localice 0.05 en la parte superior de la tabla.
Prueba de cola izquierda: Con un rea de cola izquierda de 0.05,
el rea a laderecha del valor crtico es 0.95, as que localice 0.95en
la parte superior de la tabla.
Prueba de dos colas: Divida el nivel de significancia de 0.05
entre la coladerecha y la cola izquierda, de manera que las reas
a
la derecha de los dos valores crticos sean 0.975 y0.025,
respectivamente. Localice 0.975 y 0.025 en laparte superior de la
tabla. (Vase la figura y el ejemploen la unidad 3 pg. 20).
Ejemplo:
El mundo de la industria comparte esta meta comn: mejorar la
calidad rediciendola variacin. Los ingenieros de control de calidad
desean asegurarse de que unproducto tenga una media aceptable, pero
tambin quieren producir artculos conuna calidad consistente,
eliminando los defectos. La Newport Bottling Company hafabricado
latas de bebidas de cola con cantidades que tienen una
desviacin
estndar de 0.051 onzas. Se prueba una nueva mquina
embotelladora, y unamuestra aleatoria simple de 24 latas produce
las cantidades (en onzas) que selistan a continuacin.
11.98 11.98 11.99 11.98 11.90 12.02 11.99 11.9312.02 12.02 12.02
11.98 12.01 12.00 11.99 11.9511.95 11.96 11.96 12.02 11.99 12.07
11.93 12.05
-
5/20/2018 Pruebas de Hip tesis Actual
21/28
Instituto Tecnolgico de Len
Material didctico/Pruebas de hiptesisElabor Lic. Lilia A. Vzquez
Gutirrez Pgina 21
Estas 24 cantidades tienen una desviacin estndar de s = 0.039
oz. Utilice unnivel de significancia de 0.05 para probar la
aseveracin de que las latas debebidas de cola de la nueva mquina
tienen cantidades con una desviacinestndar menor que 0.051 oz.
SOLUCIN: Probaremos la aseveracin (hiptesis) de que las bebidas
de colaprovienen de una poblacin con una desviacin estndar menor
que 0.051 oz.
Analicemos la situacin por pasos.1: La expresin simblica de la
aseveracin es < 0.051. 2: Si la aseveracin original es falsa,
entonces 0.051. 3: La expresin < 0.051 no incluye igualdad, por
lo que se convierte en lahiptesis alternativa. La hiptesis nula es
la afirmacin de que = 0.051.
Aseveracin original4: El nivel de significancia es = 0.055:
Puesto que la aseveracin es respecto a , usamos la distribucin chi
cuadrada. 6: Calculamos el estadstico de prueba
El valor crtico de 13.091 se encuentra en la tabla de
distribucin chi cuadrada, enel rengln 23 (grados de libertad = n 1
= 23), en la columna correspondiente a
0.95. Observe el estadstico de prueba y los valores crticos que
se muestran acontinuacin.
7: Puesto que el estadstico de prueba no est en la regin crtica
(zona lila), norechazamos la hiptesis nula.
0 Estadstico de prueba de datos muestrales
No rechazo
= 0.051
Rechazo
= 0.051
= 0.05
-
5/20/2018 Pruebas de Hip tesis Actual
22/28
Instituto Tecnolgico de Len
Material didctico/Pruebas de hiptesisElabor Lic. Lilia A. Vzquez
Gutirrez Pgina 22
INTERPRETACIN: no hay suficiente evidencia para sustentar la
aseveracin deque la desviacin estndar de las cantidades con la
nueva mquina sea menorque 0.051 onzas. Quizs la nueva mquina
produce cantidades de bebida de colaque son ms consistentes, con
una desviacin estndar menor que 0.051 oz, peroan no tenemos
evidencia suficiente para sustentar esa aseveracin.
PRUEBA DE HIPTESIS PARA LA RELACIN DE VARIANZAS
Puesto que la caracterstica de variacin entre los datos es
extremadamenteimportante, esta seccin presenta la prueba F para
comparar dos varianzas (odesviaciones estndar) poblacionales
utilizando dos muestras. La distribucin F,vista en la unidad 3 es
la que se utiliza para la prueba F. Por lo cual en estaunidad la
volveremos a usar.
Es sumamente importante estar conscientes de una grave
desventaja de esteprocedimiento: la prueba F para comparar dos
varianzas (o desviacionesestndar) poblacionales es muy sensible a
las desviaciones que se alejan de ladistribucin normal.
Debemos recordar que la varianza es el cuadrado de la desviacin
estndar ytambin debemos conocer la siguiente notacin.
s = desviacin estndar muestral s = varianza muestral
(desviacinestndar muestral al cuadrado)
= desviacin estndar poblacional
= varianza poblacional (desviacin
estndar poblacional al cuadrado)
Los clculos de esta seccin se simplificarn considerablemente si
designamoslas dos muestras de manera que represente a la ms grande
de las dosvarianzas muestrales. Matemticamente no importa cul
muestra se designe comola muestra 1, as que la vida ser ms fcil si
permitimos que represente a lamayor de las dos varianzas
muestrales, como en el estadstico de prueba incluidoen el cuadro de
resumen siguiente.
Requisitos1. Las dos poblaciones son independientes una de la
otra (en la unidad 3
aprendimos que dos muestras son independientes si la
muestraseleccionada de una poblacin no est relacionada con la
muestraseleccionada de la otra poblacin).
2. Las dos poblaciones estn distribuidas normalmente.
Notacin para pruebas de hiptesis con dos varianzas o
desviaciones estndar
-
5/20/2018 Pruebas de Hip tesis Actual
23/28
Instituto Tecnolgico de Len
Material didctico/Pruebas de hiptesisElabor Lic. Lilia A. Vzquez
Gutirrez Pgina 23
La ms grande de dos varianzas muestrales. Tamao de la muestra
que tiene la varianza ms grande. Varianza de la poblacin de donde
se obtiene la muestra con la varianza msgrande.
Los smbolos , y se utilizan para la otra muestra y la otra
poblacin.Estadstico de prueba para pruebas de hiptesis con dos
varianzas donde es la ms grande de las dos varianzas muestrales
Valores crticos: Utilice las tablas de distribucin F para
obtener valores crticos Fque se determinan por lo siguiente:
1. El nivel de significancia (cada tabla tiene valores crticos
para
).
2. Grados de libertad del numerador = (fila superior de cada
tabla)3. Grados de libertad del denominador = (columnas izquierda
y/oderecha de cada tabla).Para dos poblaciones distribuidas
normalmente con varianzas iguales (es decir, ), la distribucin
muestral del estadstico de prueba es ladistribucin F que se muestra
a continuacin.
Algunas propiedades de de la distribucin F son:
1. La distribucin no es simtrica2. Los valores de la distribucin
F no pueden ser negativos.
Valores crticos: Para calcular un valor crtico, primero hay que
remitirnos a la filasuperior de las tablas de distribucin F y
localizar el valor de los grados de libertaddel numerador =
(muestra que tiene la varianza ms grande), luegoen la columna de la
izquierda y/o derecha de las tablas, localizamos el valor de
los
0 Solo valores
no negativos
Valor de
No simtrica
(sesgada a la
derecha)
F
-
5/20/2018 Pruebas de Hip tesis Actual
24/28
Instituto Tecnolgico de Len
Material didctico/Pruebas de hiptesisElabor Lic. Lilia A. Vzquez
Gutirrez Pgina 24
grados de libertad del denominador = , en seguida nos ubicamos
enalguno de los 5 valores de , posteriormente interceptamos la fila
de , lacolumna de con el valor de y ese ser el valor
crtico.Ejemplo:
Determine el valor crtico de F con un , y grados delibertad
respectivamente.SOLUCIN: localizamos el 8 ( en la fila superior y
15 ( enla columna de la izquierda, y enseguida el valor de 0.05
para , y vemos que elvalor crtico es 2.64
Puesto que estamos estipulando que la varianza muestral ms
grande es , todaslas pruebas de una cola sern de cola derecha y
todas las pruebas de dos colasrequerirn que encontremos slo el
valor crtico localizado a la derecha. Buenasnoticias: No tenemos la
necesidad de calcular un valor crtico separando unaregin crtica de
cola izquierda. (Puesto que la distribucin F no es simtrica y
slotiene valores no negativos, un valor crtico de cola izquierda no
puede encontrarseutilizando el negativo del valor crtico de cola
derecha; en vez de ello, el valorcrtico de cola izquierda se
calcula utilizando el recproco del valor de cola derechacon los
nmeros de grados de libertad invertidos.
Interpretacin del estadstico de prueba F: Si en realidad las dos
poblacionestienen varianzas iguales, entonces la proporcin tiende a
1, puesto que losvalores de
y
tienden a acercarse. Pero si las dos poblaciones tienen
varianzas radicalmente diferentes, y tienden a ser nmeros muy
distintos. Sidenotamos la ms grande de las varianzas muestrales
como , vemos que laproporcin ser un nmero grande siempre que y
tengan valoreslejanos entre s. En consecuencia, un valor de F
cercano a 1 ser evidencia afavor de la conclusin de que , y un
valor grande de F ser evidencia encontra de la conclusin de
igualdad de las varianzas poblacionales.
-
5/20/2018 Pruebas de Hip tesis Actual
25/28
Instituto Tecnolgico de Len
Material didctico/Pruebas de hiptesisElabor Lic. Lilia A. Vzquez
Gutirrez Pgina 25
Los valores de F grandes son evidencia en contra de
Aseveraciones acerca de desviaciones estndar: El estadstico de
prueba F seaplica a una aseveracin acerca de dos varianzas, pero
tambin podemosutilizarlo para aseveraciones acerca de dos
desviaciones estndar poblacionales.
Cualquier aseveracin acerca de dos desviaciones estndar
poblacionales puedereplantearse en trminos de las varianzas
correspondientes.
Ejemplo:
Los estadsticos muestrales de un conjunto de datos de muestras
de Coca clsicay Pepsi clsica son los siguientes:
Coca clsica Pepsi clsican 36 36
0.81682 0.82410
s 0.007507 0.005701
SOLUCIN: Verifiquemos los requisitos. En primer lugar, es
evidente que laspoblaciones son independientes entre s. En segundo
lugar, las muestras sugierenque provienen de una poblacin con una
distribucin aproximadamente normal.Los requisitos se cumplen y
podemos continuar con la prueba.
En vez de utilizar las desviaciones estndar muestrales para
probar la aseveracinde desviaciones estndar poblacionales iguales,
utilizamos las varianzasmuestrales para probar la aseveracin de
varianzas poblacionales iguales, peropodemos plantear conclusiones
en trminos de desviaciones estndar. Puesto que
estipulamos en esta seccin que la varianza mayor se denota por ,
permitimosque , , y . Ahora procedemos autilizar los pasos para
generar la prueba de hiptesis.1. La aseveracin de desviaciones
estndar iguales es equivalente a una
aseveracin de varianzas iguales, lo cual se expresa
simblicamente como . Si la aseveracin original es falsa, entonces .
Puesto quela hiptesis nula es la afirmacin de igualdad y dado que
la hiptesisalternativa no puede contener igualdad, tenemos:
(Aseveracin original)
2. El nivel de significancia es .3. Puesto que esta prueba
implica dos varianzas poblacionales, utilizaremos la
distribucin F.
El estadstico de prueba es:
-
5/20/2018 Pruebas de Hip tesis Actual
26/28
Instituto Tecnolgico de Len
Material didctico/Pruebas de hiptesisElabor Lic. Lilia A. Vzquez
Gutirrez Pgina 26
4. En cuanto a los valores crticos, primero observe que se trata
de unaprueba de dos colas con 0.025 en cada cola. En tanto que
estamosestipulando que la varianza ms grande se coloca en el
numerador para el
estadstico de prueba F, necesitamos encontrar slo el valor
crtico de coladerecha. En las tablas de distribucin F vemos que no
hay 35 grados delibertad as que tomamos 30 grados de libertad que
es el valor ms cercanoal 35 pero no se excede, as tenemos que
Esta figura indica que el estadstico de prueba F = 1.7339 no se
localizadentro de la regin crtica, por lo tanto, no rechazamos la
hiptesis nula devarianzas iguales. Se deduce que no existe
evidencia suficiente parasustentar el rechazo de la aseveracin de
desviaciones estndar iguales.
5. INTERPRETACIN: no existe suficiente evidencia para justificar
el rechazode la aseveracin de que las dos desviaciones estndar son
iguales. Si
utilizamos un poco de sentido comn bsico, sabemos que las latas
deCoca y Pepsi provienen de dos procesos de fabricacin
completamenteseparados e independientes, de manera que es poco
probable que las dosvarianzas poblacionales sean exactamente
iguales. No obstante, con baseen nuestro anlisis podemos concluir
que cualquier diferencia entre las dosdesviaciones estndar
poblacionales no es significativa.
En el ejemplo anterior utilizamos pruebas de dos colas para la
aseveracin devarianzas iguales. Una prueba de cola derecha
producira el mismo estadstico deprueba F = 1.7339, pero un valor
crtico de F diferente.
Rechazo de No Rechazode Rechazo de
0 Datos muestrales
F = 1.7339
-
5/20/2018 Pruebas de Hip tesis Actual
27/28
Instituto Tecnolgico de Len
Material didctico/Pruebas de hiptesisElabor Lic. Lilia A. Vzquez
Gutirrez Pgina 27
RESUMEN DE FRMULAS PARA PRUEBAS DE HIPTESIS
Estadstico de contraste con conocida y poblacin infinita
Estadstico de contraste con conocida y poblacin finita
Estadstico de contraste de ladiferencia de medias con
conocida
donde:
Estadstico de contraste con desconocida
Estadstico de contraste con desconocida y poblacin finita
Estadstico de contraste de ladiferencia de medias con
desconocida
donde: Estadstico de contraste de la
proporcin con poblacin infinita
Estadstico de contraste de laproporcin con poblacin finita
Estadstico de contraste de ladiferencia de proporciones
Donde: y
Estadstico de contraste de la
varianza
Estadstico de contraste de la relacin de varianzas
Con y grados de libertad
Para el valor crtico mayor se usa el siguiente teorema:
-
5/20/2018 Pruebas de Hip tesis Actual
28/28
Instituto Tecnolgico de Len
Material didctico/Pruebas de hiptesisElabor Lic. Lilia A. Vzquez
Gutirrez Pgina 28
BIBLIOGRAFIA
Triola, Mario F.
Estadstica. Dcima edicinPearson Educacin, Mxico, 2009
Gutirrez Pulido, HumbertoControl estadstico de Calidad y Seis
SigmaMcGraw Hill, 2009
Lind, Douglas A., Marchal, William G., Wathen Samuel
A.Estadstica aplicada a los negocios y a la economaMcGraw Hill
2008