Top Banner
Página 1 de 119 Universidad Nacional José Faustino Sánchez Carrión Facultad de Ingeniería Industrial, Sistemas e Informática Huacho, agosto de 2013 Inferencia Estadística Ciclo 2013-I I Moisés E. Armas
119

2013_2 Guía Practica Inferencia

Nov 16, 2015

Download

Documents

2013_2 Guía Practica Inferencia2013_2 Guía Practica Inferencia2013_2 Guía Practica Inferencia2013_2 Guía Practica Inferencia
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript

Pgina 77 de 81

Universidad Nacional Jos Faustino Snchez CarrinFacultad de Ingeniera Industrial, Sistemas e Informtica

Huacho, agosto de 2013

PRESENTACIN

La presente publicacin, contiene material didctico, para el curso de INFERENCIA ESTADSTICA, destinados a los alumnos de la Facultad de Ingeniera Industrial, Sistemas e Informtica de esta Casa de Estudios; desarrollada con el propsito de facilitar material didctico complementario al desarrollo de las clases tericas impartidas en el aula.No pretende sustituir al profesor, ni menos a la abundante bibliografa especializada existente en nuestro medio; quienes estamos inmersos en este proceso, somos conscientes, que los alumnos deben contar con los materiales adecuados como para afrontar exitosamente los retos que la nueva competitividad los exige, en este mundo globalizado, el cual lo ha convertido en una pequea aldea global. No es suficiente con asistir a clases, escuchar y revisar lo transmitido; tambin es necesario contar con las herramientas adecuadas; siendo la Inferencia Estadstica, parte de la matemtica aplicada, los alumnos deben contar con los equipos adecuados, para afrontar los retos de la temtica que el curso exige, por lo menos deben contar con una calculadora cientfica, llevar sus tablas estadsticas, e idealmente una Laptop, y ganas y buena voluntad de aprender; con estos implementos, aunado a la gua proporcionada, los alumnos estarn expeditos como para afrontar retos ms grandes, que en la universidad, por limitaciones de tiempo no se pueden tratar.Esta gua est programado para desarrollarse en una sesin de 14 semanas de clase, teniendo en cuenta que el ciclo acadmico consta de 17 semanas, tres de los cuales son dedicadas a evaluacin; en tal sentido se los ha dividido en seis unidades temticas principales; cada uno de ellos presenta una breve introduccin del temario, con nociones bsicas y ejemplos tipos; tambin los alumnos aprendern a manejar el software estadstico SPPS, y el Minitab; sin embargo, ello no desmerece a los otros existentes en el mercado; la razn de su uso, reside simplemente en su disponibilidad.

Moiss E. ArmasProfesor del curso.

I. estimacin DE PARMETROS

Estimacin puntual y ESTIMACIN por intervalos de confianza

Las poblaciones, por lo general son grandes o muy grandes, por lo tanto trabajar con todos sus elementos resultara contraproducente, penoso, costoso y demorara mucho tiempo en procesar la informacin, aparte de que no tendra significado trabajar con todos ellos; en su lugar se trabaja con sus muestras debidamente seleccionadas mediante procedimientos tcnicos, teniendo en cuenta que cada elemento de la poblacin tiene la misma posibilidad de ser seleccionada; los elementos muestrales, representan a la poblacin y trabajando con ellos, tranquilamente pueden extraerse conclusiones y tomar decisiones.

Los indicadores obtenidos procesando a estos elementos muestrales, se llaman estadsticos; los indicadores de la poblacin, se llaman parmetros; determinando los estadsticos, se estar en condiciones de determinar o estimar los parmetros poblacionales, los cuales dentro de ste se tienen: la media, la varianza, la desviacin estndar y la proporcin poblacional; de igual modo en el caso de trabajar con dos o ms poblaciones se pueden obtener otros indicadores, como las diferencias de medias poblacionales, las razones de varianza, y los diseos experimentales.

Cuando exista la necesidad de estimar un parmetro poblacional, puede hacerse siguiendo la tcnica de la estimacin puntual, o la estimacin por intervalos de confianza, o mediante la prueba de hiptesis.ESTIMACIN PUNTUAL DE UN PARMETRO POBLACIONALSe dice que una estimacin es puntual, cuando el estadstico calculado es igual al parmetro poblacional; un caso particular es cuando la media de una muestra conocida por es igual a la media poblacional ; cuando esto sucede se dice que la media muestral es un buen estimador de la media poblacional; igual sucede cuando se estima la proporcin poblacional p, en base a la proporcin muestral ps; sin embargo no siempre los estadsticos resultan ser buenos estimadores poblacionales, como sucede con la varianza muestral, debido a que ste depende del tamao de la muestra; cuando ms grande sea la muestra, menor ser el error de estimacin, y al contrario, cuando ms pequeo sea sta, mayor ser el error; por ello se dice que la s2 no es un buen estimador de la 2.ESTIMACIN POR INTERVALOS DE CONFIANZA DE LA MEDIA POBLACIONALComo una estimacin puntual no siempre ofrecer un resultado confiable, ya que habr una posibilidad de que esta estimacin no se ha obtenido correctamente debido a las caractersticas de la muestra, puede estimarse la media poblacional dentro de ciertos lmites, llamados intervalos de confianza.Si una poblacin se distribuye normalmente, se sabe que aproximadamente el 95% de las observaciones se encuentran dentro del intervalo 2; esto es que existir una probabilidad de que el 95% de las observaciones se encontrar dentro del intervalo [ - 2, + 2] tal como se esquematiza en la figura adjunta.

Los valores de la media se desvan en 2, tanto hacia la derecha como a la izquierda; esa desviacin es conocida como error de estimacin; y ambos constituyen el nivel de confianza; el nmero 2, que correctamente se puede determinar al fijarse un nivel de confianza, de una tabla de distribucin normal, se denomina coeficiente de estimacin y se denota por zc; tratndose de muestras del cual se quiere estimar a la poblacin, =

Fig. 1.1 El 95% de las observaciones se encontrar aproximadamente dentro del intervalo especificado

A manera de ejemplo; cuando se desee conocer el promedio de los niveles de ingresos mensuales de los ingenieros informticos, alguien podra manifestar que estos ingresos podran estar comprendidos entre los S/ 2 000 y S/ 5 000; otro entrevistado podra manifestar que estos ingresos podran estar comprendidos entre los S/ 3 000 y S/ 4 000, y as sucesivamente. Esta forma de hacer estas apreciaciones, es una estimacin basada en ciertos mrgenes llamados intervalos de confianza; para hacer esta estimacin se toma una muestra poblacional de cierto tamao n; asumiendo que esta se distribuye normalmente, se determina su media muestral y con ella se estima la media poblacional, siguiendo implcitamente los procedimientos arriba mostrados.Al desear estimar la media poblacional mediante intervalos de confianza, podra suceder que la varianza poblacional es conocida, o es supuestamente conocida.Estimacin de la media poblacional, conocido su varianza poblacionalSi de una poblacin infinita que se distribuye normalmente, donde desde ya se conoce por experiencias anteriores su varianza poblacional 2, se extrae una muestra aleatoria de tamao n y de esta muestra se determina su media muestral entonces podra existir la necesidad de estimar su media poblacional , para ello se podra asumir que esta media debera estar comprendido dentro de un intervalo definido por [L1, L2]; esto es L1 < < L2.

La amplitud del intervalo estar determinada por el nivel de confianza con el cual se desea estimar la media poblacional, lo cual podra ser un 95%, un 90%, su eleccin depender del carcter de la investigacin; en trminos generales se le denota por 1 - , lo cual significar que existir una probabilidad de 1 de que la media poblacional se encuentra dentro de este intervalo; el resto, ser una probabilidad de que esta media est fuera del intervalo; la Fig 1.2 ilustra el carcter de este planteamiento.

Fig. 1.2 Estimacin de la media poblacional mediante un intervalo de confianza

Esta figura indica que siempre habr una posibilidad de que la media poblacional estar dentro de estos dos lmites L1 y L2, el cual se lo denota por: P(L1 L2) = 1 - ; de este modo, podra afirmarse que en el peor de los casos esta media estar en L1 y en el mejor de los casos en L2, donde L1 = - y L2 = + ; lo normal sera que la media poblacional coincida con la media muestral; la distancia geomtrica de la media muestral a los extremos de los lmites L1 y L2, se conocen como error de estimacin .

Al hacer la estimacin, la probabilidad 1 , se llama nivel de confianza y se prefija de antemano y ello determina la probabilidad de que la media poblacional estar comprendido por estos lmites; define la probabilidad de equivocarse al fijar este intervalo. De igual manera define el mximo error de estimacin del parmetro, y es igual: = L1 - = L2 - ; si se desea que este error sea lo ms pequeo posible, implicar que el tamao de la muestra sea cada vez ms grande.

Establecido el nivel de confianza con el cual se desea estimar la media poblacional, sus extremos crticos sealados por L1 y L2, pueden obtenerse utilizando la tabla de distribucin normal estndar conocidos por zc; el error de estimacin est asociado e este valor y a la desviacin estndar de la poblacin del siguiente modo: = zc*.De esta expresin puede concluirse que un nivel de confianza muy grande, generar un valor crtico zc muy grande, por lo cual el error de estimacin tambin se har ms grande; y a la inversa, cuanto ms pequeo sea el nivel de confianza, generar un valor crtico zc ms pequeo, y por ende un error de estimacin ms pequeo; por lo general, cuando se quiere hacer estimaciones por esta modalidad, se toma un intervalo de confianza del 95% o del 99%, dependiendo de la naturaleza del estudio.

Por otro lado, tambin analizando la expresin del error, puede concluirse, que un error cada vez ms pequeo, demandar que el tamao de la muestra sea ms grande, y una muestra ms pequea, generar un error de estimacin cada vez ms grande.

Reemplazando estas expresiones en el intervalo de confianza, la media poblacional estar comprendido dentro de los intervalos:

: [ zc*, + zc*]

Cuando la poblacin es finita, deber aplicrsele el ajuste poblacional:, siendo N el tamao de la poblacin del siguiente modo: : [ zc**, + zc**]Ejemplo 1.1 Con la finalidad de conocer el promedio de gastos mensuales en telefona mvil, se toma una muestra de 35 usuarios de este equipo, quienes reportaron los siguientes gastos mensuales en Nuevos Soles: 5055303425203034556050455052503530276150

334241454750555650403230363840

Encuentre un intervalo de confianza del 95% para estimar el promedio de gastos de esta poblacin.

Solucin: El promedio de gastos de esta muestra n = 35, es de S/ 42,23 mensuales; como la muestra es grande, se puede asumir que la poblacin sigue una distribucin normal con varianza = 116,77 y desviacin estndar = S/ 10,81; el coeficiente crtico al 95% es zc = 1,96; por lo tanto el intervalo de confianza ser: zc*; reemplazando valores se obtiene: [S/38,65; S/45,81].Los clculos de este intervalo de confianza pueden simplificarse haciendo uso del Minitab; para ello ingrese estos datos en una columna, luego siga la secuencia: Stat Basic Statistics 1-Sample Z; en esta ventana introduzca el nombre de la columna donde estn sus datos; introduzca el valor de la desviacin estndar; en Opciones defina el Nivel de confianza 95,0, luego pulse aceptar y el sistema le mostrar: (38,65; 45,81)

Estimacin de la media poblacional, cuando su varianza poblacional es desconocida

En este caso, de la poblacin que se supone sigue tambin una distribucin normal, se sigue el mismo procedimiento anterior: se extrae una muestra aleatoria de tamao n, y de esta se obtiene su media muestral y varianza muestral s2, pero teniendo en cuenta que la muestra sigue una distribucin t con r = n -1 grados de libertad, donde el error de estimacin ser: = tc*.

Si la poblacin es infinita o finita, se desarrollan los mismos ajustes poblacionales que el caso anterior; por lo tanto la media poblacional estar comprendido: : [ tc*, + tc*],para poblaciones infinitas, y : [ tc**, + tc**], para poblaciones finitas.Ejemplo 1.2 Los ingresos mensuales de los ingenieros informticos se distribuyen normalmente; a fin de estimar los ingresos mensuales de los 500 ingenieros informticos, debidamente colegiados, se selecciona al azar una muestra de 12 ingenieros, y se encuentra que cada uno de ellos manifestaron estar percibiendo mensualmente los siguientes montos en S/: 4 300 2 800 3 500 4 100 1 890 2 550 1 980 3 100 3 000 2 200 3 400 4 600. Encuentre un intervalo de confianza del 95%, para estimar el nivel de ingresos de toda la poblacin de ingenieros.

Solucin. De esta muestra se obtiene que el promedio de ingresos mensuales es de S/ 3 188,3333 con una desviacin estndar de s = S/ 897,82397. La muestra tiene una distribucin t con r = 11 g.l, por lo tanto, al 95%, su tc = 2,201; el error de estimacin de acuerdo a la frmula establecida con los ajustes poblacionales ser = S/ 564,1314; por lo tanto se espera que el promedio de ingresos mensuales de los ingenieros informticos est dentro del intervalo: [S/ 2 554,20 S/ 3 682,46].

Resuelva este problema utilizando el Minitab

Estimacin de la proporcin poblacional

La proporcin poblacional p, tambin puede ser estimada mediante su proporcin muestral ps siguiendo el mismo anlisis precedente, teniendo en cuenta que en este caso que = p y = ps; la desviacin estndar = .

EJERCICIOS

1.1. Seale (F) o verdadero (V) para cada una de las siguientes proposiciones:( ) Un parmetro puede estimarse a base de su poblacin.( ) La estimacin de una parmetro solo puede hacerse puntualmente.( ) Una proposicin deja de ser proposicin cuando es falsa.( ) No es necesario hacer estimaciones para conocer los parmetros poblacionales.( ) La varianza muestral es un buen estimador del parmetro poblacional.( ) Cuanto ms grande es el nivel de confianza, mejor es la estimacin del parmetro.( ) El error de estimacin, depende del nivel de confianza.( ) Los estadsticos pueden ser estimados.( ) El promedio de notas de una muestra de alumnos, puede estimar a toda la poblacin.( ) Para conocer la calidad de servicio de un restaurante debe hacerse una estimacin.1.2. Indique la alternativa correcta, para cada una de las preguntas:En una estimacin de parmetros debe usar:a) Datos poblacionales.b) Datos muestrales.c) Datos poblacionales o muestrales.d) Solamente datos poblacionales.La estimacin de parmetros puede servir:a) Solo para conocer la media muestral.b) Solo para conocer la varianza.c) Solo para conocer la media y la varianza.d) Conocer una medida poblacional.e) Para conocer sus valores representativos.Una estimacin de parmetros se hace:a) Solo seleccionado una muestra aleatoria de pequeo tamao.b) Solo seleccionado una muestra aleatoria de tamao grande.c) Solo seleccionando una muestra aleatoria de cualquier tamao.d) No hay necesidad de estimar parmetros.1.3. Cul es el objeto de hacer estimaciones de parmetros?1.4. En qu casos se pueden hacer estimaciones puntuales, y qu efecto tendran en los resultados?1.5. Considere que los alumnos de ingeniera de la Universidad, en estos momentos afrontan grandes problemas econmicos que les dificulta contar con los suficientes recursos financieros como para seguir estudiando dentro de las aulas universitarias, y que por el momento, usted, no cuenta con la informacin exacta como para establecer un indicador, de qu manera lo obtendra, considerando que al presente cuenta con las herramientas adecuadas?1.6. El promedio de nota de los alumnos de ingeniera se distribuye normalmente con una desviacin estndar de 2,53. Se toma una muestra aleatoria de 12 alumnos, y los resultados de sus respectivos promedios de notas fueron: 13,2, 14,1, 07,8, 10,4, 11,8, 13,3, 06,9, 10,5, 13,2, 12,4, 08,5, y 14,2, respectivamente. a) Estime un intervalo de confianza del 95% para poder apreciar el promedio de notas de todos los alumnos de ingeniera. b) Considere el caso que la poblacin estudiantil est conformado por 456 alumnos; estime un intervalo de confianza del 95% para apreciar el promedio de notas de toda la poblacin estudiantil.1.7. Se desea estimar el promedio a asistencia a cursos de capacitacin, de los profesionales de ingeniera radicados en la ciudad de Lima, durante el ao 2010; con tal propsito se tom una muestra aleatoria de siete ingenieros que participaron en determinados cursos, y las respuestas que se obtuvieron fueron los siguientes: 2, 3, 0, 2, 5, 4, 1 asistencias a diferentes cursos respectivamente. Se estima que la asistencia a los cursos de capacitacin sigue una distribucin normal.a) Mediante una estimacin puntual, indique, de qu manera se puede estimar el promedio de asistencia a los cursos de capacitacin de los ingenieros de la ciudad de Lima.b) Mediante un intervalo de confianza del 92% y otro, del 95%, estime el promedio de asistencia a los cursos de capacitacin; explique la diferencia de sus resultados con respecto al anterior, y la diferencia entre estos ltimos.c) Considere que la poblacin de ingenieros est conformado por 356 profesionales; resuelva los mismos problemas considerando los tems a) y b).1.8. Se llev una encuesta para estudiar el grado de conocimiento en el curso de Base de Datos, a una muestra de 34 alumnos estudiantes de ingeniera informtica, de los cuales solo 8 manifestaban saber algo de este tema. Encuentre un intervalo de confianza del 98%, para estimar la poblacin estudiantil, que se supo conocen este tema, y adems explique el error de estimacin que podra cometerse.1.9. Una empresa de material elctrico fabrica bombillas de alumbrado cuyo tiempo de duracin est aproximadamente distribuida de forma normal, con una desviacin estndar de 40 horas. Si una muestra de 51 bombillas tiene una duracin promedio de 780 horas, encuentre un intervalo de confianza de 96% para la media de la poblacin de todas las bombillas que produce esta empresa; adems explique qu tan grande sera el tamao de la muestra, para que el error de estimar la media total, sea menor el error encontrado.1.10. Una mquina produce piezas metlicas de forma cilndrica; se toma muestra aleatoria de las piezas y los dimetros son: 1,01, 0,98, 1,03, 1,02, 0,98, 0,97, 0,99, 1,04, 0,97 centmetros. Encuentre un intervalo de confianza del 98% para estimar el dimetro medio de las piezas de esta mquina; suponga una distribucin aproximadamente normal.1.11. El 13% de las motobombas hidrulicas, que una empresa fabrica, tienden a fallar a los dos aos de funcionamiento, por problemas de diseo y componentes en la materia prima al momento de su fabricacin; se toma una muestra aleatoria de 40 piezas de un lote de 500 motobombas. a) Encuentre un intervalo de confianza del 99% para estimar el porcentaje de piezas hidrulicas que podran estar fallando. b) Si el intervalo de confianza estimado para este lote fabricado estuvo dentro de los mrgenes 10% y 16%, con qu nivel de confianza se lo determin?1.12. A continuacin se tiene el estado nutricional de los alumnos de ingeniera informtica de una universidad.1. EN ++8. N15. O22. N29. EN +36. EN +43. EN ++

2. O9. EN +16. EN +23. EN +30. O37. O44. N

3. EN +10. EN ++17. O24. EN ++31. N38. EN ++45. EN +

4. O11. N18. EN ++25. EN +32. O39. N46. O

5. EN ++12. N19. O26. EN +33. N40. O47. EN ++

6. N13. EN ++20. EN +27. O34. EN ++41. N48. EN +

7. O14. N21. N28. O35. O42. EN +49. O

Donde: N= normal EN + = Desnutrido en 1er grado. O = obeso EN ++ = Desnutrido en 2do grado.a) Encuentre un intervalo de confianza del 95% para estimar el promedio de desnutridos en primer grado.b) Encuentre un intervalo de confianza del 93% para estimar el promedio de obesos.c) Compare y analice estos dos resultados.1.13. Una muestra seleccionadas al azar, de 37 transportistas que conducen camiones de carga en el territorio peruano, manifestaron que en promedio sus camiones haban recorrido 17 809 kilmetros en un ao, con una desviacin estndar de 2 354 kilmetros, asumiendo que el kilometraje de los transportistas se distribuye normalmente y el Ministerio de Transportes y Comunicaciones, tiene empadronados a 1 148 transportistas.a) Construya un intervalo de confianza del 99% para estimar el promedio de kilmetros que anualmente recorren los camioneros en todo el Per.b) Qu puede afirmar con una probabilidad de 99% de confianza, acerca del tamao posible del error a cometerse, si se estima que el nmero promedio de camiones manejados por sus respectivos propietarios es de 17 809 kilmetros?1.14. Los ingresos mensuales de un grupo de ingenieros informticos fueron estimados entre los S/ 2 300 y S/ 3 900; estime la probabilidad con el cual se determin este intervalo, si la muestra tomada fue de 14 ingenieros y stos presentaron una desviacin estndar en sus ingresos de S/ 654.1.15. De una muestra de 86 familias de un barrio de Lima, se supo que solo el 25% de ellos manifestaron contar con equipos de cmputo dotados de internet; encuentre un intervalo de confianza del 95% para poder estudiar la poblacin total de este barrio compuesto de 1 200 familias, los que cuentan con servicios de internet.1.16. A fin de conocer el temperamento del electorado peruano, ante el advenimiento de las elecciones municipales de una provincia del Per, se toma una muestra 112 electores, de los cuales 40 dijeron que votaran por el candidato A; encuentre un intervalo de confianza del 96% para conocer la fraccin de electores que apoyan a este candidato.1.17. Un distribuidor de discos DVD, utiliza un conjunto de pruebas para evaluar la funcin elctrica de su producto; todos los reproductores de DVD, deben pasar las pruebas diseadas para tales fines, antes de ser lanzados al mercado, para su respectiva comercializacin. Se tom una muestra aleatoria de 356 DVD, de los cuales se encontr que ocho fallan en una o ms de las pruebas; encuentre un intervalo de confianza del 99% para determinar la proporcin de reproductores DVD de la poblacin que pasan todas las pruebas.1.18. Un estudio realizado a 478 clientes que adquirieron equipos de cmputo en la ciudad de Lima, el ao 2011, en relacin al grado de satisfaccin, y el costo de los equipos, mostr los siguientes resultados: Tabla 1.1 Grado de satisfaccin de acuerdo al costo de los equipos de cmputo, de una muestra de clientes, en la ciudad de en el ao.

Grado de satisfaccin Costo de los equipos

Total

CostosoEconmico

N%N%

Satisfecho223 268

Insatisfecho105

Total

a) Complete las celdas vacas de esta tabla.b) Encuentre un intervalo de confianza del 98%, para estimar el porcentaje de clientes que consideran econmico los equipos.c) Determine un intervalo de confianza del 90%, para estimar el porcentaje de clientes insatisfechos con el servicio.d) Determine un intervalo de confianza del 95% para estimar la diferencia entre clientes satisfecho e insatisfecho, respecto al costo de los equipos, considerando un margen de error de estimacin en 3%.e) Si el intervalo de confianza de clientes que consideraron costoso e insatisfechos con estos equipos fue determinado entre el 60,00 y 70,00%, determine el error con el cual se lo estim, y la probabilidad de que ese evento haya ocurrido.f) De qu tamao deber tomarse una muestra poblacional para estudiar el grado de clientes satisfechos con la compra de estos equipos, asumiendo un nivel de confianza del 95% y un margen de error del 4%?1.19. A continuacin se presentan los resultados de una muestra de un grupo de vendedores que laboran dentro de un centro comercial, donde se ofrecen y venden equipos y servicios de cmputo; los resultados presentan la respectiva actitud de los vendedores ante el pblico, al momento de atender a los clientes, bajo sus requerimientos: Tabla 1.2 Nivel de estrs y afn de servicios de una muestra de empleados de un centro comercial..EmpleadoNivel de estrsAfn de Servicio

112

221

321

412

521

612

721

811

912

1012

1121

1211

1322

1421

1522

1611

1721

1812

1921

2021

2112

2221

2312

2411

Donde: Estrs: 1 = Alta Afn de Servicio: 1 = Buena 2 = Normal 2 = Poca

a) Estime un intervalo de confianza del 92% para conocer el grado de estrs Alta de los empleados.b) Determine el intervalo de confianza del 95% para conocer que los empleados muestran un buen afn de servicio.c) Determine el error absoluto al estimar con un intervalo de confianza del 96%, el grado de estrs normal de los empleados.

II. seleccin de tamao de muestra, estimacin de la varianza poblacional y razones de varianza por intervalos de confianza

SELECCIN DE TAMAO DE MUESTRAEl tamao de muestra que debe seleccionarse de una poblacin, est asociado a un margen de error con el que se los deseara estimar, as como un cierto nivel de confianza; es evidente que cuanto ms grande sea el tamao de la muestra, mayor ser la seguridad de que los resultados muestrales reflejan las caractersticas poblacionales; sin embargo tambin es preciso indicar, que cuanto ms grande sea este tamao, los problemas de trabajar con stas sern ms complicadas, ya que demandarn tiempo y esfuerzo para estudiarlo, todo lo cual podra atentar contra la economa de los interesados en la investigacin. En Estadstica no es necesario trabajar con toda la poblacin; basta con seleccionar su muestra representativa, y con los resultados de sta, inferir para toda la poblacin, el problema es determinar de qu tamao debera seleccionarse la muestra, para estar realmente seguros de que ste tamao representar efectivamente a la poblacin. El tamao de muestra se puede seleccionar de una poblacin infinita o de una poblacin finita, para ello se sigue los siguientes procedimientos:a) Seleccionar una muestra aleatoria de cualquier tamao, y determinar su varianza.b) Estimar con qu margen de error deber estimarse la media poblacional.c) Estimar con qu nivel de confianza 1 - deber estimarse tambin la media poblacional.d) Relacionar los siguientes casos: i) Si la poblacin es infinita: = zc*, donde zc es el valor crtico de una distribucin normal estandarizada, el cual se obtiene de acuerdo al nivel de confianza estimado, s es la desviacin estndar de la muestra y , el margen de error estimado; por lo tanto despejando n = ()2.ii) Si la poblacin es finita, de tamao N entonces = zc**, por lo tanto despejando n, se obtendr: n = .

Ejemplo 2.1 Se desea estudiar el nivel de gastos que desarrollan los padres de familia en todo lo concerniente al proceso de inicio del ao escolar de sus hijos, en la provincia de Huaura; de ello no se cuenta con ningn antecedente, por lo que se asume que este estudio tienen la caracterstica de ser original y novedoso; como no se sabe qu tamao de muestra seleccionar, un grupo de entusiasta en estadstica, selecciona una muestra aleatoria de siete padres de familia, y encuentra que stos desarrollaban gastos en los siguientes montos S/: 565 420 350 620 187 401 367, respectivamente, por cada uno de ellos.

Se desea saber, de qu tamao deber seleccionarse una muestra de padres de familia, a fin de conocer realmente el promedio de gastos en sus hijos, al inicio del ao escolar, porque esta muestra de tamao siete, al parecer no es lo suficientemente representativo; para ello considere un nivel de confianza del 95% y un margen de error de a lo ms de S/ 50.

Solucin.

Como la poblacin se asume que es infinita, la frmula que permitir determinar el tamao de la muestra a seleccionar ser = zc*; al 95% zc = 1,96; la desviacin estndar se obtiene de los datos del problema y es igual a s = S/ 143,32680, el error mximo est dado por = S/ 50; despejando n se obtiene que sta debe ser mayor de 32 padres de familia. Ejemplo 2.2 Considere que se est interesado en estudiar el comportamiento de las personas que hacen uso de los Smartphone, entre todos aquellos que hacen uso de esta moderna tecnologa de informacin; para ello se cuenta con una poblacin de 350 usuarios de la ms diversidad de equipos y modelos; hasta el momento no se sabe qu tamao de muestra deber seleccionarse, ya que entrevistar a los 350 usuarios sera complicado y engorroso; por lo tanto asuma que el nivel de confianza con el que se lo estimar ser del 95%, con un error mximo de 5%.

Solucin.La metodologa ser seleccionar a una muestra y de ellos qu proporcin estn haciendo uso de los Smartphone; supngase que se seleccion inicialmente una muestra de 16 personas y de ellas se obtuvo que solo 5 hacan uso de esta tecnologa; por lo tanto ps = = 0,3125 y su qs = 0,6875; luego = ; siendo N = 350, n = 16, = 0,05 y zc = 1,96.Aplicando la frmula para determinar tamao de muestra con ajuste poblacional se obtiene que el tamao de muestra que realmente debe seleccionarse para estudiar el comportamiento de los usuarios de los Smartphone debe ser mayor de 87.

ESTIMACIN DE LA DIFERENCIA DE DOS MEDIAS POBLACIONALES MEDIANTE INTERVALOS DE CONFIANZA

Cuando se est interesado en estimar las diferencias de dos medias poblaciones que se distribuyen normalmente, mediante intervalos de confianza, podra suceder que se conocen sus respectivas varianzas poblacionales, o supuestamente se los conoce.

a) Estimacin de la diferencia de dos medias poblacionales mediante intervalos de confianza, cuando se conocen sus varianzas poblacionales

Para estimar mediante intervalos de confianza, con un nivel de confianza 1 la diferencia de dos medias poblaciones (1 - 2), cuando sus respectivas varianzas poblacionales son conocidas , se extraen dos muestras de tamaos n1 y n2, respectivamente de cada poblacin; la diferencia (1 - 2) estar comprendido dentro del intervalo: [ - ], siendo el error estndar de la diferencia de estas dos medias, equivalente a:

b) Estimacin de la diferencia de dos medias poblacionales mediante intervalos de confianza, cuando supuestamente se conocen sus varianzas poblacionales

Cuando supuestamente se conocen sus varianzas poblacionales, se extraen dos muestras de cada poblacin de tamaos n1 y n2, luego se calculan sus respectivas varianzas muestrales s12 y s22; la diferencia de estas medias muestrales siguen una distribucin t, con r = n1 + n2 2 g.l; la estimacin de la diferencia de sus medias poblacionales, mediante intervalos de confianza se encontrar dentro del intervalo: (1 - 2) [ - ], donde: , y s02() define el promedio de la diferencia de la varianza de sus medias muestrales.

Con el software Minitab se puede hacer estimaciones de intervalos de confianza de la diferencia de dos medias poblacionales, cuando las muestras poblacionales tienen el mismo tamao, para ello introduzca los datos de sus muestras en dos columnas y a continuacin siga la secuencia:Stat Basic Statistics Paired t. En esta ventana Escoja Samples columns, En primera muestra Escriba el nombre de la primera variable; en la Segunda columna, escriba el nombre de la segunda variable; en options escoja el intervalo de confianza, luego pulse dos veces Ok y obtendr el intervalo de confianza deseado.

ESTIMACIN DE LA VARIANZA POBLACIONAL MEDIANTE INTERVALOS DE CONFIANZA

Para hacer esta estimacin se utiliza la distribucin chi cuadrado. Si de una poblacin que sigue una distribucin normal se extrae una muestra de tamao n y se obtiene su varianza s2, entonces el estadstico 2= sigue una distribucin chi cuadrado con r = n 1 g.l.; con esta referencia puede estimarse su varianza poblacional 2 con un nivel de confianza 1 ; una idea de la forma de estimarlo se obtiene con la ayuda de un grfico de la curva de distribucin de la chi, como lo mostrado:

Fig. 2.1 Estimacin de la varianza poblacional mediante un intervalo de confianza

El chi cuadrado poblacional estar dentro de los intervalos para un nivel de confianza 1 y un tamao de muestra n; de acuerdo a esto se obtiene los coeficientes crticos del chi cuadrado, haciendo uso de la respectiva tabla, donde 12(/2;n-1) y 22(1-/2; n-1), y 2= (n 1)s2/2 , utilizando estas expresiones en la relacin de desigualdad de estimacin del intervalo se obtiene los lmites donde podrn estar estimado la varianza poblacional.

ESTIMACIN DE LA RAZN DE DOS VARIANZAS POBLACIONALES MEDIANTE INTERVALOS DE CONFIANZA

Tambin se puede estimar las razones de variacin de dos poblaciones que se distribuyen normalmente, dentro de un intervalo de confianza 1 ; para ello se extraen sus respectivas muestras de tamaos n1 y n2 respectivamente; de igual modo, se calculan sus respectivas varianzas muestrales s12 y s22, donde s12 > s22. El estadstico F = sigue una distribucin F con r1 = n1 -1 y r2 = n2-1 grados de libertad, respectivamente.

De acuerdo al nivel de confianza 1 , de la tabla F, se determina sus valores crticos F1 y F2, y haciendo la respectiva deduccin de F, se podr estimar la razn dentro del intervalo de confianza, la siguiente figura muestra el criterio de estimacin.

Fig. 2.2 Estimacin de la razn de dos varianzas poblacionales mediante intervalos de confianza

Ejemplo 2.3 En una encuesta, sobre gastos mensuales en telefona mvil desarrollada a un grupo de hombres y otro grupo de mujeres, se encontr que cada uno de los entrevistados manifest gastar los siguientes montos mensuales, en S/:Hombres: 40 38 20 25 23 31 36 30 32 y 33;Mujeres: 42 39 41 43 28 26 29 36 31 34 37 33 y 30.a) Encuentre un intervalo de confianza del 95% para estimar el promedio de gastos mensuales en telefona fija, de las mujeres, respecto a los hombres.b) Encuentre un intervalo de confianza del 95% para estimar la variacin de gasto mensual entre este grupo de poblaciones.

Solucin:

a) El promedio de gastos mensuales en telefona de los hombres es de S/ 30,80, y el de las mujeres es de S/ 34,54. Al 95% de nivel de confianza, tc1(0,025; 21) = -2,080 y tc2(0,975;21) = 2,080; la varianza promedio de esta diferencia entre mujeres y hombres s02() , ser: = 2,532 S/.Por lo tanto, el intervalo de confianza para esta diferencia de ambas medias poblacionales ser:: (2 - 1) [ - = [0; 9,01] S/.

b) Se trata de hallar un intervalo de confianza para dos razones de varianza; la varianza de gastos mensuales de los hombres en telefona mvil es de s12 = 42,400 (S/)2, y el de las mujeres s22 = 31,603 (S/)2. El intervalo de confianza del 95% estar limitado por F1 y F2; estando F dentro de estos lmites como lo muestra la Fig. 2.3.F1(0,025; r1, r2) F F2(0,975, r1, r2) donde r1 = 9 corresponde a los grados de libertad del nmero de hombres y r2 = 12, al nmero de grados de libertad de las mujeres; como F = , entonces:F1(0,025; 9, 12) F F2(0,975, 9, 12); reemplazando F por su equivalente y despejando para hallar la razn de cambio, se obtiene:

Reemplazando datos por sus respectivos equivalentes, se tiene que este intervalo de confianza estar dentro de los rangos: [0,3434; 4,5718] (S/)2; en trminos de S/: [0,59; 2,19].

EJERCICIOS

2.1. El promedio de duracin de un lote de 400 bateras de las Laptop se distribuye normalmente con una desviacin estndar de 0,95 horas. Se toma una muestra de un grupo de bateras y se encontr que en promedio presentaban las siguientes duraciones en horas: 3,05 4,10, 3,84 3,26 3,09 3,45 3,67 3,83 3,21 4,05 3,87, antes de ser recargadas. a) Estime un intervalo de confianza del 95% para poder conocer el tiempo promedio de duracin del lote de bateras. b) De qu tamao deber tomarse una muestra de estas bateras, para estudiar el tiempo de duracin de estas, asumiendo un nivel de confianza del 99% y un margen de error no ms de 15 minutos?R: a) El caso corresponde a la determinacin del intervalo de confianza, conociendo la varianza poblacional; por lo tanto al nivel de confianza del 95%, zc = 1,96; el promedio de duracin de las bateras, antes de ser recargadas es = 3,584 horas; por lo tanto [3,02 4,14] horas; b) Aplicando el criterio de seleccin de tamao de muestra considerando tamao poblacional N = 400, y un nivel de confianza del 99%, se debe seleccionar una muestra de 67 alumnos.2.2. Una muestra de 12 pacientes que acudieron a un hospital, a fin de medir sus niveles de colesterol en la sangre, mostr los siguientes resultados: 165, 200, 265, 240, 178, 201, 198, 179, 258, 216, 220 y 232, respectivamente. a) Si el hospital en promedio recibe mensualmente 932 pacientes para hacerse estos anlisis, de qu tamao deber tomarse la muestra a fin de estimar el nivel promedio de colesterol en la sangre de esta poblacin?b) Determine un intervalo de confianza del 95% para estimar el promedio de niveles de colesterol en la sangre de estos pacientes.c) Si el error de estimacin en los niveles de colesterol, de estos pacientes, se determin con un margen de 15, con qu nivel de confianza fue hecho esta estimacin?d) Si el error de estimacin de los niveles de colesterol, de estos pacientes, se determin con un margen de 10, y un nivel de confianza del 90%, de qu tamao se determin la muestra de esta poblacin?e) Si solamente el 33% de estos pacientes muestran niveles normales de colesterol, estime un intervalo de confianza del 95%, para conocer el comportamiento poblacional, asumiendo que se cometa un margen de error de no ms del 4%.f) Determine un intervalo de confianza del 95% para conocer la variacin de los niveles de colesterol de los pacientes de este hospital. 2.3. Ante el advenimiento de las prximas elecciones generales, a fin de elegir al nuevo presidente de la repblica, entre dos candidatos A y B, se desea evaluar la intencin de votos a favor del candidato A, en la provincia de Huaral; para tales fines, no contando con ninguna informacin al respecto, se toma una muestra aleatoria de 15 ciudadanos de esta provincia, encontrndose como respuesta, que seis de ellos manifestaban que iban a votar por este candidato.a) Si la poblacin de electores est conformada por 8 500 personas, de qu tamao deber tomarse una muestra?, a fin de estimar el comportamiento poblacional, por este candidato, asumiendo que el nivel de confianza sea del 93%, y el margen de error de estimacin sea a lo ms de: i) 7%, ii) 4%, iii) 2%. ( i - 161; ii- 492; iii-1966) b) Resuelva el mismo problema asumiendo que la poblacin estudiada est conformada por 1 200 ciudadanos. (142)c) Analice los resultados obtenidos en cada caso.2.4. En la facultad de ingeniera industrial de la UNI, la muestra de un grupo de alumnos, mostr el siguiente rcord acadmico, por cada uno de ellos: 12,1, 13,2, 10,6, 09,8, 10,5, 11,1, 12,2 y 10,8; en tanto, en la UNMSM, otro grupo de alumnos de la misma facultad, mostr los siguientes promedios: 13,2, 14,1, 09,5, 10,3, 11,4, 12,1, 08,6, 09,9, 12,7 y 12,4. Asumiendo que la distribucin de notas sigue una distribucin normal, determine:a) Un intervalo de confianza del 95% para estimar el promedio de las diferencias de notas de los San Marcos y los de la UNI. -1,4; 1,7b) Un intervalo de confianza del 95% para estimar la variacin de notas de los alumnos de la UNI. 0,74; 2,27c) Un intervalo de confianza del 95% para estimar la variacin de notas de los de San Macos. 1,28; 3,26d) Un intervalo de confianza del 95% para estimar la razn de variacin de notas de estas poblaciones estudiantiles. 0,53; 0,612.5. En una investigacin desarrollada para conocer los efectos de trabajos prolongados, en los niveles de triglicridos, en la sangre de los ingenieros informticos, entre quienes practicaban deportes y tambin entre quienes no los practicaban, mostr los siguientes resultados:Tabla Niveles de triglicridos al desarrollar trabajos prolongados, en la sangrede los ingenieros informticos, entre quienes practican deportes y quienesno los practicaDeportesnPromedioDesviacin estndar

Hacen deporte1415227,3

No hacen deporte1520822,1

Se considera que las poblaciones siguen distribuciones normales y que ambas varianzas son supuestamente conocidas; por lo tanto, se pretende estimar la diferencia entre las medias de los niveles de triglicridos, entre las dos poblaciones, as como la variacin de cambio de estos niveles, siendo el nivel de confianza del 95%.2.6. El promedio general de calificaciones de una muestra de ocho estudiantes en edad escolar fue de 12 con una desviacin estndar 2,4. a) Si se desea estimar el promedio general de la poblacin estudiantil con una error de ms o menos 0,5 puntos, de qu nmero de estudiantes averiguarse sus notas, si nivel de confianza debe ser del 95%? R:89b) Si la poblacin estudiantil estuvo conformada por 523 alumnos, de qu tamao se determin su muestra, sabiendo que el promedio general de notas estimado estuvo comprendido entre 11 y 13.2.7. De 15 libros tomadas al azar, publicadas por la Editorial Las Amricas, dos de ellos presentaban fallas de compaginacin.a) Cuntos libros debern revisarse para mantener un nivel de error mximo del 5%, a un nivel de confianza del 99%? b) Encuentre un intervalo de confianza, para estimar la proporcin de libros con fallas de compaginacin, si se espera que el margen de error en su compaginacin no debe ser mayor del 3%.2.8. Una mquina envasadora de lubricantes debe hacerlo en frascos de 50 centmetros cbicos (cc), de otro modo deber detenerse el proceso de envasado a fin de hacer los respectivos ajustes a los sifones de llenado. Para averiguar si este proceso se viene desarrollando de acuerdo a lo establecido, se toman muestras de un determinado nmero de frascos envasados con este lubricante, los cuales presentaban los volmenes de: 44, 48, 50, 57, 50, 52, 48, 49, 46, 53, 56, 49, 46 y 52 cc respectivamente. a) Determine el error estndar de la medida de esta muestra. b) De qu tamao deber ser la nueva muestra, si es que el error estndar de la media muestral desea reducirse a la mitad? c) Determine un intervalo de confianza del 99% para estimar el promedio de llenado de la mquina envasadora.d) Determine un intervalo de confianza del 99% para estimar las variaciones de cambio de estos llenados.2.9. Una muestra de quince clientes que acudan a un cajero automtico de un banco, indic que en promedio tardaban 2,36 minutos en hacer sus transacciones; si el tiempo de demora en estos servicios se distribuye normalmente con una desviacin estndar de 0,48 minutos. a) Determine el error estndar de la media muestral. b) Determine un intervalo de confianza del 94% para estimar el tiempo promedio de demora de los clientes en este cajero.c) Explique el error de estimacin.2.10. Un negocio dedicado a la venta de equipos electrodomsticos, ha implementado un sistema de ventas al crdito, mediante el uso de tarjetas de crdito; sin embargo pasado un determinado tiempo el Gerente de Ventas reporta que este sistema no funciona en la medida esperada, dado que existe un alto porcentaje de morosidad de los clientes, por lo que la empresa duplicar esfuerzos en el cobro de los adeudos. El Gerente toma una muestra de 80 clientes que hacen uso de esta modalidad de compras y encuentra a 50 morosos, a los que debern aplicar los cargos por mora: a) Determine un intervalo de confianza del 95% para estimar la verdadera proporcin de clientes que utilizan este sistema de ventas, de los cuales se considera que debern estar incurriendo en morosidad. b) De qu tamao deber tomarse una nueva muestra, si se considera que el intervalo de estimacin de la media poblacional sea calculado con un nivel de confianza del 97%, con un margen de error no mayor del 4%?2.11. Un sistema artesanal de elaboracin de vasos de cristal indic que una muestra de 13 vasos est logrando que tengan un volumen de 22 cm3. Encuentre un intervalo de confianza para estimar la desviacin estndar de su poblacin: i) Al 91% de confianza. ii) Al 93% de confianza. iii) Al 98% de confianza.2.12. El 18% de una muestra de 16 alumnos de Bromatologa se encuentran desnutridos, en tanto que el 25% de una muestra de diez alumnos de Informtica se encuentran, en las mismas condiciones. Encuentre un intervalo de confianza del 95%, para estimar la razn de variacin de estos grados nutricionales, entre ambos grupos de alumnos. R:[0,41; 4,70]2.13. De la Facultad de Medicina de la Universidad, compuesto por 468 alumnos, se selecciona al azar una muestra de nueve de ellos, de los cuales se obtuvieron sus notas promocionales, durante el pasado ciclo 2011-II, stas notas fueron: 14,2 13,8 12,5 14,2 10,9 13,2 12,6 12,2 y 12,7, respectivamente. a) Si el promedio de notas de los alumnos de esta Facultad, fue estimado entre 11,92 y 13,92, con qu nivel de confianza fue estimado? b) De qu tamao deber tomarse una muestra de alumnos, si el error de estimacin del promedio de notas de stos alumnos, no sea mayor de 0,8 puntos, a un nivel de confianza del 95%? R) a) 1- = 98%, b) n > 151 alumnos2.14. En la Facultad de ingeniera de una poblacin compuesta de 630 alumnos se quiere estudiar el grado de apreciacin de las nuevas laptop Intel Core Duo 7, de una determinada marca; como an no se tiene ninguna informacin, se toma al azar una muestra aleatoria de 12 alumnos a los cuales se les pregunta si stas laptop tienen buen desempeo; solamente ocho de ellos contestaron favorablemente. a) Determine un intervalo de confianza del 95% para estimar el grado de apreciacin de la poblacin estudiada, asumiendo que el mximo error permisible ser del 5%. b) De qu tamao deber tomarse una muestra poblacional si el mximo error ser del 5% con un nivel de confianza del 99%? 2.15. Se desarrolla un estudio a fin de conocer el nivel de ingreso mensuales de los ingenieros informticos, quienes actualmente se encuentran laborando en los sectores pblicos y privados; en tal sentido se pudo clasificar en una muestra de estos profesionales, que haban ingenieros que perciban los siguientes montos:AABCAAA

BAACBBB

CBAACCC

Donde A: representa los ingenieros que ganaban menos de S/ 2000 mensuales; B: los montos donde los ingenieros ganaban entre S/ 2000 y S/ 4000, y C: los montos donde los ingenieros ganaban ms de S/ 4000 mensuales. Determine un intervalo de confianza para estimar el promedio de ingreso de los ingenieros que ganaban ms de S/ 2000, asumiendo que este tenga un nivel de confianza del 95%. 2.16. Los concesionarios de vehculos de dos marcas diferentes, que estos presentan buenos kilometrajes por galn de gasolina; a fin de corroborar estas proposiciones, se toman muestras aleatorias de estas dos marcas de vehculos y se evala su rendimiento, en el consumo de un galn de gasolina, segn kilometraje recorrido; los resultados se muestran a continuacin:Vehculo de marca A: 55 50 56 58 59 51 48 47 46, y 52 km/galonVehculo de marca B: 59 58 59 45 50 52 60 57 45 48 y 49 km/galn.Encuentre:a) Un intervalo de confianza del 95% para estimar la diferencia de consumo de gasolina entre las marcas de vehculo de la B, respecto a la de marca A.b) Un intervalo de confianza del 95% para estimar la variacin de cambio, en el consumo de gasolina de estas dos marcas.2.17. A continuacin se presenta el estado nutricional de una muestra de los alumnos de ingeniera informtica de una universidad.1. EN ++8. N15. O22. N29. EN +36. EN +43. EN ++

2. O9. EN +16. EN +23. EN +30. O37. O44. N

3. EN +10. EN ++17. O24. EN ++31. N38. EN ++45. EN +

4. O11. N18. EN ++25. EN +32. O39. N46. O

5. EN ++12. N19. O26. EN +33. N40. O47. EN ++

6. N13. EN ++20. EN +27. O34. EN ++41. N48. EN +

7. O14. N21. N28. O35. O42. EN +49. O

Donde: N= normal EN + = Desnutrido en 1er grado. O = obeso EN ++ = Desnutrido en 2do grado.a) Encuentre un intervalo de confianza del 95% para estimar la diferencia del promedio de desnutridos en primer grado, con los desnutridos del segundo grado.b) Encuentre un intervalo de confianza del 93% para estimar la diferencia del promedio de obesos y los desnutridos.c) Encuentre un intervalo de confianza del 95% para estimar los niveles de variacin de los alumnos normales.d) Encuentre un intervalo de confianza del 95% para estimar la razn de variacin de los desnutridos y los no desnutridos.e) Analice e interprete sus resultados.

III. estimacin de parmetros poblacionales mediante prueba de hiptesis

HIPTESIS

Una hiptesis es solo una conjetura o suposicin de un hecho que podra suceder o haya sucedido, pero que an no ha sido demostrado; as por ejemplo, si un empresario estara deseoso de incursionar en el mercado de la provincia de Huaura, para ello, segn sus asesores en marketing les aseguran que incursionando en ste mercado, sus utilidades financieras sera altas; en este caso, solo existe una suposicin de que efectivamente habran ganancias, y basado en esto decide incursionar en este mercado; sin embargo, existir alguna duda de que probablemente no ocurriese tal como lo pensado; qu sucedera si luego de haber realizado las inversiones no logra obtener los resultados esperados?; en el mejor de los caso, tambin podra ocurrir que las estimaciones preliminares si se cumplieron tal como lo aseguraban sus asesores de marketing.

En una hiptesis solo se conjetura, y producto de los hechos o la evidencia, esa conjetura podra ser cierta o falsa, ante esta situacin, los investigadores debern decidir qu acciones tomar ante esta conjetura; la decisin adoptada podra conducir a cuatro resultados posibles: i. Haber aceptado una conjetura cierta.ii. Haber rechazado una conjetura cierta.iii. Haber aceptado una conjetura falsa.iv. Haber rechazado una conjetura falsa.Es evidente que en estas cuatro alternativas, solo las decisiones i) y iv) son las correctas, en cambio la ii) y la iii) son decisiones incorrectas, y podra traer graves consecuencias para quienes tomaron esas decisiones equivocadas.Considrese el caso de que un profesor del curso de Matemtica, considera que los alumnos tienen bajo coeficiente intelectual y por lo tanto no es posible desarrollar el curso adecuadamente. Esta suposicin constituye la hiptesis que debe ser demostrada, ya que el profesor supone que los alumnos son de bajo rendimiento; sin embargo en el desarrollo de la investigacin, podra suceder estas cuatro alternativas.i. Se demostr que la suposicin inicial era cierta, por lo tanto el profesor tena la razn.ii. No se le da la razn al profesor, pese a que los alumnos presentan bajo coeficiente intelectual.iii. Acepta lo que el profesor dice, cuando en realidad los estudiantes, si tienen buen coeficiente intelectual. iv. Rechazar lo afirmado por el profesor, cuando en realidad el profesor tena la razn.Estos son los casos posibles donde podran presentarse al decidir tomar una decisin en el momento de plantearse una hiptesis.

CONTRASTE DE HIPTESIS

En estadstica cuando se trabaja con hiptesis, se formulan dos hiptesis, una hiptesis nula H0 y una hiptesis alternativa H1; la H0 solo se lo formula con el nico propsito de negar lo que se quiere demostrar, y la H1 es la hiptesis que se quiere demostrar, el que tambin es conocido como la hiptesis de investigacin.

El objetivo de un contraste de hiptesis es rechazar la H0, ya que rechazndole, se estara aceptando la H1, con lo cual se confirmara lo que se quera demostrar; sin embargo surgir los problemas planteados en el caso anterior, de tomar decisiones incorrectas.

TIPOS DE ERRORES EN UN CONTRASTE DE HIPTESIS

Se comete Error Tipo I, cuando se rechaza una hiptesis verdadera y se comete Error Tipo II, cuando se acepta una hiptesis falsa, como se est desarrollando conjeturaciones, siempre existir una probabilidad de cometer Error de Tipo I, a esa probabilidad se le llama nivel de significancia y se le denota por ; este valor lo asume como riesgo de equivocarse el investigador al momento de hacer el contraste de hiptesis; por lo general = 5%, cuando se hace contraste de hiptesis relacionados con conductas humanas y biolgicas, y = 1%, cuando los estudios estn relacionados con las ciencias fsicas y qumicas, sin embargo, esto es solo una medida referencial, puesto que estos niveles pueden tener otros valores.

A la probabilidad de cometer Error de Tipo II, se le conoce por , y su valor est asociado al Error Tipo I. Si se quisiera reducir estos errores, habra que aumentar el tamao de la muestra, ya que cuanto ms grande sea esta, habrn menores riesgos de equivocacin, sin embargo, por lo que se manifestado, no es posible ni conveniente trabajar con muestras grandes, para estudiar conductas poblacionales.

TIPOS DE CONTRASTE DE HIPTESIS

Los contrastes de hiptesis pueden hacerse para demostrar que hay mejora, que hay reduccin o simplemente no hay ninguna variacin, en las observaciones que vienen desarrollndose; cuando se trata de buscar mejorar en el sentido elevarlo, o reducirlo, el contraste ser unilateral o de una sola cola, y cuando el contraste consiste en ser indiferente a cualquiera de estos dos casos, el contraste ser bilateral o de dos colas.

Al hacer el contraste de hiptesis, por lo general se comienza formulndole en trminos cualitativos, posteriormente se lo expresa en trminos cuantitativos, que es lo que al final sirve para propsitos de clculo.

Contraste unilateral por la izquierda, o de una sola cola; en este caso, el objetivo de la investigacin es reducir; as se podra formular una dieta alimenticia que tenga por objeto reducir el peso de las personas que sobrepasaron un lmite. La probabilidad de rechazar la hiptesis nula a un nivel de significancia estar comprendido por el rea del sector izquierdo de la curva.Fig. 3.1 Contraste unilateral por la izquierda

Fig. 3.2 Contraste unilateral por la derecha.Contraste unilateral por la derecha, tambin de una sola cola; en este caso, el objetivo de la investigacin es mejorar; as se podra implementar un mtodo de trabajo que tenga por objeto aumentar la productividad. La probabilidad de rechazar la hiptesis nula a un nivel de significancia estar comprendido por el rea del sector derecho de la curva.

Contraste bilateral o de dos colas; en este caso, el objetivo de la investigacin es mantener el estado de las cosas como tal; que no haya aumento o no haya disminucin. La probabilidad de rechazar la hiptesis nula a un nivel de significancia estar comprendido por el rea de los dos sectores extremos de la curva.; en este caso, se divide en partes iguales en los dos extremos.

Fig. 3.3 Contraste bilateral.

El siguiente ejemplo ilustra el caso de formularse un contraste de hiptesis: En un centro educativo se ha observado que los alumnos presentan fuertes grados de desnutricin; la direccin de servicio social, sugiere que a los alumnos se les proporcione cierta dosis de dietas alimenticias a fin de mejorar estos niveles actuales; la direccin general, sugiere que estas dietas no sern efectivas, por lo tanto no es conveniente seguir con los consejos de servicio social. El contraste de hiptesis ser en los trminos siguientes:H0: La dieta alimenticia, propuesto por servicio social, no mejorar los niveles nutricionales de los alumnos del centro educativo.H1: La dieta alimenticia, propuesto por servicio social, si mejorar los niveles nutricionales de los alumnos del centro educativo.Como podr observarse, este contraste de hiptesis es de tipo unilateral, en el sentido de que se busca mejorar el estado nutricional de los alumnos; la hiptesis nula formulada, se lo hizo solo con el propsito de negar lo que se desea demostrar, es decir, mejorar el estado nutricional de los alumnos; la hiptesis alternativa, tratar de demostrar que efectivamente habr mejora proporcionando la dieta alimenticia propuesto por servicio social; el objetivo de esta investigacin, ser rechazar la hiptesis nula, para aceptar la hiptesis alternativa; expresndole en trminos cuantitativos esta hiptesis puede expresarse del siguiente modo: El estado nutricional actual de los alumnos es de un valor a, proporcionndole la dieta alimenticia, el nuevo estado nutricional ser mayor de este valor, o sea:H0: = aH1: > aLa hiptesis nula, siempre deber ser formulado en trminos de menor o igual, igual, o mayor o igual, y la hiptesis alternativa, en trminos opuestos a la nula; es decir mayor que, diferente a, o menor que.

PROBLEMA TIPO

Se est interesado en implementar un nuevo tipo de tratamiento teraputico, que resulta costoso, pero se piensa que ser efectivo para rehabilitar a las personas que habitualmente fuman cigarrillos, ya que se ha demostrado que el cigarro es una fuente primaria del incremento de los casos de cncer. Formule un contraste de hiptesis, explicando los tipos de errores que podran cometerse al tomar la respectiva decisin, y cul de ellas sera la ms grave.

H0: El tratamiento teraputico no permitir rehabilitar a los pacientes fumadores de cigarrillos, por lo que no vale la pena hacer gastos en costosos equipos.H1: El tratamiento teraputico permitir rehabilitar a los pacientes fumadores de cigarrillos, no interesando su alto costo, ya que este consumo, es la causa principal de los casos de cncer.

Error Tipo I. Rechazar la hiptesis nula cuando es cierta; se estar aceptando que el tratamiento teraputico ser beneficioso, cuando en realidad no lo es as, haciendo gastos innecesarios, en la creencia de que los ndices de cncer se controlarn.

Error Tipo II. Aceptar la hiptesis nula cuando es falsa; es decir que este tratamiento no permitir rehabilitar a las personas que fuman cigarrillos, dejando de hacer gastos excesivos en su tratamiento, con la posibilidad de que mueran ms personas por causas del cncer, solo por querer evitar gastos.

A la luz de estos dos contrastes, resulta que la decisin ms peligrosa sera el cometer Error Tipo II, ya que por querer ahorrar, se estara condenando a la muerte a las personas, al decidir no hacer dicho tratamiento.

EJERCICIOS

3.1. Considere que en las actuales circunstancias, la seleccin peruana de ftbol se clasificar para el mundial del 2014, a desarrollarse en Brasil; formule un contraste de hiptesis, indicando las decisiones que podran tomarse, y los posibles errores por las que sucedera, y qu consecuencias acarreara el decidir por una de ellas.3.2. Suponga que un investigador desea probar la hiptesis de que a lo ms el 65% de los huachanos es alrgico a la leche fresca; explique cmo el investigador podra cometer: a) Error de tipo I.b) Error de tipo II. 3.3. Una empresa es acusada de discriminar en la contratacin de sus profesionales. a) Si el Juez comete Error de Tipo I, qu tipo de hiptesis est aceptando?b) Si el Juez comete Error Tipo II, qu hiptesis est probando?3.4. Un experto en ingeniera informtica recomienda a una empresa implementar un DATA MART de sistema de ventas, dado que considera que ste le permitir mejorar su sistema de administracin y procesamiento de datos, producindole a la larga beneficios econmicos; los administradores de la empresa son escpticos a esta propuesta, dado que consideran que no requieren de sistemas complejos y costosos, como para seguir obteniendo beneficios, por lo tanto, el pedido del experto, no es viable por el momento. Formule su contraste de hiptesis, y seale los tipos de errores que podran optarse por cualquiera de estas decisiones, indicado cul de ellos sera de consecuencias ms negativas. R H0: La implementacin del DATA MART, en la empresa no reviste importancia, dado que la gestin administrativa actual marcha por buenas condiciones, y ste nuevo es complejo y costoso.H1: La implementacin de un DATA MART, ser beneficioso para la empresa, ya que le permitir mejorar la gestin administrativa, producindole a la larga beneficios econmicos.Error Tipo I. Creer que la implementacin del DATA MART, ser beneficioso para la empresa, cuando en realidad no lo ser; solo le ocasionar complejidades y mayores costos.Error Tipo II. Creer que el DATA MART, no mejorar la gestin administrativa, por lo tanto, perdindose la oportunidad de mejorar la economa de la empresa.Error ms grave: Perder la oportunidad de mejorar la gestin administrativa de la empresa, por no implementar un DATA MART.3.5. En un restaurante, una mquina de bebidas gaseosas se ajusta de manera que la cantidad de bebida que sirva por botella, se distribuir aproximadamente de forma normal, con una media de 200 ml y una desviacin estndar de 15 ml por botella. La mquina se verifica peridicamente tomando una muestra de 9 botellas y calculando el contenido promedio; si el promedio muestral por botella cae en el intervalo 191 y 209 ml, se considerar que la mquina trabaja de manera satisfactoria, de otro modo se concluir que el promedio es diferente de los 200 ml. Encuentre la probabilidad de cometer error de tipo I, cuando el promedio de llenado es de 200 ml.3.6. Los salarios diarios de los obreros de construccin civil en la ciudad de Lima se distribuyen normalmente con una media de S/ 63 y una desviacin estndar de S/ 18. Se detecta que una empresa constructora de la zona cuenta con 52 obreros, paga en promedio S/ 59,60, podra asegurarse que esta empresa est pagando salarios inferiores al normal?; qu podra afirmar si encuentra que en promedio si dicha empresa est pagando S/ 65,30 diarios?3.7. Un socilogo se interesa en la eficacia de un curso de entrenamiento diseado para lograr que ms personas se interesen por la limpieza de su ciudad, dado que se observa en demasa, que hoy en da las ciudades lucen atiborradas de suciedad por doquier, producto del descuido y decida de sus habitantes; formule un contraste de hiptesis y responda: a) Qu hiptesis prueba si comete Error Tipo I? b) Qu hiptesis prueba si comete Error Tipo II? c) Cul de estos dos errores sera el ms grave al tomar una decisin?R: El contraste de hiptesis ser en los siguientes trminos: H0: El curso de entrenamiento no influir para que las personas se interesen por la limpieza de las ciudades, frente a H1: El curso de entrenamiento si influir para que las personas se interesen por la limpieza de las ciudades.a) Si comete Error Tipo I, prueba que el curso de entrenamiento si influir para que las personas se interesen por la limpieza de las ciudades, cuando en la vida real, no suceder as.b) Si comete Error Tipo II, prueba que el curso de entrenamiento no influir para que las personas se interesen por la limpieza de las ciudades, cuando realmente si estn interesados por ella.c) El error ms grave sera, cometer Error Tipo II, ya que se dejara de entrenar a las personas para que aprendan a mantener las ciudades limpias, con las consecuencias que ello acarreara para la salubridad.3.8. Una empresa de material elctrico fabrica bombillas de luz elctrica que tienen una duracin que se distribuyen normalmente con una media de 800 horas y una desviacin estndar de 92 horas; pruebe la hiptesis nula de que la media es igual a 800 horas frente a la alternativa de que la media es diferente de 800 horas, si una muestra de 48 bombillas tiene una duracin de 788 horas. 3.9. El departamento de psicologa de una universidad considera que el 67% de sus estudiantes se encuentran estresados emocionalmente ante el advenimiento de las evaluaciones del primer examen parcial; a fin de confirmar esta aseveracin se toma se toma una muestra de un grupo de estudiantes, y se encuentra que el grado de estrs emocional por cada uno de ellos estaba conformado por los siguientes: E+, N, N, E++, N, N, E+, E+, N, E++, E++, E+, N, E++, N, E+, E+; donde E+ = estrs moderado, E++ = estrs alto, N = Normal. a) Qu podra afirmar respecto a lo afirmado por este departamento, asumiendo un riesgo de equivocarse del 5%? b) Si se estuviera interesado en rechazar una hiptesis nula de que no hay estrs emocional en los alumnos, de qu tamao debera tomarse la muestra para rechazar esta hiptesis? Asuma un riesgo de equivocarse del 5%. R: p = 0,67 proporcin de estresados de la poblacin; ps = 10/17 = 0,588; proporcin de la muestra de estresados; nivel de significancia = 5%.Contraste de hiptesis: H0: p = 0,67 estn estresados por los exmenes; H1: p < 0,67 hay menor proporcin de estresados. a) Al 5%, tc = -1,746 t tR = -0.719; por lo tanto se puede concluir que hay suficiente evidencia como para afirmar que los alumnos se encuentran estresados ante el advenimiento de los exmenes. b) Para determinar el tamao de muestra que permita estudiar el comportamiento de los que bajaron su nivel de estrs ser: n . 101 alumnos.3.10. El Centro de Cmputo de una empresa recibe un lote de 50 laptop para ser distribuidos en sus diferentes unidades administrativas; sin embargo el rea tcnica de esa institucin los rechaza argumentando que estos equipos presentaban serios problemas de funcionamiento de memoria, por su lentitud exagerada, por lo que deben ser rechazadas. El proveedor asegura que todos sus funcionan correctamente, y que todo el problema podra deberse a la falta de manejo o costumbre por parte del usuario. Formule un contraste de hiptesis, indicando los tipos de errores que podran cometerse al optar por una de esas decisiones. R: H0: El lote de las laptop no presentan problemas de funcionamiento de las memorias; todo el problema puede deberse a que los usuarios an no estn familiarizados.H1: El lote de las laptop presentan problemas de funcionamiento de las memorias, por lo que deben ser rechazados..Error Tipo I. Creer que el lote de las laptop presentan problemas de funcionamiento de sus memorias, cuando en realidad estn en buen estado, con el consiguiente riesgo de que todo el lote sea devuelto al proveedor.Error Tipo II. Creer que el lote de las laptop no presentan problemas de funcionamiento, cuando en realidad si los estn, perjudicando a la empresa, en el sentido no querer hacer los correctivos necesarios a fin de que estos equipos trabajen correctamente.3.11. Una compaa afirma que el tiempo necesario para fabricar un artculo es de 53 minutos, con una desviacin estndar de 7 minutos. Se toma una muestra de 90 artculos y se encuentra que el tiempo de fabricacin promedio de cada pieza fue de 56 minutos.a) Al nivel del 5% se podra afirmar que el producto requiere un tiempo mayor de fabricacin que lo afirmado por la compaa?b) Si el tiempo real de fabricacin es de 50 minutos, en la prueba de significacin se cometi un error de Tipo I?3.12. Un profesor examina el curso de Matemtica II; sabe por experiencia que en promedio los alumnos obtienen una calificacin de 12,3. En la actualidad, el profesor selecciona una muestra de 15 alumnos, de una poblacin de 212 alumnos y encuentra que en promedio esta muestra de alumnos obtuvo una calificacin de 12,8 con una desviacin estndar de 3,5. Acierta el profesor al afirmar que estos alumnos tienen rendimiento superior, en comparacin al anterior? Considere un nivel de significancia de 2%. 3.13. Los ingenieros informticos egresados de la Universidad, estn dispuestos a colaborar con su Alma Mater, y deciden disear un nuevo Sistema de Informacin Gerencial, el cual permitir proporcionar las respuestas a las consultas, temas relacionados con la matrcula y procesamiento de notas de los alumnos en tiempo real; por otro lado, existe cierto pesimismo por parte de otro grupo de autoridades, quienes alegan que ya se cuenta con un Sistema de Informacin, y que la adopcin e implementacin de otro nuevo Sistema, solo crear confusin y retardo en los trabajos. En qu casos se cometera Error Tipo I y Error Tipo II, al adoptar una decisin al respecto, al momento de contrastar sus hiptesis, y cul de ellas sera la ms beneficiosa para la Universidad?H0: EL nuevo SIG solo crear confusin y retardo en el proceso de matrcula y procesamiento de datos de los alumnos.H1: El nuevo SIG proporcionar respuestas en tiempo real, informacin respecto a la matrcula y procesamiento de datos de los alumnos. Error Tipo I: Creer que el nuevo SIG proporcionar respuestas en tiempo real, cuando en realidad no lo ser as, ya que solo proporcionar retardo y caos.Error Tipo II. Creer que el nuevo SIG crear confusin y caos, cuando en realidad no ser as, ya que permitir proporcionar respuestas en tiempo real, con las ventajas que ello conllevara. Error ms favorable para la Universidad Error Tipo II.3.14. Un fabricante est interesado en desarrollar un nuevo sedal para pesca que, segn afirma tiene una resistencia promedio a la rotura de 55 kg. Se desea probar la hiptesis de que la = 55 kg frente a la de investigacin, el cual afirma que estas no son as, para ello se define una regin crtica cuando se encuentra que el promedio de una muestra de 20 sedales es menor de 50,2 kilos, con una desviacin estndar de 13,7 kilos. Encuentre la probabilidad de cometer error de Tipo I.R: El contraste de hiptesis ser en los siguientes trminos: H0: = 55 (promedio a la resistencia igual a 55 kilos); frente a H1: < 55 (el promedio a la resistencia es menos de 55 kilos); para una muestra de tamao n = 20, s = 13,7 kilos, cuyo promedio muestral Por lo tanto su tR = -1,557, y es el que define el nivel crtico de aceptacin o rechazo de la hiptesis nula, lo cual indica un rea o nivel de significancia de 7,14%.3.15. Pruebe la hiptesis de que el contenido promedio de los envases de un tipo de lubricante que una empresa debe producir diariamente, es de 10 litros; el ingeniero de planta toma una muestra aleatoria de diez envases, y encuentra que estos contenan las siguientes cantidades: 10,2, 9,7, 10,1 10,3, 10,1, 9,8, 9,9, 10,4, 10,3, y 9,5 litros. Utilice un nivel de significancia de 1% y suponga que la distribucin del contenido es normal. De qu tamao deber tomarse una muestra para rechazar la hiptesis de que estos contenidos no estn cumpliendo con lo establecido?3.16. Se afirma que el diseo especial de un nuevo automvil, puede recorrer en promedio no menos de 20 000 kilmetros por ao, antes de ser sometido a un programa de mantenimiento correctivo. Para probar tal afirmacin se toma una muestra de 60 propietarios de automviles con este diseo, los que llevan un registro del kilometraje recorrido; estara de acuerdo con esta afirmacin, si la muestra indic que estos automviles requirieron mantenimiento al haber recorrido tan solo 19 457 kilmetros en promedio, con una desviacin estndar de 3 000 kilmetros?3.17. INDECOPI est decidido a que el porcentaje de usuarios de software legal se incremente, ya que al presente considera que solo el 10% de los usuarios de estos productos, tienen procedencia legal; en ese sentido emprende una campaa publicitaria de concientizacin para el uso de software legal, en todos los potenciales clientes. A fin de evaluar la efectividad de esta campaa, en Huacho, de una poblacin de 400 usuarios de software, toma una muestra de 80 y encuentra que solo 15 de ellos estaban haciendo uso de software legal. De qu tamao deber tomar una muestra de usuarios de software, para asegurar que la campaa publicitaria gener mayor sensibilizacin en estos usuarios? Considere un margen de error de 5%.R: p = 0,10 hacen uso de software legalN = 400; n = 80, y ps = 15/80 = 0,1875 y qs = 0,8125.H0: La campaa publicitaria no ha sido efectiva, porque la proporcin de usuarios de software legal, sigue siendo el mismo. ( = 0,10)H1: La campaa publicitaria ha sido efectiva, puesto que ha mejorado la proporcin de usuarios de software legal ( > 0,10).Si se calcula su zR teniendo en cuenta el ajuste poblacional, se obtiene que es igual a 2,239, y si se considera que a un nivel de significancia del 5%, zc es 1,645; por lo tanto para rechazar la hiptesis nula, bastara con este zc; por lo que el tamao de la muestra, haciendo los respectivos clculos por ajuste poblacional, deber ser de 148 usuarios.3.18. Se realiza un estudio para determinar si los temas de la materia en un curso de fsica se comprenden mejor cuando se emplea un laboratorio en parte del curso. Se seleccionan estudiantes al azar para que participen, ya sea en un curso de tres horas semestre-hora sin laboratorio, o en un curso de cuatro horas semestre-hora con laboratorio. En la seccin con laboratorio, 11 estudiantes tuvieron una calificacin promedio de 85 con una desviacin estndar de 4,7; mientras que en la seccin sin laboratorio, 17 estudiantes tuvieron una nota promedio de 77 con una desviacin estndar de 6,1. Se podra decir que el curso con laboratorio aumenta la calificacin promedio hasta en 8 puntos? Considere una probabilidad de equivocarse del 5%.3.19. Se cree que no menos el 65% de los habitantes de un centro poblado estn a favor de anexarse a otro distrito. Qu conclusin extraera, si de una muestra de 150 habitantes se encuentra que solo 86 estn a favor de anexarse a otro distrito? Considere un riesgo de equivocarse del 5%. R: H0: p 0,65 (alto nmero de habitantes favor de anexarse a otro distrito), contra H1: p < 0,65 (baja proporcin a favor de anexarse); por lo tanto ps = 0,573 y zR = -2,022 frente a zc = -1,645; por lo tanto debera rechazarse la hiptesis nula, en el sentido de que hay alto nmero de habitantes interesados en anexarse a otro distrito.3.20. Suponga que hasta hace poco tiempo, 40% de todos los ciudadanos estn a favor de la imprescriptibilidad de los delitos cometidos por los funcionarios pblicos; habra razn para creer que la proporcin de ciudadanos en la actualidad ha aumentado, si en una muestra de 125 consultados, solo 54 ciudadanos manifestaban estar a favor de la imprescriptibilidad?; considere un riesgo de equivocarse del 5%.3.21. Por antecedentes histricos se conoce que el tiempo promedio que requieren los estudiantes para sustentar su tesis sigue una distribucin normal, con una media de 32 minutos y una desviacin estndar de 6 minutos. Si una muestra de 20 tesistas demostr que demoraban en sustentar su tesis un tiempo promedio de 35 minutos, podra afirmarse que esta sustentacin est demorando ms del tiempo normal? R: Considerando un nivel de significancia de 5% resulta que no se puede asegurar que los tesistas estn demorando ms del tiempo establecido; considerando un nivel de significancia del 1%, si se puede asegurar que, efectivamente si est demorando ms del tiempo establecido.(demuestre estas afirmaciones)3.22. Los siguientes datos proporcionan los tiempos de respuesta a un sistema de informacin gerencial, proporcionado por dos modelos de PC, probados en PC seleccionados al azar:Modelo de PC tiempo (en segundos)Modelo A 2.04 3.02 1.92 1.87 2.01 2.00 1.89 1.95Modelo B 2.62 1.47 1.83 2.00 1.42 1.76 1.48

Podra afirmarse que el tiempo de respuesta del modelo A es mayor al tiempo de respuesta del modelo B en ms de 0,20 segundos, si la probabilidad de equivocarse es a lo ms del 5%?3.23. Un fabricante de bateras de litio para las Laptop, distribuye sus productos en sus diferentes clientes, asegurando que estos trabajan a un voltaje de 12 voltios, voltaje que permitir trabajar en las mejores condiciones; sin embargo, pasado un cierto tiempo recibe quejas de sus clientes quienes aseguran que estos productos no estn trabajando en las condiciones especificadas, generando problemas a las Laptop; el fabricante decide averiguar si estos clientes tienen la razn, motivo por el cual, selecciona al azar una muestra de bateras, y evala las condiciones de trabajo; los resultados de esta muestra indicaron que la muestra de bateras trabajaban en los siguientes voltajes: 12,5 13 11,9 12,0 12,1 11,5 11,6 12,1 12,8 11,2 y 12,0 Voltios, respectivamente. a) A los resultados de estas evidencias, debera atenderse las quejas de los clientes, o stas podran deberse a una simple casualidad?, asuma un riesgo de equivocarse del 5%. b) Indique los tipos de errores que podran cometerse, y evale las consecuencias de decidir por ellos. R: Contraste de hiptesis en forma cualitativa:H0: Las bateras de litio, estn diseadas para trabajar a 12 voltios, lo cual permitir trabajar en las mejores condiciones a los equipos.H1: Las bateras de litio, no estn trabajando a 12 voltios, los cuales estn generando que los equipos se estn daando.Contraste de hiptesis en forma cuantitativa:H0: = 12,0 voltiosH1: 12,0 voltiosMuestras pequeas; distribucin t; por lo tanto tc(0,95,10)= 2,228 y tr = 0,392; por lo tanto debera aceptarse la hiptesis nula, en el sentido de que las bateras estn trabajando en el voltaje especificado, la diferencia encontrada, puede deberse a una simple casualidad.Error Tipo I: Creer que las bateras no estn trabajando en los 12 voltios establecidos, haciendo caso a los clientes, que podran estar reclamando si fundamento.Error Tipo II: Creer que las bateras estn trabajando a 12 voltios, cuando en realidad no lo estn; por lo tanto no se le estara haciendo caso a los justos reclamos de los clientes, con las consecuencias de poder daar a los equipos de cmputo.Decisin ms grave: Cometer Error Tipo II; podra perderse a los clientes y ganarse un juicio de parte de ellos por daar sus equipos.3.24. El administrador de una empresa de taxis, trata de decidir si el uso de llantas radiales, en lugar de llantas regulares cinturadas mejora la economa de combustible. Se equipan 12 llantas radiales y se manejan durante un recorrido de prueba preestablecido; sin cambiar a los conductores, los mismos automviles se equipan con llantas regulares cinturadas y se manejan otra vez en el recorrido de prueba. El consumo de gasolina, en kilmetros por litro, se registr de la siguiente manera: Tabla Consumo de gasolina en kilmetros por litro, por una muestra de automviles, segn tipo de llantas utilizadasAutomvilLlantas radialesLlantas cinturadas

14,76,1

24,65,2

35,24,2

45,94,7

56,15,2

64,84,6

75,04,3

84,94,7

95,14,9

106,35,2

114,86,1

125,44,4

Podra concluirse que los automviles equipados con llantas radiales dan una economa de combustible mejor que aquellos equipadas con llantas cinturadas? Asuma que la poblacin se distribuye normalmente. Si en promedio se espera que el uso de llantas radiales en los automviles, consuma 5,4 litros por kilmetro, de qu tamao deber tomarse una muestra de otros automviles, para rechazar la hiptesis de que estas muestras no estn cumpliendo con lo esperado? Asuma un nivel de significancia del 1%.3.25. Se dice que una mquina llenadora de bebidas gasificadas est fuera de control, si la desviacin estndar de los contenidos excede de 1,15 cm3. Si una muestra aleatoria de 20 botellas llenadas con esta mquina presenta una desviacin estndar de 1,48 cm3, podramos asumir, al nivel de significancia del 1%, que la mquina est fuera de control?, y al 5%? R:. El contraste de hiptesis corresponde a una Chi cuadrado, por lo tanto H0: = 1,15 cm3 frente a H1: > 1,15 cm3. Al 1% el Chi crtico es 36,19 y el Chi real = 31,46; por lo tanto no se podra rechazar la hiptesis nula en el sentido de que la mquina embotelladora est fuera de control; en cambio al 5%, el Chi real es 30,14, por lo que si debera rechazarse la hiptesis nula, y asumir que la mquina llenadora est fuera de control.3.26. Una agencia de publicidad desea probar, dos formas diferentes de presentacin de publicidad de una locin para hombres. En la publicidad A, el producto es enfocado desde el punto de vista sexy; en la segunda publicidad el producto es enfocado desde el punto de vista profesional; se seleccion una muestra de 15 hombres, usuarios potenciales de esta locin. El procedimiento seguido en la prueba, consiste en dejar que los entrevistados hojeen libremente la publicidad y luego se sometan a un cuestionario diseado para medir el grado de recordacin de los anuncios mostrados; los resultados en puntos, en una escala de 1 al 10, son los siguientes:Tabla . Grado de recordacin, en puntos, de la Locin para hombres segn tipo de publicidad utilizadaen una muestra de hombres, potenciales usuarios de este productoPersona N123456789101112

Publicidad A564746564334

Publicidad B436775455222

Considerando un riesgo de equivocarse del 5%, podra asegurarse que ambas publicidades, generan el mismo tipo de atencin?3.27. Un ingeniero industrial cree que ha perfeccionado un programa de entrenamiento que puede acortar el tiempo de ensamble de una pieza en fabricacin. Para verificar esta suposicin, planea seleccionar diez obreros en forma aleatoria, y realizar estudios de tiempos y movimientos, con ellos, antes y despus de que hayan acabado su programa de entrenamiento; los resultados se muestran a continuacin:Tabla Tiempo de ensamble en segundos, antes y despus de perfeccionamiento del programa para la produccin de la pieza de., desarrollado por una muestra de obreros enObrero N12345678910

Antes12131413141211151314

Despus11121014121212101011

a) Obtenga los lmites de confianza al 99%, sabiendo que el error de estimacin no debe sobrepasar los 5 segundos.b) Confirme si el programa de entrenamiento sirve para reducir el tiempo de ensamble, considerando un margen de equivocarse del 5%.c) Puede asegurarse que la variacin de tiempo antes de implementar el nuevo programa es mayor de 2 segundos?d) Puede considerarse que hay diferencia entre la variacin de tiempos entre ambos programas?3.28. Una nueva variedad de manzana presenta un sabor muy agradable; para ello se ha decidido someter a prueba su rendimiento, plantando este tipo de manzanas junto a otra manzana corriente, en ocho huertos diseminados en una regin apropiada para la produccin de ambas variedades; cuando los rboles empiezan a rendir, se mide su produccin en cajas; los datos obtenidos son los siguientes:Tabla .Rendimiento en cajas, por huerto, segn variedad de manzanasHuertoNueva variedad de manzanaManzana corriente

11512

21214

31413

41312

51011

61214

71415

81710

a) Estime un intervalo de confianza del 99%, para conocer la diferencia promedio de produccin de las manzanas nuevas y las manzanas corrientes, si el margen de error no debe ser mayor de 0,5.b) Si el rendimiento esperado por la nueva variedad de manzana es de 15 cajas por huerto, podra asegurarse que se est cumpliendo con el programa de produccin? Asuma un riesgo de equivocarse del 1%?c) En cuntos huertos deber probarse el cultivo de esta nueva variedad de manzanas, para rechazar la hiptesis de que esta nueva variedad no est cumpliendo con lo esperado? Considere un riesgo de equivocarse del 1%?d) Sealan estos resultados una mayor produccin de las nuevas manzanas, que las de las manzanas corrientes? Asuma un margen de error de 0,01.e) Hay variacin en el rendimiento por cajas, en la produccin de estas manzanas?3.29. Una comunidad urbana quiere demostrar que la incidencia de cncer de seno es mayor que en las comunidades rurales, si se encuentra que 20 de cada 200 mujeres adultas en la comunidad urbana tienen cncer de seno, y 10 de 150 mujeres adultas de la comunidad rural tienen cncer de seno, podra concluirse a un nivel de significancia del 5%, que este tipo de cncer, prevalece en la comunidad urbana?3.30. Se realiza un estudio para comparar el tiempo de demora entre hombres y mujeres para ensamblar un producto. La experiencia indica que la distribucin de los tiempos, tanto como para hombres como para mujeres es aproximadamente normal, pero que la varianza de los tiempos para las mujeres en menor que el de los hombres; una muestra aleatoria de 11 mujeres y 16 hombres mostr los siguientes resultados: Varianza de tiempos de los hombres, 36,8 seg2; varianza de tiempo de las mujeres 27,4 seg2; extraiga sus conclusiones a la luz de los planteamientos del problema. 3.31. Una empresa desea saber el efecto que puede generar sobre la productividad, dar un relax a su personal, para saborear una taza de caf especial; para ello selecciona al azar un grupo de trabajadores a los cuales se les mide la productividad, sin saborear el caf, y saboreando el caf. Los resultados se muestran en la siguiente tabla:Tabla . Productividad en unidades producidas, por trabajadorTrabajadorSaboreando cafSin saborear caf

12324

22427

32624

42025

52523

62827

72224

82528

92624

103027

1120

a) Podra asegurarse que saboreando el caf, la productividad es mejor?b) Podra asegurarse que hay mayor variacin en la productividad saboreando caf?3.32. Una empresa distribuidora de Laptops, sabe que el tiempo de sus bateras, se distribuyen normalmente con una duracin promedio de 4,6 horas antes de ser recargadas; en este sentido desea comprobar la duracin de stas en las sierras de Hunuco y de Cusco; para ello toman muestras de estos aparatos y los somete a observacin; los resultados de la duracin de estas bateras, antes de ser recargadas muestras se observan a continuacin:Tabla Tiempo de duracin en horas, de las bateras de Laptop, antes de ser recargadasHunuco5,23,94,84,63,73,95,14,85,34,4

Cusco5,14,24,53,64,74,04,64,24,3

a) Hay razn suficiente para considerar que las bateras de las Laptop, en Hunuco tienen mayor tiempo de duracin que en Cusco?b) Puede considerarse hay diferentes variaciones en la duracin de estas bateras?c) De qu tamao deber tomarse una muestra, si se quiere rechazar la hiptesis, de que el tiempo de duracin de las bateras en Cusco es diferente de 4,6 horas?R: a) No hay razn suficiente como para afirmar que el promedio de duracin de las bateras de las Laptop en Hunuco, duran ms que en Cusco (diferencia de medias poblacionales con muestras pequeas); b) No hay razn suficiente como para afirmar que hay variacin en la duracin de estas bateras (prueba F); c) La muestra debe ser mayor o igual 17, haciendo la prueba t.3.33.

IV. OTRAS PRUEBAS DE HIPTESIS

AJUSTE DE CURVAS Y PRUEBAS DE CONTINGENCIA

Ejemplo 4.1 Se desea averiguar si el pertenecer a un grupo socioeconmico es fundamental como para desear seguir una carrera profesional, por el cual optaban los estudiantes que culminaban su educacin secundaria; en ese sentido se toma una muestra de grupos de estos estudiantes y se les pregunta por la carrera universitaria que desearan continuar en el futuro; las respuestas afirmativas por dichas carreras se muestran en la siguiente tabla.

Tabla 4.1 Inters por seguir una carrera universitaria por los estudiantessecundarios, segn su grupo socioeconmico familiarGrupo socioeconmico familiar

Carrera profesionalABCDE

Medicina793109

Ingeniera610787

Derecho858710

Contabilidad35445

Docencia21532

Podra asegurarse que las carreras universitarias deseadas por los estudiantes secundarios, est asociado a su grupo socioeconmico, o es que estos resultados solo se deben a la casualidad? Considere un riesgo de equivocarse del 5%.

Solucin:

Es una prueba de contingencia, ya que se trata de establecer si dos variables categricas, en este caso, Grupo socioeconmico familiar y Carrera profesional, ambos con diferentes categoras, estn asociados o son independientes; en este sentido, el contraste de hiptesis ser:H0: El desear estudiar una carrera profesional, no tiene que ver nada con el grupo socioeconmico.H1: El desear una carrera profesional, est asociado al grupo socioeconmico al que pertenece el estudiante.

Haciendo los respectivos clculos, se obtiene que su Chi cuadrado real es 10,34, el cual contrastado con su Chi cuadrado terico (0,95; 16), es 26,3. Por lo tanto, dado que ste es mayor que el real obtenido, no debera rechazarse la hiptesis nula, y aceptar que la eleccin de la carrera universitaria de los estudiantes secundarios, no tiene nada que ver con el grupo socioeconmico al cual pertenece.

USO DEL SPSS PARA DESARROLLAR PRUEBAS DE CONTINGENCIA

Ejemplo 4.2 Considere que los alumnos de ingeniera informtica han desarrollado una encuesta relacionado con la motivaciones de visita de los forneos a la provincia de Huaura, y que estos visitantes se caracterizan por pertenecer a diferentes grupos ocupacionales; adems tuvieron diversas motivaciones que los impulsaron a venir a estos lugares.

Como puede inferirse, en este caso se cuentan con dos variables categricas: Grupo ocupacional y Razones de visita; el grupo ocupacional puede estar conformado por las siguientes categoras: Comerciante, Empleado, Jubilado, Estudiante, Ama de casa y Profesional; la variable Razones de visita, puede estar conformado por las siguientes categoras: Gastronoma, Arqueologa, Curanderismo, Aventura y Distraccin. Para introducir estos datos en el SPSS, habr que definir primeramente los tipos de datos de las variables, con sus respectivas caractersticas; as hagamos la siguiente definicin:Grupo ocupacionalRazones de visita

GORV

GrupoOCRazonV

1 Comerciante 7 Gastronoma

2 Empleado 8 Arqueologa

3 Jubilado 9 Curanderismo

4 Estudiante10 Aventura

5 Ama de casa11 Distraccin

6 Profesional

Los datos que se introducirn en este software tendrn estas caractersticas; para ello abra su editor, observar una matriz formada por filas y columnas; cada columna define un tipo de variable y cada fila, un elemento de informacin, del ente que se est estudiando. En vista de variables, que aparece al pie izquierdo del editor, haga clic con el ratn para ingresar al proceso de definicin de cada variable, del siguiente modo:1. En la primera fila, se definir las caractersticas de la variable Grupo ocupacional; para eso defina en Nombre con GO, en Tipo, indique Numrico, en Ancho escriba un nmero como 3, sin decimales; en Etiqueta escriba GrupoOC, y en Valores, haciendo clic en los puntos suspensivos se ingresa a la ventana de valor; aqu es donde deber definir las categoras de las variables establecidos en la tabla; as donde dice Valor, escriba 1, y donde dice Etiqueta, escriba Comerciante, luego haga clic en Aa