UNIVERSIDAD POLITECNICA ESTATAL DEL CARCHI FACULTAD DE COMERCIO INTERNACIONAL, INTEGRACIÓN, ADMINISTRACIÓN Y ECONOMÍA EMPRESARIAL ESCUELA DE COMERCIO EXTERIOR Y NEGOCIACIÓN COMERCIAL INTERNACIONAL TRABAJO DE ESTADÍSTICA INFERENCIAL JUAN FRANCISCO RUALES TULCÁN - ECUADOR 2012
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
UNIVERSIDAD POLITECNICA ESTATAL DEL CARCHI
FACULTAD DE COMERCIO INTERNACIONAL, INTEGRACIÓN, ADMINISTRACIÓN Y ECONOMÍA EMPRESARIAL
ESCUELA DE COMERCIO EXTERIOR Y NEGOCIACIÓN COMERCIAL INTERNACIONAL
TRABAJO DE ESTADÍSTICA
INFERENCIAL
JUAN FRANCISCO RUALES
TULCÁN - ECUADOR
2012
TEMA: CHI-CUADRADO
PROBLEMA: Desconocimiento del Chi- Cuadrado imposibilita la realización y
desarrollo de ejercicios que a futuro utilizaremos.
OBJETIVOS
General
Conocer y aplicar el CHI-CUADRADO en ejercicios planteados para
tener un mejor desarrollo como profesionales en el futuro.
Específicos:
Fundamentar el Chi-cuadrado.
Analizar la información obtenida sobre el CHI-CUADRADO.
Realizar ejercicios planteados sobre el CHI-CUADRADO para aplicarlos
en la carrera.
JUSTIFICACIÓN
El presente trabajo lo hemos realizado con la finalidad de aprender acerca del
Chi-cuadrado, su concepto y los ejercicios que se pueden desarrollar, para
conocer lo fundamental que ayudara en la carrera de comercio exterior y como
profesionales en este campo.
Además se reforzará los conocimientos y así como resolver ejercicios sobre
CHI-CUADRO aplicando la fórmula en ejercicios de nuestra carrera.
5.- MARCO TEORICO
CHI-CUADRADO
En una prueba de ajuste la hipótesis nula establece que una variable X tiene
una cierta distribución de probabilidad con unos determinados valores de los
parámetros. (Arvelo, 1998)
El tipo de distribución se determina, según los casos, en función de: La propia
definición de la variable, consideraciones teóricas al margen de esta y/o
evidencia aportada por datos anteriores al experimento actual. (Arvelo, 1998)
A menudo, la propia definición del tipo de variable lleva implícitos los valores de
sus parámetros o de parte de ellos; si esto no fuera así dichos parámetros se
estimarán a partir de la muestra de valores de la variable que utilizaremos para
realizar la prueba de ajuste. (Arvelo, 1998)
Como en casos anteriores, empezaremos definiendo las hipótesis.
Hipótesis nula: X tiene distribución de probabilidad f(x) con
parámetros y1,..., yp
Hipótesis alternativa: X tiene cualquier otra distribución de
probabilidad.
Es importante destacar que el rechazo de la hipótesis nula no implica que sean
falsos todos sus aspectos sino únicamente el conjunto de ellos; por ejemplo,
podría ocurrir que el tipo de distribución fuera correcto pero que nos
hubiésemos equivocado en los valores de los parámetros. (Arvelo, 1998)
Obviamente, necesitaremos una muestra de valores de la variable X. Si la
variable es discreta y tiene pocos valores posible estimaremos las
probabilidades de dichos valores mediante sus frecuencias muéstrales; si la
variable es continua o si es una discreta con muchos o infinitos valores
estimaremos probabilidades de grupos de valores (intervalos). (Arvelo, 1998)
Metodológicamente, la prueba se basa en la comparación entre la serie de
frecuencias absolutas observadas empíricamente para los valores de la
variable (Oi) y las correspondientes frecuencias absolutas teóricas obtenidas
en base a la función de probabilidad supuesta en la hipótesis nula (Ei). (Arvelo,
1998)
Así pues, una vez calculadas las frecuencias absolutas de cada valor o
intervalo de valores, obtendremos el número total de observaciones de la
muestra (T) sumando las frecuencias observadas (Arvelo, 1998)
Para calcular las frecuencias esperadas repartiremos este número total de
observaciones (T) en partes proporcionales a la probabilidad de cada suceso o
grupo de sucesos. (Arvelo, 1998). Para ello calcularemos dichas probabilidades
utilizando la función de probabilidad definida en la hipótesis nula f(x), de modo
que, cada valor Ei tendrá la siguiente expresión:
Por tanto, tendremos los siguientes datos para la prueba:
Valor de la variable x1 x2 x3 ... xi ... xk
Frecuencias observadas O1 O2 O3 ... Oi ... Ok
Frecuencias esperadas E1 E2 E3 ... Ei ... Ek
Si la hipótesis nula es cierta, las diferencias entre valores observados y
esperados (que siempre existirán por tratarse de una muestra aleatoria) son
atribuibles, exclusivamente, al efecto del azar. En estas condiciones, se puede
calcular un parámetro que depende de ambos, cuya distribución se ajusta a
una CHI-CUADRADO. (Arvelo, 1998)
Si, por el contrario, la hipótesis nula fuera falsa los Ei ya no serían, realmente,
los valores esperados de las frecuencias; por tanto, las diferencias entre los
valores "esperados" y los observados reflejarían no sólo el efecto del azar sino
también las diferencias entre los Ei y la auténtica serie de valores esperados
(desconocida) Como consecuencia, las diferencias de los numeradores de la
expresión anterior tienden a ser más grandes y, por estar elevadas al
cuadrado, la suma de cocientes ser positiva y mayor que lo que se esperaría
para los valores de una CHI-CUADRADO. (Arvelo, 1998)
Por tanto, el parámetro anterior será el estadístico de contraste de la prueba de
hipótesis y la región crítica se encontrar siempre en la cola derecha de la
distribución CHI-CUADRADO. Evidentemente, esta prueba será siempre de
una sola cola. (Arvelo, 1998)
Estadístico de contraste
Se acepta la hipótesis nula si , el percentil 1 – α de la distribución
CHI-CUADRADO con grados de libertad.
Cabe señalar que en las pruebas CHI-CUADRADO lo corriente es que
pretendamos comprobar que una variable tiene una cierta distribución y, por
tanto, habitualmente, nos vemos obligados a colocar nuestra propia hipótesis
en la hipótesis nula. Únicamente podremos colocar nuestra hipótesis en la
alternativa en el caso excepcional de que pretendamos demostrar que cierto
tratamiento produce una distorsión de la distribución básica de la variable en
estudio. (Arvelo, 1998)
El número de grados de libertad de la variable CHI-CUADRADO se calcula de
la siguiente forma:
A priori, tendrá tantos grados de libertad como parejas frecuencia
observada - frecuencia esperada. (Arvelo, 1998)
A esta cantidad se debe restar el número de restricciones lineales
impuestas a las frecuencias observadas, es decir, el número de
parámetros que es necesario calcular directamente a partir de los
valores observados para establecer los valores esperados. Este número
es, como mínimo, uno ya que siempre tendremos que calcular el número
total de observaciones de la muestra. (Arvelo, 1998)
Una condición básica para que podamos llevar a cabo una prueba CHI-
CUADRADO es que las frecuencias de las distintas clases deben ser
suficientemente altas como para garantizar que pequeñas desviaciones
aleatorias en la muestra no tengan importancia decisiva sobre el valor del
estadístico de contraste. (Arvelo, 1998). (Arvelo, 1998)
Las reglas que determinan cuando es posible o no realizar el contraste varían
mucho de unos autores a otros. En un extremo de máxima rigidez se
encuentran aquellos que opinan que no se puede realizar la prueba cuando
alguna de las frecuencias, observadas o esperadas, sea menor que 5. En el
otro extremo se encuentran quienes opinan que, para que la prueba sea viable
ninguna de las frecuencias esperadas debe ser menor que 1 y no más del 25%
pueden ser menores que 5; en lo que refiere a las frecuencias observadas no
existirían límites. La autora de este texto simpatiza más con la segunda
postura, no sólo por razones prácticas, sino porque lo razonable es que la
distribución esperada esté adecuadamente definida y, por tanto, no debe incluir
valores muy bajos; sin embargo, los valores extremos en la distribución
observada simplemente reflejan diferencias importantes entre la distribución
supuesta por la hipótesis nula y la real. (Arvelo, 1998)
Sea cual sea el criterio que elijamos, si resultara que la prueba no es viable
podríamos recurrir a englobar los valores o clases de valores con sus vecinos
más próximos y pasar así a engrosar sus frecuencias. Este procedimiento no
puede llevarse hasta el absurdo pero proporciona una salida digna a
situaciones complejas. En casos excepcionales se pueden englobar valores
que no sean vecinos porque exista algún nexo lógico de conexión entre ellos.
(Arvelo, 1998)
Cuando sea necesario agrupar valores, los grados de libertad no se deben
calcular hasta que tengamos establecidas definitivamente las parejas de
frecuencias observadas y esperadas con las que calcularemos el estadístico de
contraste. (Arvelo, 1998)
EJERCICIOS
EJERCICIO 1.-
1.- Un jugador quiere probar que es legal el dado con el que juega. Tiro el dado
120 veces y obtuvo la siguiente distribución de frecuencias de las caras
resultantes.
RESULTADO 1 2 3 4 5 6
FRECUENCIA 15 25 33 17 16 14
a) Enuncie las hipótesis de la prueba y determine las frecuencias
esperadas.
b) Describa la estadística de la prueba
c) Determine la región crítica de la prueba al nivel de significación del 5%.
d) ¿A qué conclusión llega usando el nivel de significación 0,05?
e) Determine la probabilidad P.
1.-
Ho: El dado es legal.
Ha: El dado no es legal.
2.- Es de dos colas.
3.- Nivel de confianza
4.-
gl= k-1 gl=6-1 gl=5
5.-
6.-
Ei 20 20 20 20 20 20
Oi 15 25 33 17 16 14
[∑
]
7.- Se acepta la hipótesis alternativa y se rechaza la hipótesis nula, es decir el
dado del jugador no es legal ya que se encuentra dentro de la zona de rechazo.
EJERCICIO 2.-
2.- El gerente de ventas de una compañía P&C afirma que todos sus
vendedores realizan el mismo número de visitas durante el mismo período de
tiempo. Una muestra aleatoria de 5 registros de los vendedores en una semana
dada reveló el siguiente número de visitas.
Vendedor A B C D E
Número de visitas 23 29 25 23 30
Con el nivel de significación de 0.05, ¿es razonable aceptar la afirmación del
gerente?
1) : hacen el mismo número de visitas
: hacen menor número de visitas
11,07
Zona
aceptación
2) Gráfica: unilateral y cola a la derecha
3) Nivel de significación 0.05
4) Variables cualitativas → chi cuadrado
5) gl = k-1
gl = 5-1 = 4
= 9,49
6)
7) Acepta la hipótesis nula por que realizan el mismo número de visitas
EJERCICIO 3.-
3.- El gerente de personal de la compañía de “REXA” quiere probar la
hipótesis que hay diferencias significativas de tardanzas de los diferentes días
de la semana. De los registros de asistencia obtuvo la siguiente tabla de
tardanzas de su personal para cada uno de los días de la semana:
DIAS LUNES MARTES MIERCOLES JUEVES VIERNES
TARDANZAS 58 39 75 48 80
26 26 26 26 26
23 29 25 23 30
¿Se puede aceptar la hipótesis del gerente con un nivel de significación de
0.05?
1.- HO = El número de tardanzas en el mismo cada día
2.- La prueba es unilateral de una cola
3.- Nivel de significancia del =0.05
4.-Utilizamos la prueba del CHI-CUADRADO
5.-
gl=K-1
gl= 5-1
gl=4
x2=9.488
6. - frecuencias esperadas
Xi
58
39
75
48
z. aceptación
z. rechazo
9.488
80
300
=60
60 60 60 60 60
58 39 75 48 80
X2= ∑
= 20.232
7.- Se rechaza la hipótesis nula y se acepta la hipótesis alternativa debido a
que hay tardanzas del personal en cada día de la semana ya que llegan
puntuales a la compañía REXA.
EJERCICIO 4.-
4.- De una muestra de turistas que se hospedan en el hotel “ EL PALMER” se
recogió sus opiniones acerca de los servicios del hotel, resultando los
siguientes datos:
PESIMA MALA REGULAR BUENA MUY BUENA EXCELENTE
TURISTAS 20 25 40 54 56
Pruebe con un nivel de significación del 5%, la hipótesis nula de que no hay
diferencias significativas entre las opciones de los turistas.
1.- HO = no hay diferencias significativas en las opiniones
2.- La prueba es unilateral de una cola
3.- Nivel de significancia del =0.05
4.- Utilizamos la prueba del CHI-CUADRADO
5.-
gl=K-1
gl= 5-1
gl=4
x2=9.488
6. FRECUENCIA ESPERADAS
Xi
20
25
40
54
56
195
=39
z. aceptación
z. rechazo
9.488
39 39 39 39 39
20 25 40 54 56
X2= ∑
= 27.486
7.- La hipótesis nula se rechaza porque, no hay diferencias significativas en las
opiniones de los turistas.
Ejercicio 5
En un día se observó el número de conductores que escogieron cada una de
las diez casetas de pago de peaje ubicadas a la salida al sur. Los datos se