ESTADISTICA (II Bimestre Abril agosto 2011)
Post on 03-Jul-2015
2542 Views
Preview:
DESCRIPTION
Transcript
ESTADÍSTICA
ESCUELA:
NOMBRES:
Informática
Ing. Gabriela Correa Mena
BIMESTRE: Segundo
Abril Agosto 2011
CONTENIDO
• UNIDAD 5: Muestreo
• UNIDAD 6: Prueba de hipótesis para dos muestras
• UNIDAD 7: Análisis de varianza
• UNIDAD 8: Métodos no paramétricos ji cuadrada
• UNIDAD 9: Correlación y regresión lineal
UNIDAD 5
MUESTREO
Herramienta para inferir algo sobre una población
Muestreo
- Entrar en contacto con todos los miembros de la población consumedemasiado tiempo
- El costo de estudiar a todos los elementos de la población es muy alto
- Resulta imposible verificar y localizar a todos los miembros de la población
- Algunas pruebas resultan negativas
Razones para muestrear:
• Media poblacional• Valores de la población (X)• Número de elementos de la población (N)
• Total de muestras• Fórmula de Combinación (C)
Aspectos a considerar
Distribución muestral de la Media
Organiza las medias de todas las muestras en una distribución de probabilidad
Media de la población = Media de la distribución muestral de la media
Ejemplo: Cierta empresa cuenta con 4 empleados deproducción (a quienes se les considera la población). En latabla siguiente se incluyen los ingresos por hora de cadaempleado.
Empleado Ingreso por hora
José 3
Arturo 1
María 4
Rosa 8
a. Media de la población
b. Distribución muestral de la media paramuestras de tamaño 2
Total de muestras:
N= 4n = 2
Empleado Ingreso por hora
José 3
Arturo 1
María 4
Rosa 8
Media muestral – Distribución de probabilidad
c. Media de la distribución muestral de la media
Comparar
La dispersión de la distribución muestral de las medias esmenor que la dispersión de los valores de la población
Comparar
La dispersión de la distribución muestral de las medias esmenor que la dispersión de los valores de la población
Preguntas Objetivas
( ) La media de las medias de lasmuestras es exactamente igual a lamedia de la población
( ) La dispersión de la distribuciónmuestral de la media es más estrechaque la distribución poblacional
UNIDAD 6
PRUEBA DE HIPOTESIS PARA DOS MUESTRAS
Afirmación relativa a un parámetro de lapoblación sujeta a verificación
Hipótesis
Se establecen las hipótesis nula (H0) y alternativa (H1)
Se selecciona un nivel de
significancia (α)
Se identifica el estadístico de
prueba
Se formula una
regla para tomar
decisiones
Se toma una muestra, se llega
a una decisión
No se rechaza H0Se rechaza H0
Se acepta H1
Procedimiento para probar una hipótesis
Formule hipótesis nula (H0) y alternativa (H1)
Ejemplo (pag 371): Los clientes de un supermercado tienen laopción de pagar en una caja registradora normal operada por uncajero o emplear un nuevo procedimiento llamado U-Scan. Lagerente necesita saber si el tiempo medio de pago con el método
tradicional es mayor que con U-scan.
Tipo Cliente Media Muestral
Desviación estándar de la
población
Tamaño de la muestra
Tradicional 5.50 min 0.40 min 50
U-Scan 5.30 min 0.30 min 100
Determine el estadístico de prueba
Seleccione el nivel de significancia (α)
Debido a que se conoce las desviaciones estándar se emplea el estadístico Z
Formule una regla de decisión
Tome la decisión respecto de H0 e interprete el resultado
13.3064.0
2.0
100
30.0
50
40.0
3.55.5
22
22
u
u
s
s
us
nn
XXz
Se rechaza H0, el método U-scan es mas rápido
UNIDAD 7
ANÁLISIS DE VARIANZA
Distribución F
Continua
No puede ser
negativos
Tiene sesgo
positivo
Esasintótica
Comparar si dos muestras que provienen de diferentes poblaciones tienen varianzas iguales
Comparar varias medias poblaciones en forma simultanea (ANOVA)
Tabla ANOVAFuente devariación
Suma de cuadrados
Grados de libertad
Media cuadrática F
Tratamiento
Aleatorio -Error
Total
Análisis de la varianza (ANOVA)
Poblaciones
Independientes
Igual desviación estándar σ
Ejemplo: Citrus Clean es un nuevo limpiador multiusos a
prueba en el mercado, y se han colocado exhibidores en treslugares distintos dentro de varios supermercados. A continuaciónse reporta la cantidad de botellas de 12onzas vendidas en cadalugar del supermercado
Cerca del pan 18 14 19 17
Cerca de las cervezas 12 18 10 16
Cerca de otros limpiadores 26 28 30 32
Con un nivel de significancia de 0.05. ¿Hay alguna diferencia en elnúmero medio de botellas vendidas en los tres lugares?
a. Formule la hipótesis nula y alternativaEl número medio de botellas vendido en los tres lugares es el
mismoH0 : µ1 = µ2 = µ3H1 : Número medio de botellas vendido no es el mismo
b. Regla de decisión
Grados de libertad en el numerador : k - 1 = 3 - 1 = 2
Grados de libertad en el denominador: n - k = 12 - 3 = 9Apéndice B.4 pag. 7884.26Rechaza H0 si F > 4.26
c. Calcule los valores de SS total
• X cada observación de la muestra
• media global total
d. Calcule los valores de SSE
• X cada observación de la muestra
• media muestral para el tratamiento c
d. Calcule los valores de SSECerca del pan Cerca de las cervezas Cerca de otros limpiadores
18 12 26
14 18 28
19 10 30
17 16 32
17 14 29
d. Calcule los valores de SST
e. Elabore una tabla ANOVA
Fuente devariación
Suma de cuadrados
Grados de libertad
Media cuadrática F
Tratamiento SST= 504 k – 1 = 2 SST/( k - 1)= 25230.65Aleatorio -Error SSE=74 n – k = 9 SSE/(n - k) = 8.22
Total SST=578 11
Conclusión:H0 se rechazo debido a que F > 4.26Hay una diferencia en el número medio de botellas vendidas en lasdistintas ubicaciones
UNIDAD VIII
MÉTODOS NO PARAMÉTRICOSJI CUADRADO
Nunca negativo
Tiene sesgo positivo
Existe una familia de
distribuciones de ji cuadradas
(k – 1 )
La distribución se aproxima a distribución
normal
Características distribución ji cuadrada
Estadístico de prueba ji cuadrado
• fo frecuencia observada en una categoría en particular
• fe frecuencia esperada en una categoría en particular
Prueba de bondad de ajuste
Comparar una distribución observada con una distribuciónesperada
Prueba de bondad de ajuste: fe iguales
Ejemplo: La directora de recursos humanos de una empresa,
está preocupada por el ausentismo entre los trabajadores por hora,por lo que decide tomar una muestra de los registros de lacompañía y determinar si el ausentismo está distribuido de manerauniforme en toda la semana de seis días. Las hipótesis son:
H0: El ausentismo está distribuido de manera uniforme en todala semana de trabajo
H1: Es ausentismo no está distribuido de manera uniforme entoda la semana de trabajo
Los resultados de la muestra son
Día Número de ausencias
Lunes 12
Martes 9
Miércoles 11
Jueves 10
Viernes 9
Sábado 9
a. ¿Cómo se denominan los números 12,9,11,10,9,9 ycuántas celdas o categorías hay?
Frecuencias observadas y hay seis celdas (días de la semana)
Día Número de ausencias
Lunes 12
Martes 9
Miércoles 11
Jueves 10
Viernes 9
Sábado 9
fe 60/6=10
b. ¿Cuál es la frecuencia esperada para cada día?
c. ¿Cuántos grados de libertad hay?gl = k -1 = 6 – 1 = 5
d. ¿Cuál es el valor crítico de ji cuadrado con un nivelde significancia de 1%?Apéndice B.3 pag. 787
Grados de libertad Área de Cola Derecha
e. Calcule el estadístico de prueba
Día Número de ausencias
Lunes 12
Martes 9
Miércoles 11
Jueves 10
Viernes 9
Sábado 9
fe 60/6=10
Conclusión:No se rechaza H0El ausentismo se distribuye de manera uniforme durante la semana
UNIDAD IX
CORRELACIÓN Y REGRESIÓN LINEAL
Análisis de Correlación
Grupo de técnicas para medir la asociación entre dos variables
Variable Independiente: Se representa en el eje X y es la variableempleada como estimador
Variable Dependiente: Se representa en el eje Y y es la variable porestimar o predecir
Análisis de Correlación
Grupo de técnicas para medir la asociación entre dos variables
Variable Independiente: Se representa en el eje X y es la variableempleada como estimador
Variable Dependiente: Se representa en el eje Y y es la variable porestimar o predecir
Coeficiente de Correlación
Medida de la fuerza de la
relación lineal entre dos variables
r = 0, no hay
asociación entre ellas
r = 1 indica una asociación directa entre las variables
R = -1 indica una
asociación inversa
entre las variables
Varia de -1 a +1
Ejemplo: Una empresa americana vende copiadoras de todo tamaño. La nuevagerente nacional de ventas desea saber la relación entre el número de llamadas deventas y el número de copiadoras vendidas. Selecciona una muestra aleatoria de 10representantes, como se se observa en la tabla. ¿Qué observaciones cabe hacerrespecto de la relación entre el número de llamadas de venta y el número decopiadoras vendidas?
G R A C I A S
top related