Estadística Administrativa II 2014-3 Métodos no paramétricos – Prueba de wilcoxon 1
1
Estadística Administrativa II2014-3
Métodos no paramétricos – Prueba de wilcoxon
2
Prueba de rangos con signos de Wilcoxon Muestras dependientes
3
Características
› No requiere que las muestras estén distribuidas normalmente.
› Aplica para distribuciones nominales
› Desarrollada por Frank Wilcoxon en 1945
› Se basa en el concepto de una muestra tomada en dos momentos diferentes.
4
Procedimiento› Definir el estado de las observaciones (2 columnas)
› Calcular la diferencia entre cada uno de los datos de la misma instancia.
› Calcular la diferencia absoluta entre cada línea de la tabla.
› Ordenar la tabla de menor a mayor de acuerdo a la columna de la “diferencia absoluta”.
› Eliminar las diferencias nulas
› A valor menor asignar el rango 1 y completar hasta el dato mayor con el rango igual al tamaño de la muestra.
› Si los datos de la diferencia absoluta se repiten, el rango es el promedio de los datos iguales (Rango = 6, 7, 8, convertir a (6+7+8)/3 = 7)
5
Procedimiento› Adicionar columna R+ y R-
› En la columna R+ se colocan los rangos de los valores que obtuvieron una diferencia positiva.
› En la columna R- se colocan los rangos de los valores que obtuvieron una diferencia negativa.
› Sumar los resultados de R+ y los resultados de R-.
› Asignar a W el valor menor entre R+ y R-
› Comparar con el valor definido como punto crítico para aceptar o rechazar la hipótesis.
6
Ejemplo . . .Se quiere lanzar un nuevo producto de pollo con especies y el gerente general hará una prueba piloto para evaluar si los clientes prefieren el sabor del pollo normal o el pollo con especies. La prueba piloto se hizo a 15 clientes que calificaron ambos sabores con datos del 1 al 20; en donde el gusto por un sabor esta representado por los valores más altos.
Revisando los datos de la tabla, ¿es razonable concluir que el sabor a especies es el preferido con un nivel de confianza de 0.05?
7
. . . Ejemplo
1. Calcular la diferencia entre el sabor a especies y el sabor actual (14–12=2, 8-16=-8).
2. Muestra: 15
3. Valores neutros: 1
4. Muestra útil: 14
ParticipanteSabor a especies
Sabor actual
Diferencias
1 14 12 22 8 16 -83 6 2 44 18 4 145 20 12 86 16 16 07 14 5 98 6 16 -109 19 10 910 18 10 811 16 13 312 18 2 1613 4 13 -914 7 14 -715 16 4 12
8
. . . Ejemplo
› Calcular la diferencia absoluta.
Se aplica el valor absoluto.
|𝑎|={ 𝑎(𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑜 )−𝑎(𝑛𝑒𝑔𝑎𝑡𝑖𝑣𝑜)
9
. . . Ejemplo
› Ordenar la tabla de menor a mayor por la columna de diferencia absoluta.
› Eliminar los resultados neutros.
› Agregar la columna “Rango”.
Participante Normal Especies DiferenciaDiferencia Absoluta
1 14 12 2 211 16 13 3 3
3 6 2 4 414 7 14 -7 7
2 8 16 -8 85 20 12 8 8
10 18 10 8 87 14 5 9 99 19 10 9 9
13 4 13 -9 98 6 16 -10 10
15 16 4 12 124 18 4 14 14
12 18 2 16 16
10
. . . Ejemplo
› Enumerar la columna rango desde el valor más pequeño.
› Culmina en el rango igual que el tamaño de la muestra.
› Ubicar los valores repetidos (8 y 9)
Participante DiferenciaDiferencia Absoluta Rango
1 2 2 111 3 3 2
3 4 4 314 -7 7 4
2 -8 8 55 8 8 6
10 8 8 77 9 9 89 9 9 9
13 -9 9 108 -10 10 11
15 12 12 124 14 14 13
12 16 16 14
11
. . . Ejemplo
› Calcular el promedio de la columna rango solo para los valores repetidos.
› El promedio resultante se coloca en lugar de los rangos que se habían definido.
› Crear las columnas R+ y R-
Participante DiferenciaDiferencia Absoluta Rango Rango
1 2 2 1 111 3 3 2 2
3 4 4 3 314 -7 7 4 4
2 -8 8 5 65 8 8 6 6
10 8 8 7 67 9 9 8 99 9 9 9 9
13 -9 9 10 98 -10 10 11 11
15 12 12 12 124 14 14 13 13
12 16 16 14 14
12
. . . Ejemplo
› Colocar en R+ los rangos cuyas diferencias hayan sido positivas.
› Colocar en R- los rangos cuyas diferencias hayan sido negativas.
› Sumar ambas columnas
Participante Especies Normal Diferencia Rango R+ R-1 14 12 2 1 111 16 13 3 2 23 6 2 4 3 314 7 14 -7 4 42 8 16 -8 6 65 20 12 8 6 610 18 10 8 6 67 14 5 9 9 99 19 10 9 9 913 4 13 -9 9 98 6 16 -10 11 1115 16 4 12 12 124 18 4 14 13 1312 18 2 16 14 14
75 30Total……..
13
. . . Ejemplo › Hipótesis:
› Nivel de significancia:
› Estadístico de prueba:
› Regla de decisión:
› Si el menor de ambas columnas es 25 o menos, se rechaza la hipótesis nula..
𝛼=0.05
𝑊=𝑚𝑖𝑛¿
W=25
14
. . . Ejemplo
Toma de decisión
› Los rangos definidos son:
› Tomar el resultado más pequeño.
› El valor crítico es 25 y ambos resultados caen
W=25
𝑇=30
15
Prueba de rangos con signos de Wilcoxon Muestras independientes
16
Muestras independientes
› La prueba de rangos con signos de Wilcoxon en muestras independientes.
› Determinan si las muestras provienen de una misma población.
› Los datos se clasifican como si los datos de ambas muestras forman parte de una misma muestra.
› Alternativa para el estadístico de prueba t
› Las poblaciones no se distribuyen normalmente
› No se conocen las varianzas poblacionales
17
Prueba de rangos con signos de Wilcoxon para muestras independientes.
› Si la hipótesis alternativa es verdadera, una de las muestras tendrá mayor cantidad de rangos bajos y, por tanto, una suma de rangos menor.
› Estadístico de pruebas:
𝑧=𝑊 −
𝑛1 (𝑛1+𝑛2+1 )2
√𝑛1𝑛2 (𝑛1+𝑛2+1 )12
18
Ejemplo . . .
El CEO de Airlines, hace poco observo un aumento en el numero de personas que no llegan a tomar los vuelos que salen de Atlanta. Su interés principal es determinar si hay mas personas que no se presentan a tomar los vuelos que salen de Atlanta en comparación con vuelos que salen de Chicago. Una muestra de nueve vuelos de Atlanta y ocho de Chicago aparece en la tabla siguiente. Con un nivel de significancia de 0.05, ¿es posible concluir que hay más personas que no se presentan a tomar los vuelos que salen de Atlanta?
No se conocen las varianzas poblacionales; por lo que no puede utilizarse la distribución t.
19
. . . Ejemplo
› Hipótesis
› Nivel de significancia
› Estadístico de prueba
Atlanta Chicago11 1315 1410 1018 811 1620 924 1722 2125 𝑧=
𝑊 −𝑛1 (𝑛1+𝑛2+1 )
2
√𝑛1𝑛2 (𝑛1+𝑛2+1 )12
𝛼=0.05
20
. . . Ejemplo
› Regla de decisión
› Toma de decisión– Hacer una sola muestra– Determinar el ordenamiento
de rangos como una sola muestra
– Calcular el promedio a los resultados iguales
– Dividir las muestras
AeropuertoNo
abordaron Rango RangoChicago 8 1 1Chicago 9 2 2Atlanta 10 3 3.5Chicago 10 4 3.5Atlanta 11 5 5.5Atlanta 11 6 5.5Chicago 13 7 7Chicago 14 8 8Atlanta 15 9 9Chicago 16 10 10Chicago 17 11 11Atlanta 18 12 12Atlanta 20 13 13Chicago 21 14 14Atlanta 22 15 15Atlanta 24 16 16Atlanta 25 17 17
21
. . . EjemploChicago Rango
8 19 2
10 3.513 714 816 1017 1121 148 56.5
Atlanta Rango10 3.511 5.511 5.515 918 1220 1322 1524 1625 179 96.5
22
. . . Ejemplo
› Parece que el número de pasajeros que se pierden en el aeropuerto de Atlanta es similar al de Chicago. La hipótesis nula se acepta.
› Calcular la probabilidad para z=1.49.
› Solo existe un 7% de que la hipótesis nula pueda ser rechazada.
› La hipótesis nula se acepta.
𝑃 (𝑧=1.49 )=0.4319
23
Fin de lapresentación
Muchas gracias
Lind, D.A., Marchal, W.G., Wathen, S.A. (15). (2012). Estadística Aplicada a los Negocios y la Economía. México: McGrawHill