1 Capítulo 16 Métodos no paramétricos: análisis de datos ordenados por rango Objetivos: Al terminar este capítulo podrá: 1. Realizar la prueba del signo para muestras dependientes empleando las distribuciones binomial y normal como estadísticos de prueba. 2. Realizar una prueba de hipótesis para muestras dependientes empleando la prueba de rangos con signo de Wilcoxon. 3. Realizar e interpretar la prueba de suma de rangos de Wilcoxon para muestras independientes. 4. Realizar e interpretar la prueba de Kruskal-Wallis para varias muestras independientes.
37
Embed
Capítulo 16, Métodos no paramétricos: análisis de datos ordenados por rango
Métodos no paramétricos: análisis de datos ordenados por rango
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
1
Capítulo 16Métodos no paramétricos: análisis de datos ordenados por rango
Objetivos: Al terminar este capítulo podrá:
1. Realizar la prueba del signo para muestras dependientes empleando las distribuciones binomial y normal como estadísticos de prueba.
2. Realizar una prueba de hipótesis para muestras dependientes empleando la prueba de rangos con signo de Wilcoxon.
3. Realizar e interpretar la prueba de suma de rangos de Wilcoxon para muestras independientes.
4. Realizar e interpretar la prueba de Kruskal-Wallis para varias muestras independientes.
2
5. Calcular e interpretar el coeficiente de correlación de rangos de Spearman.
6. Realizar una prueba de hipótesis para determinar si la correlación entre los rangos en la población es diferente de cero.
Capítulo 16 (Continuación)
3
La prueba del signo
La prueba del signo se basa en el signo de una diferencia entre dos observaciones correspondientes.
No es necesario alguna suposición con respecto a la forma de la población de diferencias.
La distribución binomial es el estadístico de prueba para las muestras pequeñas, y la normal estándar (z) para las muestras grandes.
La prueba requiere muestras (relacionadas) dependientes.
4
La prueba del signo (Continuación)
Procedimiento para conducir la prueba:
• Determine el signo de la diferencia entre pares relacionados.
• Determine el número de pares utilizados.• Compare el número de diferencias positivas (o
negativas) al valor crítico.• n es el número de pares utilizados (sin los lazos), X
es el número de positivos o negativos, y la probabilidad binomial =.5.
5
Aproximación normal Si ambos y son mayores que 5, la
distribución z es apropiada. Si el número de signos más o de signos menos es
mayor que n/2, entonces
n n( )1
zX n
n
( . ) .
.
5 5
5
zX n
n
( . ) .
.
5 5
5
Si el número de signos más o de signos menos es menor que n/2, entonces
6
Ejemplo 1El instituto de investigación de Gagliano para los estudios del negocio está comparando el costo de investigación y desarrollo (R&D) como porcentaje del ingreso para una muestra de las empresas del vidrio para 2000 y 2001.
¿En un nivel de significancia del .05 se tiene que el costo de R&D ha declinado? Utilice la prueba del signo.
7
Ejemplo 1 (Continuación)
Compañía 2000 2001 Diferencias Muestra
Savoth Glass 20 16 4 +
Ruisi Glass 14 13 1 +
Rubin Inc. 23 20 3 +
Vaught 24 17 7 +
Lambert Glass 31 22 9 +
Pimental 22 20 2 +
Olson Glass 14 20 -6 -
Flynn Glass 18 11 7 +
8
Paso 1: H0: =.5 H1: <.5
Paso 2: H0: se rechaza si el número de muestras negativas es 0 o 1.
Paso 3: Hay una diferencia negativa. Esto es, hubo un incremento en el porcentaje para una compañía.
Paso 4: H0: se rechaza. Concluimos que el gasto en R&D como un porcentaje del ingreso declinó del 2000 al 2001.
Ejemplo 1 (Continuación)
9
Prueba de hipótesis acercade la mediana
Cuando probamos el valor de la mediana, utilizamos la aproximación normal a la distribución binomial.
La distribución z se utiliza como el estadístico de prueba.
10
La agencia de viajes Gordon sostiene que su tarifa mediana para todos sus clientes a todos los destinos es $450. Esta afirmación está siendo desafiada por una agencia de la competencia, que cree que la mediana es diferente de $450. Una muestra escogida al azar de 300 boletos reveló que 170 boletos estaban por debajo de $450. Utilice el 0.05 de nivel de significancia.
Ejemplo 2
11
450.$ mediana :H $450 = mediana : 10 H
H0 es rechazada si z es menor que –1.96 o mayor que 1.96.
El valor de z es 2.252.
252.23005.
)300(50.)5.170(5.
50.)5.(
n
nXz
H0 es rechazada. Concluimos que la mediana no es $450.
Ejemplo 2 (Continuación)
12
Prueba de suma de rangosde Wilcoxon
Si la suposición de normalidad se viola para la prueba apareada-t, utilice la prueba de rangos con signo de Wilcoxon.
La prueba requiere la escala ordinal de la medida. Las observaciones deben ser relacionadas o
dependientes.
13
Prueba de suma de rangosde WilcoxonLos pasos para la prueba son:
• Calcule las diferencias entre las observaciones relacionadas.
• Ordene las diferencias absolutas de menor a mayor.
• Se suman los valores de las columnas positivas y negativas.
• Compare el más pequeño de las dos sumas de rangos con el valor de T, obtenido del Apéndice H.
14
Utilice la prueba de suma de rangos de Wilcoxon para determinar si los costos de R&D como porcentaje del ingreso (Ejemplo 1) ha declinado. Utilice el nivel de significancia del .05.
Paso 1: H0: Los porcentajes permanecen igual.
H1: Los porcentajes declinaron.
Paso 2: Se rechaza H0 si el más pequeño de las sumas de rango es menor o igual a 5.
Vea el Apéndice H.
Ejemplo 3
15
Compañía 2000 2001 Diferencia ABS-Dif. Rango R+ R-
La suma de rango más pequeña es 5, que es igual al valor crítico de T. Se rechaza H0. El porcentaje ha declinado a partir de un año al siguiente.
Ejemplo 3 (Continuación)
17
Prueba de suma de rangosde Wilcoxon
• No se requiere ninguna suposición sobre la forma de la población.
• Los datos deben ser por lo menos escala ordinal.• Cada muestra debe contener por lo menos ocho
observaciones.
La prueba de suma de rangos de Wilcoxon se utiliza para determinar si dos muestras independientes provienen de la misma o igual población.
18
Para determinar el valor del estadístico W, todos los valores de los datos se ordenan de menor a mayor como si fueran de una sola población.
La suma de rangos para cada dos muestras es determinada.
Prueba de suma de rangosde Wilcoxon
19
El más pequeño de las dos sumas de W se utiliza para calcular el estadístico de prueba de:
12)1(
2)1(
2121
211
nnnn
nnnW
z
Prueba de suma de rangosde Wilcoxon
20
La Universidad compró dos vehículos, un Ford y un Chevy, para el uso de la administración al viajar. Los costos de reparación para los dos autos durante los tres años pasados se muestran en la diapositiva siguiente. ¿En el nivel de significancia del .05 hay una diferencia en las dos distribuciones?
Ejemplo 4
21
Ejemplo 4 (Continuación)
Ford ($) Rango Chevy($) Rango
25.31 3.0 14.89 1.0
33.68 5.5 20.31 2.0
46.89 7.0 25.97 4.0
51.83 8.0 33.68 5.5
87.65 13.0 68.98 9.0
87.90 14.0 78.23 10.0
90.89 15.0 80.31 11.0
120.67 16.0 81.75 12.0
157.90 17.0
81.5 71.5
22
Paso 1: H0: Las poblaciones son iguales.
H1: Las poblaciones no son iguales.
Paso 2: H0: se rechaza si z >1.96 o z es menor
que –1.96
Ejemplo 4 (Continuación)
23
Paso 3: El valor del estadístico de prueba es 0.914.
914.0
12
)198)(9(8
2
)198(85.81
12
)1(
2
)1(
2121
211
nnnn
nnnW
z
Ejemplo 4 (Continuación)
24
Paso 4: No rechazamos la hipótesis nula. No podemos concluir que hay una diferencia en las distribuciones de los costos de la reparación de los dos vehículos.
Ejemplo 4 (Continuación)
25
Prueba de Kruskal-Wallis:análisis de varianza por rangos
La escala ordinal de la medida es requerida. Es un alternativa del ANOVA unidireccional. La distribución de ji-cuadrada es el estadístico de
prueba. Cada muestra debe tener por lo menos cinco
observaciones. Los datos de la muestra se ordenan de menor a mayor
como si fuera un solo grupo.
Esto se utiliza para comparar tres o más muestras para determinar si provienen de poblaciones iguales.
26
Prueba de Kruskal-Wallis:análisis de varianza por rangos (Continuación)
El estadístico de prueba está dado por:
Hn n
R
n
R
n
R
nnk
k
12
13 11
2
1
22
2
2
( )
( ) ( )...
( )( )
27
Keely Ambrose, director de recursos humanos para las industrias de Molinero, desea estudiar los Porcentajes de incremento en el sueldo para losgerentes medios. Ella recopila una muestra de gerentes ydetermina los porcentajes de incremento de sueldo a partirdel año pasado a este año.
¿Al nivel de significancia del 5% puede Kelly concluir que hay una diferencia en los porcentajes de incremento para las diferentes plantas?