Top Banner
Facultad de Ciencias Químicas e Ingeniería, UAEM Simulación de Procesos PRUEBAS DE BONDAD DE AJUSTE Pruebas de bondad de ajuste xi cuadrada y Kolmogorov-Smirnov
13

Pruebas de bondad de ajuste - WordPress.com · Prueba de bondad de ajuste de Kolmogorov-Smirnov Esta prueba también es utilizada para encontrar la distribución de probabilidad y,

Jan 05, 2020

Download

Documents

dariahiddleston
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Pruebas de bondad de ajuste - WordPress.com · Prueba de bondad de ajuste de Kolmogorov-Smirnov Esta prueba también es utilizada para encontrar la distribución de probabilidad y,

Facultad de Ciencias Químicas e Ingeniería, UAEM Simulación de Procesos

PRUEBAS DE BONDAD DE AJUSTE Pruebas de bondad de ajuste xi cuadrada y Kolmogorov-Smirnov

Page 2: Pruebas de bondad de ajuste - WordPress.com · Prueba de bondad de ajuste de Kolmogorov-Smirnov Esta prueba también es utilizada para encontrar la distribución de probabilidad y,

1

Contenido Prueba de bondad de ajuste 𝜒2 .......................................................................................................... 2

Ejemplo de prueba de bondad de ajuste 𝜒2 ....................................................................................... 2

Prueba de bondad de ajuste de Kolmogorov-Smirnov ....................................................................... 6

Ejemplo de prueba de bondad de ajuste de Kolmogorov-Smirnov .................................................... 6

Conclusiones ....................................................................................................................................... 9

Apéndice............................................................................................................................................ 10

........................................................................................................................................................... 11

Bibliografía ........................................................................................................................................ 12

Page 3: Pruebas de bondad de ajuste - WordPress.com · Prueba de bondad de ajuste de Kolmogorov-Smirnov Esta prueba también es utilizada para encontrar la distribución de probabilidad y,

2

Prueba de bondad de ajuste 𝜒2 Esta prueba se utiliza para encontrar la distribución de probabilidad de una serie de datos

mediante histograma y tabla de frecuencias. La metodología de la prueba de 𝜒2 es la

siguiente:

1. Se elabora una tabla de frecuencias de 𝑚 intervalos, a partir de los 𝑛 datos

históricos. Se propone, de acuerdo a la regla de Sturges, que 𝑚 = 1 + 3.322 log 𝑛.

Otra forma de determinar el número de intervalos es mediante 𝑚 = √𝑛. Se obtiene

la frecuencia observada 𝑖 de cada intervalo (𝐹𝑂𝑖). Se calcula la media y la varianza

de los datos. De acuerdo a la tabla de frecuencias se grafica el histograma.

2. De acuerdo a la tabla de frecuencias y al histograma, obtenidos en el paso anterior,

se propone una distribución de probabilidad.

3. Con la distribución propuesta, se calcula la frecuencia esperada para cada uno de

los intervalos (𝐹𝐸𝑖) mediante la integración de la distribución propuesta y su

posterior multiplicación por el número total de datos.

4. Se calcula el estimador, de acuerdo a la siguiente expresión:

𝐶 = ∑(𝐹𝐸𝑖 − 𝐹𝑂𝑖)2

𝐹𝐸𝑖

𝑚

𝑖=1

5. Si el estimador 𝐶 es menor o igual al valor correspondiente de 𝜒2 con 𝑚 − 𝑘 − 1

grados de libertad (𝑘 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑝𝑎𝑟á𝑚𝑒𝑡𝑟𝑜𝑠 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛) y a

un nivel de confianza de 1 − 𝛼, la hipótesis de que los datos siguen la distribución

propuesta se acepta, y en caso contrario se rechaza y se propone una nueva

distribución, repitiendo el procedimiento anterior.

Ejemplo de prueba de bondad de ajuste 𝜒2 1. Los datos en meses del tiempo entre fallas de un automóvil son:

36.33 48.00 32.02 36.78 38.52 40.33 35.78 45.39 35.99 36.68

41.52 36.54 36.60 40.56 40.42 33.92 39.82 34.48 34.35 37.73

35.89 31.75 41.91 45.70 31.50 44.58 34.04 32.03 48.53 47.29

41.91 38.45 36.10 40.57 34.28 35.90 48.47 32.86 40.91 32.80

38.69 41.33 49.31 45.99 34.06 37.46 35.97 39.22 41.92 31.08

Construya un histograma y determine la distribución de probabilidad a un nivel de confianza

1 − 𝛼 = 97.5% con la prueba de bondad de ajuste 𝜒2

Page 4: Pruebas de bondad de ajuste - WordPress.com · Prueba de bondad de ajuste de Kolmogorov-Smirnov Esta prueba también es utilizada para encontrar la distribución de probabilidad y,

3

Se tienen 50 datos, por lo que el número de intervalos es:

𝑚 = 1 + 3.322 log 50

𝑚 = 6.644 ≈ 7

El rango se obtiene a partir del valor máximo y del valor mínimo registrados. En este caso:

𝑣𝑎𝑙𝑜𝑟 𝑚á𝑥𝑖𝑚𝑜 = 49.31

𝑣𝑎𝑙𝑜𝑟 𝑚í𝑛𝑖𝑚𝑜 = 31.08

𝑟𝑎𝑛𝑔𝑜 = 𝑣𝑎𝑙𝑜𝑟 𝑚á𝑥𝑖𝑚𝑜 − 𝑣𝑎𝑙𝑜𝑟 𝑚í𝑛𝑖𝑚𝑜

𝑟𝑎𝑛𝑔𝑜 = 18.23

Una vez calculados el rango y el número de intervalos, se estima el ancho de clase:

𝑎𝑛𝑐ℎ𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 =𝑟𝑎𝑛𝑔𝑜

𝑚

𝑎𝑛𝑐ℎ𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 = 2.61

A continuación, se procede a construir la tabla de frecuencias y el histograma:

Tabla 1. Tabla de frecuencia del ejemplo 1

Número de clase

Límite inferior

Límite superior

Frecuencia Observada

(FO)

1 31.08 33.69 7

2 33.69 36.3 12

3 36.3 38.91 10

4 38.91 41.52 8

5 41.52 44.13 4

6 44.13 46.74 4

7 46.74 49.35 5

Page 5: Pruebas de bondad de ajuste - WordPress.com · Prueba de bondad de ajuste de Kolmogorov-Smirnov Esta prueba también es utilizada para encontrar la distribución de probabilidad y,

4

Figura 1. Histograma del ejemplo 1

Observando los datos de la columna de frecuencia observada (FO) y la forma del

histograma, podemos suponer que los datos siguen una distribución de Weibull. Se trata de

un modelo continuo asociado a variables del tipo tiempo de vida, tiempo hasta que un

mecanismo falla, etc. La función de densidad de este modelo viene dada por:

𝑓(𝑥) = {𝛼𝛽−𝛼𝑥𝛼−1𝑒−(

𝑥𝛽

)𝛼

𝑠𝑖 𝑥 > 00 𝑑𝑒 𝑜𝑡𝑟𝑎 𝑚𝑎𝑛𝑒𝑟𝑎

La función de distribución que se propone, se obtiene por la integración de la función de

densidad:

𝐹(𝑥) = {1 − 𝑒−(

𝑥𝛽

)−𝛼

𝑠𝑖 𝑥 > 00 𝑑𝑒 𝑜𝑡𝑟𝑎 𝑚𝑎𝑛𝑒𝑟𝑎

Donde 𝛼 y 𝛽 son parámetros de forma y escala respectivamente.

Por ejemplo, 𝐹(𝑥) evaluado para el primer intervalo quedaría de la siguiente forma:

𝐹(𝑥) = 1 − 𝑒−(

𝑥𝛽

)−𝛼

|𝑙í𝑚. 𝑠𝑢𝑝.

𝑙í𝑚. 𝑖𝑛𝑓.

0

2

4

6

8

10

12

14

33,69 36,3 38,91 41,52 44,13 46,74 49,35

Fre

cue

nci

a

Clase

Histograma

Page 6: Pruebas de bondad de ajuste - WordPress.com · Prueba de bondad de ajuste de Kolmogorov-Smirnov Esta prueba también es utilizada para encontrar la distribución de probabilidad y,

5

Definiendo 𝛼 = 6.31 y 𝛽 = 40.09, y evaluando desde el límite inferior hasta el límite superior

del primer intervalo

𝐹(𝑥)1 = [1 − 𝑒−(

33.6940.09

)−6.31

] − [1 − 𝑒−(

31.0840.09

)−6.31

]

𝐹(𝑥)1 = 0.1019

De este modo, la frecuencia esperada es:

𝐹𝐸1 = 𝑛 ∗ 𝐹(𝑥)1

𝐹𝐸1 = 50(0.1019) = 5.0967

De manera similar se procede para el resto de las clases y se construye la siguiente tabla

de 𝐹𝑂𝑖 𝑣𝑠 𝐹𝐸𝑖

Tabla 2. Tabla comparativa entre frecuencias observadas y frecuencias esperadas de

acuerdo al modelo propuesto.

Número de clase

Límite inferior

Límite superior

FOi F(x)i FEi =

n*F(x)i

1 31.08 33.69 7 0.10193339 5.09666964

2 33.69 36.3 12 0.13022439 6.51121962

3 36.3 38.91 10 0.14921047 7.4605233

4 38.91 41.52 8 0.14966434 7.48321708

5 41.52 44.13 4 0.12729759 6.36487973

6 44.13 46.74 4 0.08819177 4.40958871

7 46.74 49.35 5 0.04736468 2.36823414

Finalmente, se calcula el estimador, de acuerdo a la siguiente expresión:

𝐶 = ∑(𝐹𝐸𝑖 − 𝐹𝑂𝑖)2

𝐹𝐸𝑖

𝑚

𝑖=1

𝐶 = 10.0791

El estimador C comparado con el valor de la tabla “puntos porcentuales de la distribución ji

cuadrada con 𝜐 grados de libertad” (Ver apéndice) 𝜒0.025, 42 = 11.14, es menor, por lo tanto,

se acepta la hipótesis de que el tiempo transcurrido entre fallas de un automóvil se comporta

de acuerdo a la distribución de Weibull propuesta, con un nivel de confianza del 97.5%.

Page 7: Pruebas de bondad de ajuste - WordPress.com · Prueba de bondad de ajuste de Kolmogorov-Smirnov Esta prueba también es utilizada para encontrar la distribución de probabilidad y,

6

Prueba de bondad de ajuste de Kolmogorov-Smirnov

Esta prueba también es utilizada para encontrar la distribución de probabilidad y, a

diferencia de la prueba de bondad de ajuste de 𝜒2, esta prueba trabaja con la distribución

de probabilidad acumulada. La metodología es la siguiente:

1. Se elabora una tabla de frecuencias de 𝑚 intervalos, a partir de los 𝑛 datos

históricos. Se propone, de acuerdo a la regla de Sturges, que 𝑚 = 1 + 3.322 log 𝑛.

Otra forma de determinar el número de intervalos es mediante 𝑚 = √𝑛. Se obtiene

la frecuencia observada 𝑖 de cada intervalo (𝐹𝑂𝑖). Se calcula la media y la varianza

de los datos.

2. A continuación, se obtiene la probabilidad acumulada observada 𝑖 (𝑃𝑂𝑖), resultado

de dividir la frecuencia observada de cada intervalo por el número total de datos.

3. Se calcula la probabilidad acumulada observada de cada intervalo (𝑃𝐴𝑂𝑖) del paso

anterior.

4. Se propone una distribución de probabilidad de acuerdo con la forma de la tabla de

frecuencias obtenida en el paso 1.

5. Con la distribución propuesta se calcula la probabilidad esperada para cada uno de

los intervalos (𝑃𝐸𝑖) mediante la integración de la distribución propuesta.

6. Se calcula la probabilidad acumulada esperada (𝑃𝐴𝐸𝑖) para cada intervalo de clase.

7. Se calcula el valor absoluto entre (𝑃𝐴𝐸𝑖) para cada intervalo y se selecciona la

máxima diferencia, llamándola 𝐷𝑀.

8. El estimador 𝐷𝑀 se compara con un valor límite correspondiente a la tabla 1

anexada en el presente documento, con 𝑛 datos y a un nivel de confianza de 1 − 𝛼.

Si el estimador 𝐷𝑀 ≤ límite de la tabla 1, la distribución propuesta se acepta, en

caso contrario se rechaza y se propone una nueva distribución.

Ejemplo de prueba de bondad de ajuste de Kolmogorov-Smirnov El número de horas de vida de un componente electrónico se comporta de acuerdo con los

datos históricos siguientes:

151.3 155.1 150.1 158.7 148.8 148.7 147.9 153.1 151.6 150.9

149.2 160.3 157.7 146.9 150.6 146.8 144.5 160.9 147.7 150.0

157.1 136.6 146.7 142.8 150.0 144.5 156.2 145.6 150.2 151.7

Page 8: Pruebas de bondad de ajuste - WordPress.com · Prueba de bondad de ajuste de Kolmogorov-Smirnov Esta prueba también es utilizada para encontrar la distribución de probabilidad y,

7

158.8 149.6 144.8 145.2 158.8 150.1 149.6 142.1 150.6 151.6

145.5 154.6 158.4 164.2 152.6 144.5 147.5 142.3 149.3 148.5

Construya un histograma y determine la distribución de probabilidad de los datos a un nivel

de confianza 1 − 𝛼 = 90% utilizando la prueba de bondad de ajuste de Komolgorov-

Smirnov.

Se tienen 50 datos, por lo que el número de intervalos será igual a

𝑚 = 1 + 3.322 log 50

𝑚 = 6.64 ≈ 7

Se obtiene la media, varianza y desviación estándar para la presente muestra de datos:

𝜇 = 150.416

𝜎2 = 30.5809

𝜎 = 5.53

Análogo al problema anterior, se construye la tabla de frecuencia observada, incluyendo

además las columnas de probabilidad observada y probabilidad observada acumulada.

𝑃𝑂𝑖 =𝐹𝑂𝑖

𝑛

𝑃𝑂𝐴𝑖 = ∑ 𝑃𝑂𝑖

𝑖

𝑚=1

Tabla 3. Tabla de frecuencia observada, probabilidad observada y probabilidad observada

acumulada.

Número de clase

Límite inferior

Límite superior

FO PO POA

1 136.6 140.55 1 0.02 0.02

2 140.55 144.5 3 0.06 0.08

3 144.5 148.45 13 0.26 0.34

4 148.45 152.4 19 0.38 0.72

5 152.4 156.35 5 0.1 0.82

6 156.35 160.3 6 0.12 0.94

7 160.3 164.25 3 0.06 1

Page 9: Pruebas de bondad de ajuste - WordPress.com · Prueba de bondad de ajuste de Kolmogorov-Smirnov Esta prueba también es utilizada para encontrar la distribución de probabilidad y,

8

A partir de los datos de probabilidad acumulada, se obtiene el siguiente gráfico de densidad:

Observando los datos se puede pensar que siguen una distribución normal con media de

150.416 y desviación estándar de 5.53. La función normal no es integrable, así que se

utilizará la tabla normal estándar.

De tabla normal estándar, se lee la probabilidad acumulada desde −∞ hasta 𝑧𝑖. Por

ejemplo, para el primer intervalo:

𝑧𝑖 =(𝑥𝑖 − 𝜇)

𝜎

𝑧1 =𝐿𝑆1 − 𝜇

𝜎=

140.55 − 150.416

5.53= −1.7841

Con ayuda de la función de Excel DISTR.NORM.ESTAND.N (z; acumulado) se busca el

valor correspondiente a la probabilidad esperada acumulada (PEA) desde −∞ hasta

−1.7841 es de 0.0372 para una distribución normal estándar. El procedimiento es similar

para los demás intervalos.

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

140,55 144,5 148,45 152,4 156,35 160,3 164,25

f(x)

=p(x

)

x

Función de densidad f(x)

Page 10: Pruebas de bondad de ajuste - WordPress.com · Prueba de bondad de ajuste de Kolmogorov-Smirnov Esta prueba también es utilizada para encontrar la distribución de probabilidad y,

9

Número de clase

Límite superior

z PEA

1 140.55 -1.7841 0.0372

2 144.5 -1.0698 0.1424

3 148.45 -0.3555 0.3611

4 152.4 0.3588 0.6401

5 156.35 1.0731 0.8584

6 160.3 1.7873 0.9631

7 164.25 2.5016 0.9938

Finalmente se estima |POA-PEA| y se determina la diferencia máxima DM

Tabla 4. Tabla de Probabilidad Esperada Acumulada

Número de clase

Límite superior

FO PO POA z PEA |POA-PEA|

1 140.55 1 0.02 0.02 -1.7841 0.0372 0.0172

2 144.5 3 0.06 0.08 -1.0698 0.1424 0.0624

3 148.45 13 0.26 0.34 -0.3555 0.3611 0.0211

4 152.4 19 0.38 0.72 0.3588 0.6401 0.0799

5 156.35 5 0.1 0.82 1.0731 0.8584 0.0384

6 160.3 6 0.12 0.94 1.7873 0.9631 0.0231

7 164.25 3 0.06 1 2.5016 0.9938 0.0062

𝐷𝑀 = 0.0799

El valor de DM se compara con la 𝑑5%,50 = 0.1923 (ver tabla “Valores Críticos de

Kolmogorov-Smirnov). Como DM es menor, se acepta la hipótesis de que los datos siguen

una distribución normal con media de 150.416 y desviación estándar de 5.53 a un nivel de

confianza del 95%.

Conclusiones El método de prueba de bondad de ajuste de chi cuadrada es idóneo cuando se tienen

distribuciones de fácil integración, tal es el caso de la distribución uniforme. En contraste,

para una distribución normal, es preferible trabajar con el método de bondad de ajuste de

Kolmogorov-Smirnov, dado que este método emplea el cálculo de probabilidad esperada

Page 11: Pruebas de bondad de ajuste - WordPress.com · Prueba de bondad de ajuste de Kolmogorov-Smirnov Esta prueba también es utilizada para encontrar la distribución de probabilidad y,

10

acumulada y hace una comparación más directa entre ésta y la probabilidad observada

acumulada.

Apéndice

Page 12: Pruebas de bondad de ajuste - WordPress.com · Prueba de bondad de ajuste de Kolmogorov-Smirnov Esta prueba también es utilizada para encontrar la distribución de probabilidad y,

11

Page 13: Pruebas de bondad de ajuste - WordPress.com · Prueba de bondad de ajuste de Kolmogorov-Smirnov Esta prueba también es utilizada para encontrar la distribución de probabilidad y,

12

Bibliografía Azarang, M. R., & García Dunna, E. (1998). Simulación y análisis de modelos estocásticos. México:

McGraw Hill.