Prueba para la Bondad de ajuste Validación de Modelo Integrantes LERBY ARTEAGA FREDDY ARENAS CARLOS ARIZA LUIS MORENO REPUBLICA BOLIVARIANA DE VENEZUELA MINISTERIO DEL PODER POPULAR PARA LA DEFENSA UNIVERSIDAD NACIONAL EXPERIMENTAL DE LA FUERZA ARMADA (UNEFA) NUCLEO ZULIA
32
Embed
Prueba para la Bondad de ajuste Validación de Modelo
Prueba para la Bondad de ajuste Validación de Modelo. Integrantes LERBY ARTEAGA FREDDY ARENAS CARLOS ARIZA LUIS MORENO. REPUBLICA BOLIVARIANA DE VENEZUELA MINISTERIO DEL PODER POPULAR PARA LA DEFENSA UNIVERSIDAD NACIONAL EXPERIMENTAL DE LA FUERZA ARMADA (UNEFA) NUCLEO ZULIA. - PowerPoint PPT Presentation
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Prueba para la Bondad de ajuste Validación de Modelo
Integrantes LERBY ARTEAGAFREDDY ARENAS
CARLOS ARIZALUIS MORENO
REPUBLICA BOLIVARIANA DE VENEZUELAMINISTERIO DEL PODER POPULAR PARA LA DEFENSA
UNIVERSIDAD NACIONAL EXPERIMENTAL DE LA FUERZA ARMADA (UNEFA)
NUCLEO ZULIA
Prueba para la Bondad de ajuste
Las pruebas de bondad de ajuste tienen por objetivo determinar si los datos se ajustan a una determinada distribución, esta distribución puede estar completamente especificada (hipótesis simple) o perteneciente a una clase paramétrica (hipótesis compuesta).
La prueba de bondad de ajuste se aplica en diseños de investigación en los que se estudia a un único grupo.
La prueba compara la distribución de frecuencias observada (Fo) de una variable usualmente cualitativa, pero que también puede ser cuantitativa, con la distribución de frecuencias de la misma variable medida en un grupo de referencia.
Hipótesis estadística nula: Ho: Fo = Fe Hipótesis estadística alterna: Ha: Fo ≠ Fe
El procedimiento de la prueba incluye el cálculo de la medida de resumen llamada Chi cuadrada. El rechazo del Ho ocurre cuando el valor calculado con los datos resulta mayor que el valor crítico de dicha medida contenido en una tabla llamada Valores Críticos de Chi cuadrada.
Prueba para la Bondad de ajuste
En el caso de que el valor de Chi cuadrada calculada sea igual o menor al de Chi cuadrada crítica se dice que no se rechaza al Ho y, por tanto, se concluye que la Fo es semejante a la Fe. En otras palabras, se dice que ambas distribuciones se ajustan bien; de ahí el nombre de la prueba: bondad de ajuste.
Se propone que el número de defectos en las tarjetas de circuito impreso sigue una distribución Poisson.
Se reúne una muestra aleatoria de 60 tarjetas de circuito impreso y se observa el número de defectos. Los resultados obtenidos son los siguientes:
Prueba para la Bondad de ajuste
Una moneda fue lanzada al aire 1000 series, de 5 veces cada serie y se observó el número de caras de cada serie. El número de series en los que se presentaron 0, 1, 1, 3, 4 y 5 caras se muestra en la siguiente tabla.
Número de
caras
Número de series (frecuencia
observada)
0 38
1 144
2 342
3 287
4 164
5 25
Total 1000
Prueba para la Bondad de ajuste
Prueba para la Bondad de ajuste
Prueba para la Bondad de ajuste
Número de defectos
Frecuencia observada
0 321 152 9
3 ó más 4
Prueba para la Bondad de ajuste
Validación de modelos
Validación es el proceso de comprobar que los resultados aportados por el modelo para las variables de salida y de estado no son muy diferentes a los medidos en la realidad. Existen diferentes índices que permiten cuantificar el grado de ajuste entre los datos medidos y los resultados del modelo. Coeficiente de determinación r2, es decir el cuadrado del Coeficiente de correlación
El problema estadístico se convierte en que dado un conjunto de datos hipotéticamente relacionados entre sí ¿cómo evidenciar esa relación?
Desarrollar un modelo que permita ser posible validar con determinada certeza el valor de una variable dependiente con respecto a otra relacionada
Y=f(x)
Diagrama de DispersiónEs la representación gráfica de las observaciones de las variables
aparente o hipotéticamente relacionadas, con el objeto de evidenciar tal relación.
Por ejemplo
El ajuste de la curva es el procedimiento de hallar una curva que represente lo más eficazmente posible la distribución de los datos El objeto es determinar la ecuación de la curva que represente la menos desviación posible del conjunto de datos considerado. A estos efectos el procedimiento de mínimos cuadrados, es la técnica matemática de análisis numérico que permite encontrar la función que mejor se aproxime al conjunto de datos siguiendo el criterio del menor error cuadrático. Se trata de minimizar la suma de los cuadrados entre los puntos generados por la función y los correspondientes en los datos
Regresión y regresión lineal simple
Se llama Regresión a la media de la distribución de una variable (dependiente) con respecto a un valor determinado de otra (independiente). Es el proceso de ajustar una recta a un conjunto de datos cuya dispersión sugiere este tipo de síntesis matemática. El modelo puede representarse como:Donde:Yᵢ= variable dependienteβ0=intersección con el eje de las ordenadasβ1=pendiente real de la poblaciónXᵢ=la variable independienteἑᵢ=error aleatorio en Y para la observación ᵢ
El método de mínimos cuadrados nos permite determinar, dentro de estas premisas, la ecuación bajo el siguiente modelo general:
Las ecuaciones normales de la regresión lineal
Resolviendo el sistema se obtiene
Donde ambas medias son las correspondientes al conjunto de
datos dado.
Si obtenemos la razón de la variación explicada a la variación
total podremos calcular el porcentaje de la variación explicada por
el modelo de regresión y por tanto una medida de cuán confiable
es el modelo. Esta medida se define como:
La variación explicada representa la diferencia entre la media de Y yYest;. La variación no explicada representa la parte de la variación no explicada por la regresión y está basada en la diferencia entre el valor observado Yi y el valor de Yest; el valor predicho por la recta de regresión para un Xi dado. Es claro que:
•Vtotal=Vexp - Vnexp
• Vtotal=variación total
Considerando:
• Vexp=Variación explicada
•Vnexp=Variación no explicada
Expresadas matemáticamente con los siguientes ecuaciones Variación total
A partir de esta data, se construye un gráfico de dispersión con el objeto de determinar a grandes rasgos si su hipótesis es válida:
Ejercicio I
Ejercicio I El contador de costos de una empresa de
construcción tiene el problema de estimar los costos de construcción para viviendas unifamiliares en el próximo año, para asignar los posibles precios. Tiene a mano los registros de todas las viviendas construidas en el último año. Por experiencia supone como razonable la hipótesis que el costo de la construcción está relacionado con el tamaño de la parcela: (Y) decide tomar una muestra aleatoria de 12 casas, según tabla a continuación:
El gráfico demuestra que la hipótesis es más que razonablemente valida, por lo proceda a construir una recta de regresión y obtener así su modelo.
Ojo: Esta no se hace solo nos piden r2 = Vexp/Vtotal
Ejercicio II
Se desea estimar los costos para la construcción de un apartamento, para determinar los posibles precios, tomando en cuenta la relación costo-tamaño se decide tomar una muestra aleatoria de 7 expresada según la tabla a continuación
Área de la terreno (mts)2
Costo construcción (bs)
1 2000 41.20
2 1500 45.50
3 4000 54.10
4 3000 50,05
5 5000 63.40
6 2500 90.40
7 4500 85.70
El gráfico demuestra que la hipótesis es más que razonablemente valida, por lo proceda a construir una recta de regresión y obtener así su modelo.
Luego se obtienen los valores de la tabla de acuerdo a cada uno de ellos