este es un ejemplo que les servira de guia . exitos solucion modelos de regresion. Lic. Larios Ramirez Oscar datos DAP(X) ALTURA(Y) ssx ssy 1 15.6 17.4 2.05 0.75 1.5375 4.2025 0.5625 2 14.8 18.4 1.25 1.75 2.1875 1.5625 3.0625 3 15.5 16.5 1.95 -0.15 -0.2925 3.8025 0.0225 4 12.5 15.2 -1.05 -1.45 1.5225 1.1025 2.1025 5 14.2 19.9 0.65 3.25 2.1125 0.4225 10.5625 6 15.7 22.1 2.15 5.45 11.7175 4.6225 29.7025 7 12.3 14.8 -1.25 -1.85 2.3125 1.5625 3.4225 8 14.2 17.3 0.65 0.65 0.4225 0.4225 0.4225 9 8.8 10.3 -4.75 -6.35 30.1625 22.5625 40.3225 10 11.9 14.6 -1.65 -2.05 3.3825 2.7225 4.2025 SUMA 135.5 166.5 -7.11E-15 1.24E-14 55.065 42.985 94.385 PROM. 13.55 16.65 n 10 1º cálculo de la covarianza interpretacion covarianza ### este valor nos indica que el DAP y la a n-1 correlacionados , de forma directa a medida que aumenta el DAP aumenta la 2º calculo del cofeciente de correlación de Pearson "r" se encuantra entre -1 y 1 -1<r<1 interpretacion r= 0.864501374169 este valor es cercano a uno, lo que indica que el DAP y la altura estan relacionados de manera dire a medida que aumenta el DAP aumentara la altura 3º Ajuste de la recta de regresion el modelo esta dado por: y=b0 + b1x el modelo estimado será: ŷ = B0 + B1 x calculo de los parametros por metodo de minimos cuadrados B1= (x-ẋ)(y-ẏ) ∑ 1.281 interpretación: ssx el valor de B1= 1.281 siginifica que pa centimetro adicional de DAP, la altura B0= ẏ - B1*ẋ - 0.708 arbol se incrementara en 1.28 Bo, si el incremento del DAPes de cero ŷ =-0.708 + 1.281xi centimetros, se estima que la altura pr dio del arbol sera de -0.708 en este caso no tiene sentido este modelo de regresion nos puede servir para predecir, suponga que tiene un arbol un DAP = 11 cm, entonces se estima que 13.46 mt. (x-ẋ) (y-ẏ) (x-ẋ)(y-ẏ) ∑(x-ẋ)(y-ẏ) ∑(x-ẋ)(y-ẏ) √ssx*ssy suma mues suma de cuadrados muestrales de x (x-ẋ)^2 V.I menos su promedio(x-ẋ)
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
este es un ejemplo que les servira de guia .exitos
solucion modelos de regresion.Lic. Larios Ramirez Oscar
1º cálculo de la covarianza interpretacioncovarianza 6.118 este valor nos indica que el DAP y la altura estan
n-1 correlacionados , de forma directaa medida que aumenta el DAP aumenta la altura
2º calculo del cofeciente de correlación de Pearson"r" se encuantra entre -1 y 1-1<r<1
interpretacionr= 0.8645013741689 este valor es cercano a uno, lo que indica que el
DAP y la altura estan relacionados de manera directaa medida que aumenta el DAP aumentara la altura
3º Ajuste de la recta de regresion
el modelo esta dado por: y=b0 + b1xel modelo estimado será: ŷ = B0 + B1 x
calculo de los parametros por metodo de minimos cuadradosB1= ∑(x-ẋ)(y-ẏ) 1.281 interpretación:
ssx el valor de B1= 1.281 siginifica que para cadacentimetro adicional de DAP, la altura del
B0= ẏ - B1*ẋ - 0.708 arbol se incrementara en 1.28
Bo, si el incremento del DAPes de ceroŷ =-0.708 + 1.281xi centimetros, se estima que la altura prome-
dio del arbol sera de -0.708en este caso no tiene sentido
este modelo de regresion nos puede servir para predecir, suponga que tiene un arbolun DAP = 11 cm, entonces se estima que 13.46 mt.
(x-ẋ) (y-ẏ) (x-ẋ)(y-ẏ)
∑(x-ẋ)(y-ẏ)
∑(x-ẋ)(y-ẏ)
√ssx*ssy
suma de cuadrados muestrales de y
suma de cuadrados muestrales de x
(x-ẋ)^2
V.I menos su promedio(x-ẋ)
G8
Javi: suma de cuadrados muestrales de x
H8
Javi: suma cuadrados muestrales de y
B44
Javi: suma de cuadrados muestrales de x
Ademas se tiene el porcentaje de la variabilidad total que explica el modelo es de r^2= 0.865^2= 0.748: aproximadamente el75% de la variabilidad de la altura de los árbolesesta explicada por la variabilidad en la longitud en cm del DAP. Y el otro 25% se debe a factores no controlados
varianza residual= 23.936 error estándar residual = 1.73 una vez que tenemos el modelo de regresion lineal, procedemos a realizar las pruebas de hipotesis1. prueba de hipotesis para probar si la correlacion es significativa a) planteamos las hipotesis b) determinar nivel de significancia
Ho ῤ = 0 α= 0.05H1 ῤ ≠ 0
Ho El DAP y la altura de los arboles no estan correlacionadasH1 El DAP y la altura de los arboles estan psitivamente correlacionadas
c) Determinar el estadistico de prueba
d) determinar la region de rechazo calculo en excel2.306 2.306 DISTR.T.INV(0.05;8)
zona de rechazo zona de rechazo
-2.306 2.306
e) cálculo del estadistico de prueba
tc = 4.8647651826
f) conclusioncomo tc > 2.306, entonces existe suficiente evidencia estadistica para afirmar que el DAP y la Alturaestan siginificativamenet correlacionadas.
CALCULO DE LOS INTERVALOS DE CONFIANZA Y DE PREDICCION
ŷ =-0.708 + 1.2881xi
sse=∑(y-ŷ)^2
tc= (r √n-2)/√(1-r^2) como la muestra es menor que 30 se utilizara la distribucion t (1-α/2, n-2) gl
t(0.975, 8)
modelo lineal de pronostico
Valor real - Valor pronosticado
r = coeficiente correlación
Consiste en establecer dos puntos para el estimador , dentro del cual debe estar contenido elparametro o valor estadistico de la poblacion con cierto grado de confianza o de seguridad a) en el primer caso cuando la variable independiente (x) toma un valor que debe estar dentro del recorrido de la variable poblacional , y se desea estimar la variable dependiente ( y), la formula es la siguiente:
suponiendo que se quieren establecer los limtes de confianza al 95%, cuando el la variable DAP (en centimetros) toma un valor de 11xi 11ŷ = 13.4611t(n-2, 0.975) 2.306 ŷ =-0.708 + 1.2881xin 10
1879.01 li∑xi= 135.5 ls
6.50 e-estándar € 1.73
con los siguientes datos calculamos el intervalo de predicción(11-13.55)^2= 6.5025
1879.01-(135.5^2/10)= 42.985
Li= 9.00 Ls= 17.92
contraste de hipotesis para B0 y B1contraste para B1para estos estudios podemos estar interesados en demostrar si realmente existe una relacion entre las variables X e Y. para resolver esta cuestion tendremos que plantearnos un contraste de hipotesisa)Ho B1=0 no existe relacion entre las variablesH1 existe una relacion creciente o decreciente
b) estadistico de contrastetc = b1/SE(b1)donde: b1= B1= 1.2881
SE(b1)= 0.263831
una vez calculados estos valores se contrastara la hipotesis
c) nivel de significanciaα=0.05d) determinar region de rechazo
zona de rechazo zona de rechazo
∑(x-ẋ)^2
B1≠ 0
raiz cuadrada de la varianza residual
reemplazar x=11 en el modelo de regresión modelo de regresión
valor en la tabla T
VI. elevada al cuadrado
diferencia del valor x - el promedio de VI elevado al cuadrado
se obtiene del modelo de regresión
-2.306 2.306
e) calculo del estaditico de prueba:
tc = b1/SE(b1) 4.88 se rechaza la Ho, existe evidencia estadisticade que el tamaño del arbol aumenta en sulongitud
TABLA ANOVA EN REGRESION
hipotesisH0 el DAP de los arboles explica una parte la altura de los arbolesH1
suma de cuadrados grado libert MS F p-valorregresion SS(regres) 70.449 1 70.45 23.55 0.00127suma errores SS(resid) 23.936 n-2=8 2.992
TOTAL SSx 42.985 n-1=9
SS(regres)= SSy-SS(resid) 94.385-23.936= 70.449
70.449/1
23.936/8
70.449/2.992
137.37
0.864501374168923
Resumen
Estadísticas de la regresiónCoeficiente de correlación múltiple 0.86450137Coeficiente de determinación R^2 0.74736263R^2 ajustado 0.71578295Error típico 1.72645513Observaciones 10
ANÁLISIS DE VARIANZAGrados de libertadSuma de cuadradosPromedio de los cuadradosF Valor crítico de F
cov= covarianza 398.793 interpretacionn-1 este valor nos indica que el temperatura ycompuesto químico estan
correlacionados , de forma directa
r= 0.99040606 interpretacion
este valor es cercano a uno, lo que indica que eltemperatura y el compuesto quimico estan relacionados de manera dire
3º Ajuste de la recta de regresion a medida que aumenta el DAP aumentara la altura
el modelo esta dado por: y=b0 + b1xel modelo estimado será: ŷ = B0 + B1 x
calculo de los parametros por metodo de minimos cuadradosB1= ∑(x-ẋ)(y-ẏ) 0.587 interpretación:
ssx el valor de B1= 0.587 siginifica que para cadagrado de temperatura adicional , la cantidaddisuelta del compuesto quimico incrementa en 0.587
B0= ẏ - B1*ẋ 7.705 Bo, si el incremento dela temperatura es de cero
∑(x-ẋ)(y-ẏ)
∑(x-ẋ)(y-ẏ)
√ssx*ssy
D91
Javi: suma de cuadrados muestrales de x
grados, se estima que la cantidad de compuesto quimico disuelta promepromedio sera de 7.705
r^2= 0.9904^2= 0.9809: aproximadamente el 98% de la variabilidad del compuesto quimicoesta explicada por la variabilidad enen la temperatura. Y el otro 2% se debe a factores no controlados
una vez que tenemos el modelo de regresion lineal, procedemos a realizar las pruebas de hipotesis1. prueba de hipotesis para probar si la correlacion es significativa a) planteamos las hipotesis b) determinar nivel de significancia
sse=∑(y-ŷ)^2
Ho ῤ = 0 α= 0.05H1 ῤ ≠ 0
Ho El DAP y la altura de los arboles no estan correlacionadasH1 El DAP y la altura de los arboles estan psitivamente correlacionadas
c) Determinar el estadistico de prueba
d) determinar la region de rechazo calculo en excel2.048 2.048 DISTR.T.INV(0.05;28)
zona de rechazo zona de rechazo
-2.048 2.048
e) cálculo del estadistico de prueba
tc = 37.924767444
f) conclusioncomo tc > 2.048, entonces existe suficiente evidencia estadistica para afirmar que las temperaturas yel compuesto quimicoestan siginificativamenet correlacionadas.
CALCULO DE LOS INTERVALOS DE CONFIANZA Y DE PREDICCIONConsiste en establecer dos puntos para el estimador , dentro del cual debe estar contenido elparametro o valor estadistico de la poblacion con cierto grado de confianza o de seguridad a) en el primer caso cuando la variable independiente (x) toma un valor que debe estar dentro del recorrido de la variable poblacional , y se desea estimar la variable dependiente ( y), la formula es la siguiente:
suponiendo que se quieren establecer los limtes de confianza al 95%, cuando el la variable DAP (en centimetros) toma un valor de 11xi 50ŷ = 37.08 t(n-2, 0.975) 2.048 ŷ =7.7047 + 0.58741xin 30
61875 li
tc= (r √n-2)/√(1-r^2) como la muestra es menor que 30 se utilizara la distribucion t (1-α/2, n-2) gl
t(0.975, 28)
r = coeficiente correlación
raiz cuadrada de la varianza residual
reemplazar x=50 en el modelo de regresión
valor en la tabla T
VI. elevada al cuadrado
∑xi= 1125 ls 19,687.50
e-estándar € 2.17
con los siguientes datos calculamos el intervalo de predicción
1879.01-(135.5^2/10)=
Li= 32.39 Ls= 41.76
contraste de hipotesis para B0 y B1contraste para B1para estos estudios podemos estar interesados en demostrar si realmente existe una relacion entre las variables X e Y. para resolver esta cuestion tendremos que plantearnos un contraste de hipotesisa)Ho B1=0 no existe relacion entre las variablesH1 existe una relacion creciente o decreciente
b) estadistico de contrastetc = b1/SE(b1)donde: b1= B1= 0.587
SE(b1)= 0.0154893124
una vez calculados estos valores se contrastara la hipotesis
c) nivel de significanciaα=0.05d) determinar region de rechazo
zona de rechazo zona de rechazo
-2.048 2.048
e) calculo del estaditico de prueba:
tc = b1/SE(b1) 37.92 se rechaza la Ho, existe evidencia estadisticade que el el compuesto quimico aumentara con la temperatura
TABLA ANOVA EN REGRESION
hipotesisH0 el DAP de los arboles explica una parte la altura de los arboles
∑(x-ẋ)^2
B1≠ 0
VI. elevada al cuadrado
diferencia del valor x - el promedio de VI elevado al cuadrado
se obtiene del modelo de regresión
H1
suma de cuadrados grado libertad MS F p-valorregresion SS(regres) 6,793.611 1 6,793.61 1,438.29 0.000000 suma erroresSS(resid) 132.255 n-2=28 4.723
este valor nos indica que el temperatura ycompuesto químico estan 11 42.9504762 -2.95047619correlacionados , de forma directa 12 51.7619048 0.23809524
13 7.7047619 2.295238114 16.5161905 -2.51619048
este valor es cercano a uno, lo que indica que el 15 25.327619 -0.32761905temperatura y el compuesto quimico estan relacionados de manera dire 16 34.1390476 -2.13904762a medida que aumenta el DAP aumentara la altura 17 42.9504762 0.04952381
el valor de B1= 0.587 siginifica que para cada 24 51.7619048 2.23809524grado de temperatura adicional , la cantidad 25 7.7047619 3.2952381disuelta del compuesto quimico incrementa en 0.587 26 16.5161905 1.48380952
27 25.327619 0.67238095Bo, si el incremento dela temperatura es de cero 28 34.1390476 -0.13904762
grados, se estima que la cantidad de compuesto quimico disuelta prome 29 42.9504762 2.04952381promedio sera de 7.705 30 51.7619048 3.23809524
2.17
como tc > 2.048, entonces existe suficiente evidencia estadistica para afirmar que las temperaturas yel compuesto quimico
ŷ =7.7047 + 0.58741xi
(11-13.55)^2 156.251879.01-(135.5^2/10)= 19687.5
de que el el compuesto quimico aumentara con la temperatura
diferencia del valor x - el promedio de VI elevado al cuadrado
se obtiene del modelo de regresión
70.449/2.992
matriz transpuesta1 1 1 1 1 1 1
45 60 75 0 15 30 45
Promedio de los cuadrados F Valor crítico de F6793.61142857143 1438.28799 1.2928E-254.72340136054422
Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95.0%Superior 95.0%10.9529247595756 1.24348E-11 6.26382358 9.14570023 6.26382358 9.1457002337.9247674444162 1.2928E-25 0.55570015 0.61915699 0.55570015 0.61915699