ESTADISTICA INFERENCIAL II I.T.S.CH
1. REGRESION LINEAL SIMPLE
Regresin lineal simple. Tiene como objeto estudiar cmo los
cambios en una variable, no aleatoria, afectan a una variable
aleatoria, en el caso de existir una relacin funcional entre ambas
variables que puede ser establecida por una expresin lineal, es
decir, su representacin grfica es una lnea recta. Cuando la relacin
lineal concierne al valor medio o esperado de la variable
aleatoria, estamos ante un modelo de regresin lineal simple. La
respuesta aleatoria al valor x de la variable controlada se designa
por Yx y, segn lo establecido, se tendr
De manera equivalente, otra formulacin del modelo de regresin
lineal simple sera: si xi es un valor de la variable predictora e
Yi la variable respuesta que le corresponde, entonces
Ei es el error o desviacin aleatoria de Yi .Definicin VALOR
MEDIO. Constante que representa el centro de gravedad de la ley de
probabilidad de una variable aleatoria y que, en casos de notable
simetra en la funcin de densidad, puede interpretarse que dicha
constante nos seala la zona donde se sitan los valores de mxima
probabilidad de la variable aleatoria. El valor medio o valor
esperado de una variable aleatoria X se define como
Siempre que dicho valor exista, donde f es la funcin de densidad
de la variable.
Estimacin de parmetros.
En un grupo de 8 pacientes se miden las cantidades
antropomtricas peso y edad, obtenindose los siguientes resultados:
Resultado de las mediciones
edad1281011771014
peso5842515440394956
Existe una relacin lineal importante entre ambas variables?
Calcular la recta de regresin de la edad en funcin del peso y la
del peso en funcin de la edad. Calcular la bondad del ajuste En qu
medida, por trmino medio, vara el peso cada ao? En cunto aumenta la
edad por cada kilo de peso? Solucin: Para saber si existe una
relacin lineal entre ambas variables se calcula el coeficiente de
correlacin lineal, que vale:
Ya que
Por tanto el ajuste lineal es muy bueno. Se puede decir que el
ngulo entre el vector formado por las desviaciones del peso con
respecto a su valor medio y el de la edad con respecto a su valor
medio, , es:
es decir, entre esos vectores hay un buen grado de paralelismo
(slo unos 19 grados de desviacin). La recta de regresin del peso en
funcin de la edad es
La recta de regresin de la edad como funcin del peso es
que como se puede comprobar, no resulta de despejar en la recta
de regresin de Y sobre X. La bondad del ajuste es
Por tanto podemos decir que el de la variabilidad del peso en
funcin de la edad es explicada mediante la recta de regresin
correspondiente. Lo mismo podemos decir en cuanto a la variabilidad
de la edad en funcin del peso. Del mismo modo puede decirse que hay
un de varianza que no es explicada por las rectas de regresin. Por
tanto la varianza residual de la regresin del peso en funcin de la
edad es
y la de la edad en funcin del peso: Por ltimo la cantidad en que
vara el peso de un paciente cada ao es, segn la recta de regresin
del peso en funcin de la edad, la pendiente de esta recta, es
decir, b1=2,8367 Kg/ao. Cuando dos personas difieren en peso, en
promedio la diferencia de edad entre ambas se rige por la cantidad
b2=0,3136 aos/Kg de diferencia.
1.11 PRUEBA DE HIPOTESIS EN LA REGRESION LINEAL SIMPLE
1.1.2 CALIDAD DEL AJUSTE EN REGRESION LINEAL SIMPLE
1.1.3 ESTIMACION Y PREDICCION POR INTERVALOS EN REGRESION LINEAL
SIMPLE
Medicin de la adecuacin del modelo de regresin. - Anlisis
residual
1.4 USO DE SOFTWARE ESTADISTICO
1.2 REGRESION LINEAL MULTIPLE
1.2.1 PRUEBAS DE HIPOTESIS EN REGRESION LINEAL MULTIPLE
1.2.2 INTERVALOS DE CONFIANZA Y PREDICCION EN REGRESION
MULTIPLE
1.2.3 USO DE SOFTWARE ESTADISTICO
1.3 REGRESION NO LINEAL
En estadstica, la regresin no lineal es un problema de
inferencia para un modelo tipo:y = f(x, ) + Basado en datos
multidimensionales x, , donde f es alguna funcin no lineal respecto
a algunos parmetros desconocidos . Como mnimo, se pretende obtener
los valores de los parmetros asociados con la mejor curva de ajuste
(habitualmente, con el mtodo de los mnimos cuadrados). Con el fin
de determinar si el modelo es adecuado, puede ser necesario
utilizar conceptos de inferencia estadstica tales como intervalos
de confianza para los parmetros as como pruebas de bondad de
ajuste.El objetivo de la regresin no lineal se puede clarificar al
considerar el caso de la regresin polinomial, la cual es mejor no
tratar como un caso de regresin no lineal. Cuando la funcin f toma
la forma:f(x) = ax2 + bx + cla funcin f es no lineal en funcin de x
pero lineal en funcin de los parmetros desconocidos a, b, y c. Este
es el sentido del trmino "lineal" en el contexto de la regresin
estadstica. Los procedimientos computacionales para la regresin
polinomial son procedimientos de regresin lineal (mltiple), en este
caso con dos variables predictoras x y x2. Sin embargo, en
ocasiones se sugiere que la regresin no lineal es necesaria para
ajustar polinomios. Las consecuencias prcticas de esta mala
interpretacin conducen a que un procedimiento de optimizacin no
lineal sea usado cuando en realidad hay una solucin disponible en
trminos de regresin lineal. Paquetes (software) estadsticos
consideran, por lo general, ms alternativas de regresin lineal que
de regresin no lineal en sus procedimientos.Mtodos Numricos para
Regresiones No LinealesRegresin ExponencialEn determinados
experimentos, en su mayora biolgicos, la dependencia entre las
variables X e Y es de forma exponencial, en cuyo caso interesa
ajustar a la nube de puntos una funcin del tipo:
Mediante una transformacin lineal, tomando logaritmos
neperianos, se convierte el problema en una cuestin de regresin
lineal. Es decir, tomando logaritmos neperianos:
EjemploxyIn yx2x InyIn y2
131,098611,09861,2069
1,23,41,22371,441,46841,4974
1,551,60942,252,41412,5901
220,693141,38620,4803
34,11,410994,23271,9906
3,751,609413,695,95472,5901
471,9459167,78363,7865
4,56,51,871820,258,42313,5056
20,9 36 11,4628 67,63 32,7614 17,6455
Numero de datos = n = 8
x promedio = = = 2,6125
y promedio = = = 1,43285
Usando la forma lineal de la Regresin Exponencial:
b = = = 0,216047
= 1,43285 - (0,216047)(2,6125) = 0,868427
a = eb = e0,216047 = 2,38316La ecuacin final que modela el
sistema es
Regresin LogartmicaLa curva logartmica es tambin una recta, pero
en lugar de estar referida a las variables originales e , est
referida a y a Ejemploxyln xln x2ln x * yy2
130009
1.23.40.18230.03320.619811.56
1.550.40540.16432.02725
220.69310.48031.38624
34.11.09861.20694.504216.81
3.751.30831.71166.541525
471.38621.92159.703449
4.56.51.50402.26209.77642.25
20.9 36 6.5779 7.7798 34.5581 182.62
n=8
a = = = 2.090513
b = = 4.5 - (2.090513)(0.8222) = 2.78117
La ecuacin final que modela el sistema es
Regresin PolinomialAlgunas veces cuando la relacin entre las
variables dependientes e independientes es no lineal, es til
incluir trminos polinomiales para ayudar a explicar la variacin de
nuestra variable dependiente.Las regresiones polinomiales se pueden
ajustar la variable independiente con varios trminos
Ejemploxyxyx2y2x2yx3x4
13319311
1.23.44.081.4411.564.8961.7282.0736
1.557.52.252511.253.3755.0625
224448816
34.112.3916.8136.92781
3.7518.513.692568.4550.653187.4161
4728164911264256
4.56.529.2520.2542.25131.62591.125410.0625
20.9 36 106.63 67.63 182.62 376.121 246.881 958.6147
Usando una Matriz para calcular valores de los coeficientes
Usando el mtodo de Eliminacin de Gauss-Jordan
La ecuacin final que modela el sistema es
LinealizacinAlgunos problemas de regresin no lineal pueden
linealizarse mediante una transformacin en la formulacin del
modelo. Por ejemplo, consideremos el problema de regresin no lineal
(ignorando el trmino de error):