“AÑO DE LA PROMOCION DE LA INDUSTRIA RESPONSABLE Y DEL COMPROMISO CLIMATICO” UNIVERSIDAD NACIONAL DE UCAYALI FACULTAD DE INGENIERIA DE SISTEMAS E INGENIERIA CIVIL ESCUELA PROFESIONAL DE INGENIERIA DE SISTEMAS TEMA : REGRESIÓN CURSO : ESTADÍSTICA APLICADA DOCENTE : ING. ESCUDERO VASQUEZ HUMBERTO INTEGRANTES : DAVILA VILLACREZ, SHAUNY ELESCANO RAMIREZ,ROSA MERCEDES SIALER GARCIA ,JORGE UNTIVEROS BARBOZA, YURI VELA CESPEDES ,GERSON CICLO : 2014 – 0 1
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
“AÑO DE LA PROMOCION DE LA INDUSTRIA RESPONSABLE Y DEL COMPROMISO CLIMATICO”
UNIVERSIDAD NACIONAL DE UCAYALI
FACULTAD DE INGENIERIA DE SISTEMAS E INGENIERIA CIVIL
Este trabajo es dedicado a las personas que nos apoyan esencialmente a nuestros padres, compañeros y al docente que amplia nuestros conocimientos y nos ayuda a aprender más sobre el curso.
INTRODUCCIÓN
2
En muchas aplicaciones estadísticas se debe resolver problemas que contienen un conjunto de variables y que se sabe que existe alguna asociación entre ellas.
En este conjunto de variables muy a menudo tiene una sola variable dependiente (o respuesta) Y, que depende de una o más variables independientes (o predictores de regresión) X1, X2…etc, como ejemplo años de experiencia, salario, grado de instrucción, genero, etc.
OBJETIVOS
3
Conocer y comprender los conceptos de análisis de regresión lineal.
Conocer los procedimientos de estimación de los métodos estadísticos de regresión, como el método de los mínimos cuadrados.
Conocer las etapas a seguir para realizar un análisis de la regresión.
MARCO TEORICO
4
REGRESIÓN
Es describir la relación entre dos variables numéricas, consistiendo en determinar una relación funcional de la variable dependiente Y con respecto a una o más variables independientes con el fin de predecir valores de Y, y analizar su valides, sirve para predecir una medida en función de otra u otras medidas.
En términos generales, el análisis de Regresión trata sobre el estudio de la dependencia de un fenómeno económico respecto de una o varias variables explicativas, con el objetivo de explorar o cuantificar la media o valor promedio poblacional de la primera a partir de un conjunto de valores conocidos o fijos de la/s segunda/s.
Utiliza el método de los "mínimos cuadrados" para ajustar una línea a una serie de observaciones. Puede utilizar esta herramienta para analizar la forma en que los valores de una o más variables independientes afectan a una variable dependiente; por ejemplo, en el rendimiento de un atleta inciden varios factores: la edad, la estatura y el peso entre otros. Basándose en un conjunto de datos de rendimiento, la regresión determinará la incidencia de cada uno de los factores en la medición del rendimiento y podrán utilizarse estos resultados para predecir el rendimiento de un atleta nuevo no sometido a ninguna prueba.
Y = variable dependienteo Predichao Explicada
X = variable independienteo Predictoriao Explicativa
¿ es posible descubrir una relación?
- Y = f(X) + error- f es una función de tipo determinado- el error es aleatorio, pequeño y no depende de X
REGRESIÓN LINEAL SIMPLE
Consideremos la variable aleatoria Y dependiente de una sola variable (Matemática) independiente X. La relación funcional lineal que suponemos existen entre X e Y es la especificada por el modelo estadística (o modelo probabilístico).
5
Y = ∞ + βX + ε
Donde
∞ es la ordenada en el origen o termino constante
β es la pendiente de regresión
ε es el termino error o residuo del modelo, es una variable aleatoria que se supone tiene media cero.
Si denotamos con μγ a E(Y), el modelo probabilístico de regresión lineal simple es entonces equivalente al modelo matemático (o modelo probabilístico):
μγ = ∞ + βX
El modelo estadístico de la regresión lineal simple en términos de la muestra aleatoria tamaño n : (X!, Y!) , i = 1, 2, ….n, es entonces :
Y!= ∞ + βX! + ε! , i = 1, 2, …. N
Donde el termino error o residuo: ε! = Y! - μγ! Es una variable aleatoria.
SUPUESTOS
Los supuestos que se hacen sobre la variable aleatoria error ε del modelo de regresión lineal son los supuestos del modelo de regresión lineal simple. Estos supuestos son:
1. Independencia
Se supone que las variables aleatorias Y! son independientes. Por lo tanto, se supone que los errores ε! son variables aleatorias estadísticas independientes.
2. Linealidad
Se supone que cada media μγ! de Y! esta línea recta : μγ = ∞ + βX. Esto es equivalente a suponer que la media de la distribución de probabilidades de ε! es cero en cada X! (o E(ε!)= 0). Esto describe el supuesto : E (ε)=0) del modelo estadístico general.
6
3. Igualdad de Varianza
Se supone que las varianzas δ2y! de Y! en cada X! son iguales a la
varianza común δ2, denominada varianza de regresión. Esto es equivalente a suponer que la varianza de la distribución de probabilidades de ε! es δ2
en cada X! esto describe el supuesto : Var (ε) = δ2 del modelo estadístico general.
4. Normalidad
Se supone que cada variable aleatoria Y! tiene distribución normal. Esto es equivalente a suponer que la distribución de probabilidades de ε! es normal.
ESTIMACIÓN DEL MODELO DE REGRESIÓN
La estimación del modelo de regresión (poblacional) μγ = ∞ + βX es la ecuación de regresión muestral (o de estimación o de predicción)
Ŷ = a + bX
Donde
Ŷ es una estimación de μγ (y de Y)
7
A y b son las estimaciones del modelo de regresión lineal simple, esto es, para obtener:
Ŷ = a + bX
DIAGRAMA DE DISPERSIÓN O NUBE DE PUNTOS
Una nube de puntos o diagrama de dispersión consiste en representar cada par de valores de las variables en un sistema de coordenadas cartesianas en el que los ejes X e Y representan las variables de la distribución bidimensional.
METODO DE LOS MÍNIMOS CUADRADOS
Mínimos cuadrados es una técnica de análisis numérico enmarcada dentro de la optimización matemática, en la que, dados un conjunto de pares ordenados: variable independiente, variable dependiente, y una familia de funciones, se intenta encontrar la función continua, dentro de dicha familia, que mejor se aproxime a los datos (un "mejor ajuste"), de acuerdo con el criterio de mínimo error cuadrático.
8
Es una técnica cuyo objetivo es derivar una curva que minimice la discrepancia entre los puntos y la curva. Algunas suposiciones estadísticas inherentes en los procedimientos por mínimos cuadrados lineales son:
1. Cada x tiene un valor fijo, no es aleatorio y es conocido sin error.
2. Los valores y son valores aleatorios independientes y todos tienen la misma varianza.
3. Los valores de y para una x dada deben ser normalmente distribuidos.
4. La regresión de y contra x no es la misma que la de x contra y.
Y = a + bx
Donde :
Y = variable dependiente
X = variable independiente
a = constante
b = pendiente
FORMULAS
∑ Y = an + b ∑ X
∑ XY = a∑ X + b ∑ X2
a = ∑ x 2 ∑ y - ∑x ∑xy
n∑x2 - ∑(x)2
9
b = n∑ xy - ∑x ∑xy
n∑x2 - ∑(x)2
a = ŷ – bx
donde :
ŷ = media de y
x = media de x
para sacar b
b = ∑ xy – n(x)(y)
∑x2 - n(x)2
Ejercicios
1. El gerente de personal de la empresa agroindustrial “selva estudia la relación entre la variable dependiente: Y = gastos y de la variable independiente X = salarios, de su personal obrero. Si una muestra aleatoria de 20 obreros revelo los siguientes datos en ingreso por semana :
El análisis de regresión consiste en emplear métodos que permitan determinar la mejor relación funcional entre dos o más variables o relacionadas, Es decir; no sólo se busca una función matemática que exprese de qué manera se relacionan, sino también con que precisión se puede predecir el valor de una de ellas si se conoce los valores de las variables asociadas.