Top Banner
“AÑO DE LA PROMOCION DE LA INDUSTRIA RESPONSABLE Y DEL COMPROMISO CLIMATICO” UNIVERSIDAD NACIONAL DE UCAYALI FACULTAD DE INGENIERIA DE SISTEMAS E INGENIERIA CIVIL ESCUELA PROFESIONAL DE INGENIERIA DE SISTEMAS TEMA : REGRESIÓN CURSO : ESTADÍSTICA APLICADA DOCENTE : ING. ESCUDERO VASQUEZ HUMBERTO INTEGRANTES : DAVILA VILLACREZ, SHAUNY ELESCANO RAMIREZ,ROSA MERCEDES SIALER GARCIA ,JORGE UNTIVEROS BARBOZA, YURI VELA CESPEDES ,GERSON CICLO : 2014 – 0 1
17
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Regresion Final

“AÑO DE LA PROMOCION DE LA INDUSTRIA RESPONSABLE Y DEL COMPROMISO CLIMATICO”

UNIVERSIDAD NACIONAL DE UCAYALI

FACULTAD DE INGENIERIA DE SISTEMAS E INGENIERIA CIVIL

ESCUELA PROFESIONAL DE INGENIERIA DE SISTEMAS

TEMA : REGRESIÓN

CURSO : ESTADÍSTICA APLICADA

DOCENTE : ING. ESCUDERO VASQUEZ HUMBERTO

INTEGRANTES :

DAVILA VILLACREZ, SHAUNY ELESCANO RAMIREZ,ROSA MERCEDES SIALER GARCIA ,JORGE UNTIVEROS BARBOZA, YURI VELA CESPEDES ,GERSON

CICLO : 2014 – 0

1

Page 2: Regresion Final

AGRADECIMIENTO

Este trabajo es dedicado a las personas que nos apoyan esencialmente a nuestros padres, compañeros y al docente que amplia nuestros conocimientos y nos ayuda a aprender más sobre el curso.

INTRODUCCIÓN

2

Page 3: Regresion Final

En muchas aplicaciones estadísticas se debe resolver problemas que contienen un conjunto de variables y que se sabe que existe alguna asociación entre ellas.

En este conjunto de variables muy a menudo tiene una sola variable dependiente (o respuesta) Y, que depende de una o más variables independientes (o predictores de regresión) X1, X2…etc, como ejemplo años de experiencia, salario, grado de instrucción, genero, etc.

OBJETIVOS

3

Page 4: Regresion Final

Conocer y comprender los conceptos de análisis de regresión lineal.

Conocer los procedimientos de estimación de los métodos estadísticos de regresión, como el método de los mínimos cuadrados.

Conocer las etapas a seguir para realizar un análisis de la regresión.

MARCO TEORICO

4

Page 5: Regresion Final

REGRESIÓN

Es describir la relación entre dos variables numéricas, consistiendo en determinar una relación funcional de la variable dependiente Y con respecto a una o más variables independientes con el fin de predecir valores de Y, y analizar su valides, sirve para predecir una medida en función de otra u otras medidas.

En términos generales, el análisis de Regresión trata sobre el estudio de la dependencia de un fenómeno económico respecto de una o varias variables explicativas, con el objetivo de explorar o cuantificar la media o valor promedio poblacional de la primera a partir de un conjunto de valores conocidos o fijos de la/s segunda/s.

Utiliza el método de los "mínimos cuadrados" para ajustar una línea a una serie de observaciones. Puede utilizar esta herramienta para analizar la forma en que los valores de una o más variables independientes afectan a una variable dependiente; por ejemplo, en el rendimiento de un atleta inciden varios factores: la edad, la estatura y el peso entre otros. Basándose en un conjunto de datos de rendimiento, la regresión determinará la incidencia de cada uno de los factores en la medición del rendimiento y podrán utilizarse estos resultados para predecir el rendimiento de un atleta nuevo no sometido a ninguna prueba.

Y = variable dependienteo Predichao Explicada

X = variable independienteo Predictoriao Explicativa

¿ es posible descubrir una relación?

- Y = f(X) + error- f es una función de tipo determinado- el error es aleatorio, pequeño y no depende de X

REGRESIÓN LINEAL SIMPLE

Consideremos la variable aleatoria Y dependiente de una sola variable (Matemática) independiente X. La relación funcional lineal que suponemos existen entre X e Y es la especificada por el modelo estadística (o modelo probabilístico).

5

Page 6: Regresion Final

Y = ∞ + βX + ε

Donde

∞ es la ordenada en el origen o termino constante

β es la pendiente de regresión

ε es el termino error o residuo del modelo, es una variable aleatoria que se supone tiene media cero.

Si denotamos con μγ a E(Y), el modelo probabilístico de regresión lineal simple es entonces equivalente al modelo matemático (o modelo probabilístico):

μγ = ∞ + βX

El modelo estadístico de la regresión lineal simple en términos de la muestra aleatoria tamaño n : (X!, Y!) , i = 1, 2, ….n, es entonces :

Y!= ∞ + βX! + ε! , i = 1, 2, …. N

Donde el termino error o residuo: ε! = Y! - μγ! Es una variable aleatoria.

SUPUESTOS

Los supuestos que se hacen sobre la variable aleatoria error ε del modelo de regresión lineal son los supuestos del modelo de regresión lineal simple. Estos supuestos son:

1. Independencia

Se supone que las variables aleatorias Y! son independientes. Por lo tanto, se supone que los errores ε! son variables aleatorias estadísticas independientes.

2. Linealidad

Se supone que cada media μγ! de Y! esta línea recta : μγ = ∞ + βX. Esto es equivalente a suponer que la media de la distribución de probabilidades de ε! es cero en cada X! (o E(ε!)= 0). Esto describe el supuesto : E (ε)=0) del modelo estadístico general.

6

Page 7: Regresion Final

3. Igualdad de Varianza

Se supone que las varianzas δ2y! de Y! en cada X! son iguales a la

varianza común δ2, denominada varianza de regresión. Esto es equivalente a suponer que la varianza de la distribución de probabilidades de ε! es δ2

en cada X! esto describe el supuesto : Var (ε) = δ2 del modelo estadístico general.

4. Normalidad

Se supone que cada variable aleatoria Y! tiene distribución normal. Esto es equivalente a suponer que la distribución de probabilidades de ε! es normal.

ESTIMACIÓN DEL MODELO DE REGRESIÓN

La estimación del modelo de regresión (poblacional) μγ = ∞ + βX es la ecuación de regresión muestral (o de estimación o de predicción)

Ŷ = a + bX

Donde

Ŷ es una estimación de μγ (y de Y)

7

Page 8: Regresion Final

A y b son las estimaciones del modelo de regresión lineal simple, esto es, para obtener:

Ŷ = a + bX

DIAGRAMA DE DISPERSIÓN O NUBE DE PUNTOS

Una nube de puntos o diagrama de dispersión consiste en representar cada par de valores de las variables en un sistema de coordenadas cartesianas en el que los ejes X e Y representan las variables de la distribución bidimensional.

METODO DE LOS MÍNIMOS CUADRADOS

Mínimos cuadrados es una técnica de análisis numérico enmarcada dentro de la optimización matemática, en la que, dados un conjunto de pares ordenados: variable independiente, variable dependiente, y una familia de funciones, se intenta encontrar la función continua, dentro de dicha familia, que mejor se aproxime a los datos (un "mejor ajuste"), de acuerdo con el criterio de mínimo error cuadrático.

8

Page 9: Regresion Final

Es una técnica cuyo objetivo es derivar una curva que minimice la discrepancia entre los puntos y la curva. Algunas suposiciones estadísticas inherentes en los procedimientos por mínimos cuadrados lineales son:

1. Cada x tiene un valor fijo, no es aleatorio y es conocido sin error.

2. Los valores y son valores aleatorios independientes y todos tienen la misma varianza.

3. Los valores de y para una x dada deben ser normalmente distribuidos.

4. La regresión de y contra x no es la misma que la de x contra y.

Y = a + bx

Donde :

Y = variable dependiente

X = variable independiente

a = constante

b = pendiente

FORMULAS

∑ Y = an + b ∑ X

∑ XY = a∑ X + b ∑ X2

a = ∑ x 2 ∑ y - ∑x ∑xy

n∑x2 - ∑(x)2

9

Page 10: Regresion Final

b = n∑ xy - ∑x ∑xy

n∑x2 - ∑(x)2

a = ŷ – bx

donde :

ŷ = media de y

x = media de x

para sacar b

b = ∑ xy – n(x)(y)

∑x2 - n(x)2

Ejercicios

1. El gerente de personal de la empresa agroindustrial “selva estudia la relación entre la variable dependiente: Y = gastos y de la variable independiente X = salarios, de su personal obrero. Si una muestra aleatoria de 20 obreros revelo los siguientes datos en ingreso por semana :

Salarios Gastos25 18 21 2428 22 24 2735 29 3240 33 35 37

10

Page 11: Regresion Final

50 39 42 4670 50 54 5880 65 70 75

a) Analizar el diagrama de dispersiónb) Estimar el modelo de regresión utilizando el método de

minimos cuadradosc) ¿Cuánto será el monto de los gastos de un obrero que va a

ganar $90 la próxima semana?

SOLUCIÓN

a) El diagrama de dispersión de la muestra de ingresos (X) y gastos (Y) semanales es :

N Salarios (Y) Gastos (X) (X)2 (Y)2 XY1 25 18 625 324 4502 25 21 625 441 5253 25 24 625 576 6004 28 22 784 484 6165 28 24 784 576 6726 28 27 784 729 756 ∑XY = 444447 35 29 1225 841 1015 ∑(X)2 = 528778 35 32 1225 1024 1120 ∑(y)2 = 376099 40 33 1600 1089 1320

10 40 35 1600 1225 1400 MEDIA X = 47.4511 40 37 1600 1369 1480 MEDIA Y = 40.0512 50 39 2500 1521 1950

11

Page 12: Regresion Final

13 50 42 2500 1764 2100 N = 2014 50 46 2500 2116 230015 70 50 4900 2500 350016 70 54 4900 2916 378017 70 58 4900 3364 406018 80 65 6400 4225 520019 80 70 6400 4900 560020 80 75 6400 5625 6000

TOTAL 949 801 52877 37609 44444

b) El modelo estimado de la regresión lineal es:

N = 20 x = 7,45∑x = 949 y = 40.05∑y = 801 ∑x2= 52877∑y = 37609 ∑xy = 44444

B = 44444 – 20 *47.45 * 40.0552877 – 20 * (47.45)2

A= 40.05 – (0.82026)(47.45)

La pendiente b de la regresión es : 0.82026

La pendiente a de la regresión es : 1.129

c) Para un salario semanal de $90 se tiene un gasto estimado semanal de Y= 1.129 + 0.82 * 90 = 74.929

Ejercicio 2

Se pide hallar la regresión de los siguientes datos agrupados

N ingresos diarios (Y) edad(X) (X)2 (Y)2 XY

1 39 34 1521 1156 13262 34.9 33 1218.01 1089 1151.73 30 30 900 900 9004 32 29 1024 841 9285 32 30 1024 900 9606 30.5 34 930.25 1156 10377 36 35 1296 1225 12608 38 36 1444 1296 13689 20 20 400 400 400

12

Page 13: Regresion Final

10 14 15 196 225 21011 55 54 3025 2916 297012 36 35 1296 1225 126013 39 36 1521 1296 140414 21 20 441 400 42015 15 15 225 225 22516 58 57 3364 3249 330617 42 43 1764 1849 180618 43 46 1849 2116 197819 47 49 2209 2401 230320 45 36 2025 1296 162021 40 48 1600 2304 1920

TOTAL 747.4 735 29272.26 28465 28752.7

∑XY = 28752.7∑(X)2 = 29272.26∑(y)2 = 28465

MEDIA Y = 35.5904762MEDIA X = 35

N = 21

A= 0.45B = 0.9707

CONCLUSIÓN

El análisis de regresión consiste en emplear métodos que permitan determinar la mejor relación funcional entre dos o más variables o relacionadas, Es decir; no sólo se busca una función matemática que exprese de qué manera se relacionan, sino también con que precisión se puede predecir el valor de una de ellas si se conoce los valores de las variables asociadas.

13

Page 14: Regresion Final

BIBLIOGRAFÍA

1. http://fisica.udea.edu.co/~labgicm/Laboratorio%20Fisica%201_2011/2010_teoria%20de%20errores/Minimos_cuadrados_2010.pdf

2. http://es.wikipedia.org/wiki/M%C3%ADnimos_cuadrados

3. http://benasque.org/benasque/2005tae/2005tae-talks/232s5.pdf

4. http://tarwi.lamolina.edu.pe/~fmendiburu/index-filer/academic/Estadistica/parte6.pdf

5. Estadística aplicada 1ra edición; Manuel Córdova Zamora

14

Page 15: Regresion Final

6. http://www.disfrutalasmatematicas.com/datos/desviacion-estandar.html

15