“SOFTWARE ESTADÍSTICO PARA REGRESIÓN. El caso de regresión Logística y Poisson” Escuela Superior Politécnica del Litoral “Impulsando la sociedad del conocimiento” 1 Instituto de Ciencias Matemáticas Guayaquil, Jueves 23 de Febrero 2012 Presentado por: Andrea Elizabeth Fuentes Puglla Raúl Alejandro Pinos Loayza Nathaly Rivera Flores
22
Embed
“SOFTWARE ESTADÍSTICO PARA REGRESIÓN. El caso de regresión Logística y Poisson”
Instituto de Ciencias Matemáticas. Escuela Superior Politécnica del Litoral “Impulsando la sociedad del conocimiento”. “SOFTWARE ESTADÍSTICO PARA REGRESIÓN. El caso de regresión Logística y Poisson”. Presentado por: Andrea Elizabeth Fuentes Puglla Raúl Alejandro Pinos Loayza - PowerPoint PPT Presentation
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
“SOFTWARE ESTADÍSTICO PARA REGRESIÓN.
El caso de regresión Logística y Poisson”
Escuela Superior Politécnica del Litoral“Impulsando la sociedad del conocimiento”
1
Instituto de Ciencias Matemáticas
Guayaquil, Jueves 23 de Febrero 2012
Presentado por:Andrea Elizabeth Fuentes PugllaRaúl Alejandro Pinos LoayzaNathaly Rivera Flores
2
Introducción
Regresión Lineal
Supuestos:
Se concluye:
Andrea Fuentes PugllaRaúl Pinos LoayzaNathaly Rivera
Andrea Fuentes Puglla Raúl Pinos Loayza Nathaly Rivera
Guayaquil, Jueves 23 de Febrero 2012
4
Modelo Lineal Generalizado
Cuando la ,se recurre al Modelo Lineal Generalizado.
Es una generalización de la Regresión Lineal para poder responder a otros tipos de modelos además de los lineales siempre y cuando la variable a ser explicada forme parte de las familias exponenciales.
Andrea Fuentes Puglla Raúl Pinos Loayza Nathaly Rivera
Guayaquil, Jueves 23 de Febrero 2012
2 No es
constante
1 2,..., 1, PX X X Yi
enlace
5
FAMILIAS EXPONENCIALES
Andrea Fuentes Puglla Raúl Pinos Loayza Nathaly Rivera
Guayaquil, Jueves 23 de Febrero 2012
6
Familias Exponenciales
Es una clase de distribuciones de probabilidad cuya formulación matemática comparten cierta forma:
Andrea Fuentes Puglla Raúl Pinos Loayza Nathaly Rivera
𝒇ሺ𝒙;𝜽ሻ= ℎሺ𝑥ሻ𝑔ሺ𝜃ሻ𝑒[𝜂ሺ𝜃ሻ𝑇(𝑥)]
Guayaquil, Jueves 23 de Febrero 2012
7
Familias Exponenciales
Andrea Fuentes Puglla Raúl Pinos Loayza Nathaly Rivera
Distribución Binomial
Como miembro de la familia exponencial consideremos la variable aleatoria
Andrea Fuentes Puglla Raúl Pinos Loayza Nathaly Rivera
Guayaquil, Jueves 23 de Febrero 2012
10
Regresión Logística
Andrea Fuentes PugllaRaúl Pinos Loayza Nathaly Rivera
Regresión Logística permite estimar la relación entre una variable de respuesta binomial (dependiente) y un conjunto de variables independientes (explicativas)ΕሾYiǀX= xiሿ= 𝒙𝑖′𝜷+ 𝜀𝑖 ;𝑌= 0,1 ,ሺ𝒙𝑖′𝜷ሻ= 𝛽0 + 𝛽1𝑥1 + ⋯+ 𝛽𝑝−1𝑥𝑝−1
𝜋ሺ𝒙𝑖ሻ= 𝑃ሺ𝑌= 1ǀ𝑥𝑖ሻ= 𝒙𝑖′𝜷
Guayaquil, Jueves 23 de Febrero 2012
11
Función de respuesta E[Y]
Andrea Fuentes Puglla Raúl Pinos Loayza Nathaly Rivera
La Función de Respuesta E[Y] no es rectilínea cuando la variable a ser explicada es indicadora, si no mas bien sigmoidal, esto hace que se pueda utilizar la Distribución Logística que convierta a la Función de Respuesta E[Y] por lo que utilizaremos la función de enlace de la distribución de Bernoulli, por lo que se obtiene::
Dándose origen de esta forma a la denominada Regresión Logística.
Guayaquil, Jueves 23 de Febrero 2012
12
Estimación de Parámetros
Andrea Fuentes PugllaRaúl Pinos Loayza Nathaly Rivera
. Se recurre al cálculo de la función de verosimilitud.
Por lo que se cumple:
Guayaquil, Jueves 23 de Febrero 2012
∂lnL∂β0 = ∂lnL∂β1 = . . . .= ∂lnL∂βp−1 = 0
Se obtiene:∂lnL∂β = σ (𝑦𝑖 − 𝑛𝑖𝜋𝑖)𝑛𝑖=1 𝑥𝑖
13
Viene… Estimación de Parámetros
Andrea Fuentes Puglla Raúl Pinos Loayza Nathaly Rivera
Como resultado de la primera y segunda derivada de la función de verosimilitud se obtiene las siguientes ecuaciones:
Andrea Fuentes PugllaRaúl Pinos Loayza Nathaly Rivera
Guayaquil, Jueves 23 de Febrero 2012
15
Regresión Poisson
Andrea Fuentes Puglla Raúl Pinos Loayza Nathaly Rivera
Es una técnica estadística en lo que se utiliza un modelo no lineal que pertenece a la categoría del análisis de datos de recuento. En estos casos, la variable dependiente toma más de dos valores discretos: 0, 1 , 2 , 3, . . .
La variable aleatoria sigue una distribución de Poisson, con parámetro que estárelacionada con las variables de explicación X.
Andrea Fuentes Puglla Raúl Pinos Loayza Nathaly Rivera
Dado que la Función de Respuesta E[Y] toma valores discretos, se utiliza la función de enlace, obtenida de la Distribución de Poisson:, el cual es:
Guayaquil, Jueves 23 de Febrero 2012
𝐸ሾ𝑌ሿ= ℯ(𝛽0+𝛽1𝑥1+⋯+𝛽𝑝−1𝑥𝑝−1) Dándose origen de esta forma a la denominada Regresión Poisson.
17
Estimación de Parámetros
Andrea Fuentes Puglla Raúl Pinos Loayza Nathaly Rivera
. Se recurre al cálculo de la función de verosimilitud.
Por lo que se cumple:
Guayaquil, Jueves 23 de Febrero 2012
∂lnL∂β0 = ∂lnL∂β1 = . . . .= ∂lnL∂βp−1 = 0
Se obtiene: ∂lnL∂β = σ (𝑦𝑖 − 𝜋𝑖)𝑛𝑖=1 𝑥𝑖
𝑙𝑛 𝐿= ሾ𝑦𝑖 ln𝜋𝑖ሿ𝑛
𝑖=1 − ሾ𝜋𝑖ሿ𝑛
𝑖=1
18
Método de Newton Rapshon
Guayaquil, Jueves 23 de Febrero 2012
Andrea Fuentes Puglla Raúl Pinos Loayza Nathaly Rivera
19
Método de Newton Rapshon
Andrea Fuentes Puglla Raúl Pinos Loayza Nathaly Rivera
Guayaquil, Jueves 23 de Febrero 2012
20Guayaquil, Jueves 23 de Febrero 2012
Andrea Fuentes Puglla Raúl Pinos Loayza Nathaly Rivera
Método de Newton RapshonPara evitar la existencia de falsas raices, se incluye en el algoritmo la segunda derivada de la funcion.
21
PROGRAMACION DE R. LOGISTICA
Guayaquil, Jueves 23 de Febrero 2012
Andrea Fuentes Puglla Raúl Pinos Loayza Nathaly Rivera
function R1 = reglogcontr(y,x,b0)[n,ppp]=size(x);beta=b0;dife=1;pp=zeros(1,n);w=zeros(n);x=[ones(n,1),x];whiledife>0.0001 bini=beta; for i=1:n suma=x(i,:)*beta; pp(i)=1/(1+exp(-suma)); end p=pp'; for i=1:n w(i,i)=p(i)*(1-p(i)); end beta=bini+(inv(x'*w*x))*x'*(y-p); dife=sum(abs(beta-bini));endSb=inv(x'*w*x);R1=zeros(ppp,4);for i=1:ppp+1 R1(i,1)=beta(i); R1(i,2)=sqrt(Sb(i,i)); R1(i,3)=R1(i,1)/R1(i,2); R1(i,4)=abs(R1(i,3)); R1(i,4)=tcdf(R1(i,4),n-ppp); R1(i,4)=(1-R1(i,4))*2;End
Andrea Fuentes Puglla Raúl Pinos Loayza Nathaly Rivera 22