Universidad de San Andrés Econometría Profesores: Mariana Marchionni Walter Sosa Escudero Asistentes: María Edo Amely Gibbons
Universidad de San Andrés Econometría
Profesores: Mariana Marchionni
Walter Sosa Escudero
Asistentes: María Edo
Amely Gibbons
Introducción a Stata- regresiones
Introducción básica a econometría usando Stata.
Datos: J. Biddle and D. Hamermesh (1990), “Sleep and the allocation of time”, The Journal of Political Economy, Vol. 98, No.5, Part 1, pp. 922-943.
Objetivo del trabajo: modelar cómo afecta el mercado laboral las horas de sueño
Introducción a Stata- regresiones
PASO I: abrimos la base y exploramos las variables
cd "C:\Users\DE\Dropbox\Econometría 2014\x - Tutorial 2”
use sleep.dta, clear describe totwrk slpnaps male black yrsmarr
Introducción a Stata- regresiones
Paso II: estadísticos descriptivos básicos de las variables
sum slpnaps totwrk male black yrsmarr
tab male black, row nofreq
Supongan que quieren ver qué diferencia de minutos dormidos hay entre los que trabajan menos de 20 horas y el resto. ¿Cómo harían?
Introducción a Stata- regresiones
a) Generar una variable que distinga a la muestra entre los que trabajan menos de 20 horas y el resto: gen part_time=(totwrk<=1200)
b) Miramos cómo se distribuye la muestra de acuerdo a esta clasificación:tab part_time
c) Miramos la diferencia de minutos dormidos entre un grupo y el otro:table part_time, c(mean slpnaps)
Introducción a Stata- regresiones
Paso III: mirar correlación, covarianza y regresiones corr slpnaps totwrk [correlación entre las variables]
corr slpnaps totwrk, c [covarianza entre las variables]
regress slpnaps totwrk yrsmarr age educ male black
Introducción a Stata- regresionesSource SS (Sum of
Squares)Df (Degrees of
freedom)MS (Mean Squares)
Model SEC k-1 SEC/k-1
Residual SRC N-k SRC/N-k
Total STC=SEC+SRC N-1 STC/N-1
k: cantidad de variables n: cantidad de observaciones SEC: Suma Explicada de Cuadrados SRC: Suma de Residuos Cuadrados STC: Suma Total de Cuadrados
Interpretación Coeficiente: un aumento en un minuto trabajado, disminuye en 0.197 los minutos que se duermen.
¿En cuánto disminuyen los minutos de sueño si aumenta en una hora la cantidad de tiempo trabajado?
Test t: Ho: el coeficiente es igual a 0. Ha: el coeficiente es distinto de 0. ¿Qué concluimos si el valor obtenido de t es -9.85?
Introducción a Stata- regresiones
Introducción a Stata- regresiones predict yest (gen yest=cons+ *x) [se obtiene la
predicción lineal del modelo estimado (sólo después de ejecutar el comando regress).
predict resid, residual (gen resid=y-cons-*x) [genera una variable con los errores estimados (sólo después de ejecutar el comando regress)].
test totwrk[testea si los coeficientes son iguales a 0-> Ho: coeficiente=0]
test black=male [testea si los coeficientes son iguales]
Rechazo Ho con una significatividad del 1%
Rechazo Ho con una significatividad del 10%
Introducción a Stata- regresiones Después de correr una regresión, Stata guarda información de la misma. Los
siguientes son algunos de los comandos que guarda:
• Se pueden ver con el comando display
También guarda los coeficientes: • _b[_cons]: es el coeficiente de la constante.• _b[variable]: es el coeficiente de la variable.¿Cómo podemos obtener una variable idéntica a yest?
NOTA: Recuerden que todos estos comandos se refieren a la regresión ejecutada más recientemente.
e(N) Number of observations
e(mss) Sum of squares
e(r2) R-squared
e(r2_a) Adjusted R-squared
e(F) F statistic
Introducción a Stata- regresiones regress slpnaps totwrk yrsmarr age educ male black
findit outreg2• outreg2 from http://fmwww.bc.edu/RePEc/bocode/o
• click here to install
outreg2 using nombre_archivo, excel
outreg2 using nombre_archivo, word
Test de hipótesis - repaso El estimador de MC que obtenemos es una realización
de una variable aleatoria Queremos inferir, a partir de este , información acerca
del valor del verdadero parámetro .• Por ejemplo, ¿ ? Es decir, ¿ es relevante para explicar Y?
Para responder a preguntas como estas necesitamos
recurrir a los test de hipótesis. El test de hipótesis requiere conocer alguna información
sobre • i• ii. • iii. Distribución de
Esta información ya la tenemos:• (Obtenida utilizando los supuestos 1 y 4).• (Obtenida utilizando los supuestos 1, 2 y 4)• (Obtenida agregando el supuesto 5)
Calculamos:• El t observado (i.e. el valor de dados los datos
y la hipótesis nula)• El t crítico (dado el nivel de significatividad del
test y las hipótesis planteadas -> tabla)
Test de hipótesis - repaso
t crítico
z crítico
Test de hipótesis - repaso
Comparamos t crítico y t observado: • rechazamos la hipótesis nula en caso de que el valor absoluto
del t observado fuera mayor al t crítico.
En este caso, como la cantidad de observaciones es grande, el t crítico es igual al z crítico = 1.96 < |-9.85|
Rechazo H0, rechazo la hipótesis de que el coeficiente es igual a 0 al nivel de significatividad del 5%.
Podemos continuar testeando para distintos niveles de significatividad.
Test de hipótesis - repaso
P-valor ¿Cuál es la probabilidad de haber obtenido este resultado (-
0.197406 ) si la hipótesis nula es cierta (es decir, si en realidad )?
Esta probabilidad es el p-valor.
¿Es una “casualidad” haber obtenido el valor resultante?
¿Cómo se calcula el p-valor? Es el área debajo de la curva de la distribución de a partir del valor t observado.
Ejemplo:
P-valor:
P-valor
Nivel de significatividad
10% 5% 1%
Rechazamos Ho si p-valor<0.1 p-valor<0.05 p-valor<0.01
Nivel de significatividadUna vez obtenido el p-valor, necesitamos fijar un criterio para tomar decisiones acerca de si rechazar o no la hipótesis nula.