Manual de Stata Básico

ECOTRAINING

MANUAL DE STATA BSICO

POR: Eco. DAVID JOEL ESPARTA POLANCO

Contenido

CAPTULO I. INTRODUCCIN AL STATA .............................................................................. 3

1. Entorno del Stata .................................................................................................................. 3

2. Estructura de un Do-file ...................................................................................................... 6

3. Cargar Bases de Datos ......................................................................................................... 8

3.1. Cargando una base de datos del Stata ....................................................................... 8

3.2. Creando manualmente una base de datos en Stata ................................................. 9

3.3. Convirtiendo bases de datos ....................................................................................... 9

4. Guardar una Bases de Datos ............................................................................................. 11

CAPTULO II. GESTIN DE BASE DE DATOS ....................................................................... 12

1. Inspeccin de la base de datos .......................................................................................... 12

2. Generacin y transformacin de variables ..................................................................... 14

3. Transformacin de bases de datos .................................................................................. 16

4. Fusin de bases de datos .................................................................................................. 18

CAPTULO III. GRFICOS EN STATA ...................................................................................... 21

1. Introduccin al Stata Graph .............................................................................................. 21

2. Tipos de grficos ................................................................................................................. 21

2.1. Histograma .................................................................................................................. 21

2.2. Dispersin de puntos (Scatter Plot) ......................................................................... 22

2.3. Mltiple dispersin de puntos ................................................................................. 23

2.4. Caja y bigote ................................................................................................................ 24

2.5. Pie ................................................................................................................................. 25

2.6. Barras............................................................................................................................ 26

CAPTULO IV. MODELO DE REGESIN LINEAL CLSICO (MRLC) ............................... 27

1. Especificacin y supuestos del MRLC ............................................................................. 27

2. Estimacin del MRL por el mtodo de Mnimos Cuadrados Ordinarios (MCO) ..... 28

CAPTULO I. INTRODUCCIN AL STATA

1. Entorno del Stata

Al momento de iniciar la sesin en STATA ya sea en cualquiera de su versin ms

actualizada (versin 11 a la versin 13), esta mostrar cuatro ventanas importantes:

En el transcurso de la capacitacin, aprenderemos a trabajar con otras ventanas que

contiene el Stata, como son:

Otras ventanas a tomar en consideracin son:

a. STATA Viewer: Podemos acceder a la informacin online y a las ayudas que nos

otorga el programa.

b. STATA Do-File Editor: Es una ventana que funciona como editor de texto para

poder guardar y ejecutar una lista de comandos programados.

c. STATA Data Editor: Nos permite digitar y modificar los datos de la misma forma

que una hoja de Excel.

d. STATA Browser: Accedemos a la ventana de datos sin poder modificar su

contenido.

e. STATA Graphs: Nos muestra una ventana con el grfico que hemos ejecutado.

Uno de los archivos principales para comenzar a usar el Stata es el archivo de

programacin Do-file editor, para acceder a este editor podemos hacer clic en la barra de

herramientas el cono o escribir en la ventana de lnea de comandos lo siguiente:

A continuacin, nos aparecer una ventana de editor en blanco, donde podemos elaborar

nuestro primer archivo do-file.

Estos archivos son muy importantes por los siguientes motivos:

a. Permite registrar una de serie de comandos, la cual representa todo el

procedimiento de nuestro trabajo.

b. Permite ir corrigiendo posibles errores que se pueden generar en la elaboracin y

ejecucin de nuestro trabajo.

c. Permite replicar los procedimientos en sesiones posteriores sin necesidad de

crearlo nuevamente.

d. Adems, sirve como un mecanismo de seguridad que permite regresar a la base de

datos original despus de haberle hecho diversas transformaciones.

Una de las primeras cosas que debemos aprender para elaborar un do-file es escribir

comentarios, para ello existen diversas maneras:

a. Una simple lnea de comentario empieza con un asterisco (*); donde STATA

ignorar tales lneas.

b. Para colocar un comentario en la misma lnea donde fue escrito el comando

utilizamos dos slash (//).

c. Para lneas con mltiples comentarios, colocamos el texto entre los smbolos (/*) al

inicio y (*/) al final.

d. En el caso de que se haga uso de un comando la cual presenta una expresin muy

larga podemos utilizar triple slash (///) en medio de la expresin y as continuar

en la siguiente lnea la parte faltante. STATA entender como si fuera una nica

lnea de comando.

e. Por ltimo, tambin se utilizan los smbolos de comentarios con fines decorativos.

Por ejemplo, podemos comenzar escribiendo en nuestro do-file lo siguiente

2. Estructura de un Do-file

Generalmente, al momento de comenzar a programar en un do-file del Stata, es

recomendable mantener el siguiente esquema de trabajo:

Siguiendo esta estructura del do-file, procedemos como primer paso a construir una

plantilla de trabajo.

El primer comando que utilizaremos en esta plantilla de trabajo es limpiar informacin

que podra estar utilizndose (como bases de datos, etiqueta, matrices, escalares, etc.) que

se haya trabajado previamente con el comando clear.

Con respecto a las formas de poder ejecutar los comandos, se puede hacer a travs del

icono (execute do) ubicado en la parte superior derecha de la barra de herramientas

del archivo Do-file o presionando los teclados Ctrl+D una vez que sombremos el

comando queramos correr.

Una vez realizada esta accin, se reflejar los resultados en la ventana Result View del

Stata.

Luego, se debe cambiar la ruta o directorio de trabajo, ya que cuando se inicia una sesin

en Stata, por defecto se trabaja en la carpeta en donde se encuentra instalado el software.

Para saber cul es la ruta de trabajo activa se puede ver la parte inferior izquierda del

entorno del STATA.

Dentro de nuestra carpeta de trabajo Clase 1 existe una carpeta denominada Bases en

el cual trabajaremos esta primera sesin. Para acceder a la nueva ruta de trabajo nos

ubicamos en la carpeta Bases y copiamos la ruta que se encuentra en la parte superior de

la ventana:

Ahora, utilizamos el comando cd para cambiarnos al nuevo directorio creado, indicando la

nueva ruta entre comillas.

3. Cargar Bases de Datos

Existen diferentes de poder emplear una bases de datos en Stata y en la presente seccin

explicaremos cada una de estas formas.

3.1. Cargando una base de datos del Stata

STATA cuenta con bases de datos dentro de su sistema como ejemplos aplicativos, para

cargarlos se utiliza el comando sysuse. Un ejemplo, es cargar la base de datos auto.dta,

donde cabe resaltar que todas las bases de datos en formato del Stata se guardan con la

versin .dta.

En la parte inferior izquierda del entorno del STATA se apreciar las variables que

contiene la base de datos auto.dta.

3.2. Creando manualmente una base de datos en Stata

La manera de editar manualmente una base de datos a travs del dofile es a travs del

comando input.

Para realizar esta accin, hay que limpiar la base de datos utilizada en la anterior seccin

de la siguiente manera. Luego, usamos el comando input, seguido del nombre de las

variables y a partir de la siguiente lnea de comando se comienza a digitar los datos,

finalmente se debe terminar con la palabra end.

3.3. Convirtiendo bases de datos

STATA cuenta con una herramienta que permite convertir base de datos de SPSS, Matlab,

Gauss, SAS, Excel, etc. al formato *.dta a travs del software STAT/TRANSFER.

Para acceder a este software basta con hacerle clic y posteriormente nos saldr una

ventana de dialogo solicitndonos la siguiente informacin:

Input File Type: Indicamos el tipo de archivo en la cual se encuentra nuestra base

de datos original.

File Specification: Indicamos la ruta donde se encuentra nuestra base de datos

original haciendo uso del botn Browse.

Output File Type: Indicamos el tipo de archivo al cual deseamos que la base de

datos se convierta.

File Specification: Indicamos la ruta donde queremos colocar la base de datos

convertida haciendo uso del botn Browse.

Para nuestro caso ilustrativo, contamos con la base de datos de la Encuesta de Hogares

(ENAHO) en formato de SPSS llamada Enaho01-2014-100.savque se encuentra en nuestra

carpeta de trabajo, el cual queremos convertirlo a un archivo de base de datos del STATA

con el mismo nombre y que se guarde en la misma carpeta de trabajo.

Para desarrollar esta aplicacin realizamos los siguientes pasos:

a. Abrimos la ventana de dilogo del STAT/TRANSFER.

b. En la seccin Input File Type hacemos clic a la barra desplegable y elegimos el

formato SPSS Data File ya que se debe un archivo de base de datos del SPSS.

c. En la seccin File Specification hacemos clic en el botn Browse para definir la

ruta donde se encuentra nuestra base original.

d. En la seccin Output File Type hacemos clic a la barra desplegable y elegimos el

formato Stata Version 4-5 la cual es el formato de la base de datos que queremos

obtener.

e. En la seccin File Specification hacemos clic en el botn Browse para definir la

ruta donde queremos que se guarde nuestra base convertida. Aunque por defecto

se ubica en la misma carpeta donde se ubica la base de datos convertida.

4. Guardar una Bases de Datos

Parta guardar una base de datos que fue modificada se puede hacer usando con el

comando save. No obstante, para las versin actuales de Stata 12 y 13 se sugiere usar el

comando soveold, para que las bases de datos pueda ser reconocido por versiones del

Stata anteriores a los mencionados.

Como se puede ver en la lnea de sintaxis, despus de la coma ( , ) viene las opciones del

comando, en este caso es replace lo que significa que si se vuelve a ejecutar esta sintaxis el

Stata guardar la base de datos nuevamente de la que ya existe.

CAPTULO II. GESTIN DE BASE DE DATOS

1. Inspeccin de la base de datos

En esta seccin aprenderemos comandos que nos permitan dar una revisada a la base de

datos, es decir, saber con qu esquema de datos y tipos de variables estamos trabajando.

Para ello, vamos a trabajar con una Encuesta de Hogares (ENAHO) del ao 2013, el

mdulo de esta encuesta ser las Caractersticas de las viviendas encuestadas.

Previamente establecemos nuestra ruta de trabajo y luego cargamos la base de datos con el

comando use.

Usualmente despus de abrir una base de datos, recurrimos a la siguiente rutina de

inspeccin de una base de datos:

Observar la base de a travs del comando browse, el cual nos permite ver la base de

datos sin poder modificarla. En cambio, existe otro comando denominado edit que

nos permite ver la base de datos pudiendo modificarlo.

Descripcin de la base de datos con el comando describe.

Generando un diccionario de variables con el comando codebook.

Realizar un cuadro estadstico resumen de diferentes variables numricas con el

comando summarize.

2. Generacin y transformacin de variables

Una primera forma de generar variables es utilizando el comando generate, que

usualmente trabaja conjuntamente con el comando replace. Este comando nos permite

generar variables haciendo uso de expresiones matemticas, lgicas, numricas.

Si bien es cierto que STATA solamente reconoce los comandos con letras minsculas,

tambin es importante decir que hace diferenciacin de los nombres de las variables entre

si son minsculas o maysculas.

Por ejemplo, a partir de la base de datos se quiere saber el nmero de hogares que tienen

internet, esta informacin se encuentra en la pregunta p1141. Para ello, creamos una

variable dictoma denominada internet donde toma el valor de 0 si el hogar no tiene

internet y 1 cuando si tiene internet.

A esta nueva variable se puede introducir etiquetas para una mejor descripcin. Si

queremos colocar una etiqueta al nombre de la variable utilizamos el comando label

variable, y si se quiere etiquetar los valores de la variable primero se debe definir una

etiqueta con label define y luego se utiliza el comando label value para utilizar la etiqueta

creada en los valores de la variable, tal y como se muestra a continuacin:

Una vez creada la variable internet se puede hacer una tabla simple de frecuencia con el

comando tabulate para saber cuntos hogares tienen internet. En este caso, de un total de

39 767 hogares entrevistadas, el 15,84% tienen internet.

Otra forma de generar variables es empleando en comando egen. Este comando es una

extensin del anterior, que permite utilizar expresiones que incluyan funciones ms

complejas del STATA, como es el caso de: medias, mximos, mnimos, desviacin

estndar, promedios mviles, variables estandarizadas, etc.

A manera de ejemplo se puede calcular una variable que capture el valor promedio,

mximo y mnimo del pago de alquiler de una vivienda (p106).

Tambin se puede generar variables a partir de la recodificacin de otras variables con el

comando recode, el cual permite modificar los valores especficos de una variable. A

manera de ejemplo se puede crear una variable de regiones naturales del pas (costa, sierra

y selva) a partir del dominio geogrfico (dominio). Para ello se suele recomendar realizar

una revisin de las etiquetas de la variable a recodificar con el comando label list.

A partir de las etiquetas de los valores se comienza a clasificar y agrupar con el fin de

luego formas los grupos de recodificacin de la siguiente manera:

3. Transformacin de bases de datos

Hay ocasiones en que la base de datos puede requerirse para colapsarlo de tal forma que

cada grupo de individuos est representada por una observacin en particular, ya sea por

el promedio, la mediana, desviacin estndar, mximo, mnimo, la suma, etc., de alguna

variable en particular. Para hacer esta operacin recurrimos al comando collapse.

A manera de ilustracin cargamos una nueva base de datos denominada kids.dta que

tiene informacin de nios correspondiente a un cdigo de familia que pertenece, su

nombre, orden de nacimiento, endad, peso y sexo.

A partir de esta pequea base se requiere tener informacin a nivel de familia, donde se

registre el promedio de aos de edad de los nios, el peso mximo, y el nmero de nios

hombres. As, que la lnea de sintaxis sera el siguiente:

Por otro lado, cuando se trabaje con bases de datos de forma panel (un grupo de

individuos que se recogen informacin en un periodo de tiempo), esta puede tener dos

formas: larga y ancha. El comando reshape nos permite transponer una base de datos

panel de forma larga (long) a una de forma ancha (wide) y viceversa. Como se muestra a

continuacin:

Por ejemplo, cargamos otra base de datos llamada ingfam.dta, que contiene informacin

sobre el ingreso de 3 individuos en tres aos (1996, 1997 y 1998).

Como se observar, esta base tiene formato wide, y lo que se quiere en transponerlo a

formato long. Para ello, hay que identificar bien dos cosas: la parte del nombre de la

variable que se repite y que a su vez sirve como una semilla (ingfam), y la variable que

identifique al individuo que se colocar en la opcin i(codfam), por ltimo se coloca un

nuevo nombre a la variable temporal j(tiempo).

Si se quiere volver al formato anterior, es decir, de long a wide, se debe ejecutar lo

siguiente:

4. Fusin de bases de datos

Es comn la combinacin de varias bases de datos. Se va a mostrar dos operaciones

bsicas: aadir observaciones y aadir variables.

En el primer caso, se utiliza el comando append para fusionar bases de datos de manera

vertical. Aqu ser necesario una base activa o cargada (base master) y una inactiva que se

va a aadir a la base master (base using), adems la base originada tendrs una forma long.

Para ello, abrimos una nueva base de datos denominada base1.dta el cual estar activa y

ser nuestra base master. Adems, en nuestra carpeta de trabajo existe otra base llamada

base2.dtael cual estar inactiva (base using) y ser aadida a la primera base. Ambas

bases de datos contiene informacin de las notas de alumnos (en la primera base existe 3

alumnos y en la segunda existen 4 alumnos) en los cursos de micro, macro y economa,

adems de su sexo el turno horario.

Para fusionar ambas bases de datos e utiliza la siguiente lnea de sintaxis:

En el segundo tipo de fusin para aadir variables, se utiliza el merge para fusionar bases

de datos de manera vertical. De la misma manera que en el primer caso, tambin existir

una base master y una base using.

Para este ejemplo, se usaran dos bases de datos que ya fueron fusionados de manera

vertical base12.dta y base34.dta, el primero ser la base using y la segunda la base

master. Ambas bases contienen informacin de alumnos, por lo cual ser un fusin de

individuo contra individuo (1:1).

Como se puede observar en la fusin, automticamente se crea una variable denominada

_merge el cual toma valores dependiendo si el registro de los datos est presente en una

de las bases o en ambos. Cuando el valor de la variable _merge es 1 quiere decir que el

dato solo aparece en la base master, 2 cuando aparece en la base using y 3 cuando aparece

en ambos. Usualmente, despus de cada fusin se suele eliminar esta variable con el

comando drop.

CAPTULO III. GRFICOS EN STATA

1. Introduccin al Stata Graph

Stata presenta una amplia variedad de grficos, la cual abarca figuras como: matrices de

ploteos, histogramas, reas, lneas, caja y bigote, etc. Comenzaremos demostrando siete

tipos de grficos:

histogram: Histogramas

graph twoway: Scatterplot, lneas, y otros entre dos variables.

graph matrix: Matrices de Scatterplots.

graph box: Grficas de caja y bigotes.

graph bar: Grficas de barras

graph pie: Grficas de pastel o pie.

Para cada uno de estos grficos existen muchas opciones1.

2. Tipos de grficos

Los comandos del Stata Graph empiezan con la palabra graph (aunque en algunos casos

esto es opcional) seguido por la palabra que indica el tipo de grfico.

A continuacin describiremos los diferentes tipos de grficos que se puede elaborar en el

ambiente del Stata.

2.1. Histograma

La funcin de densidad de una variable puede ser estimada usando un histograma a

travs del comando histogram. Para ilustrar este comando, utilizaremos la base de la

Encuesta Permanente de Empleo (EPE) correspondiente al trimestre mvil Enero-Febrero-

Marzo del ao 2014, la cual contiene informacin referente a la situacin de empleo que

tiene un individuo en el mercado laboral.

En esta base se tiene informacin de los ingresos laborales totales de los trabajadores al

mes (ingtot), el cual se quiere obtener su grfico de frecuencias del logaritmo natural de

1 Para observa otras tipos de grficos y comandos relacionados a estos, se recomienda escribir en la venta de comandos help graph other.

estos ingresos con el fin de reducir la varianza. Adems, comparamos con la distribucin

para observar si se guardan caractersticas similares, tal y como se muestra a

continuacin:

2.2. Dispersin de puntos (Scatter Plot)

Los diagramas de dispersin de puntos (scatter plot) se accede a travs del comando graph

twoway scatter. Por ejemplo, queremos ver la relacin que guardan el ingreso laboral total

(en logaritmos) con la edad (p108).

0.2

.4.6

.8

Den

sity

2 4 6 8 10lningtot

24

68

10

lnin

gto

t

0 20 40 60 80 100edad ( en aos )

No obstante, se puede ajustar un lnea recta (lfit) a este grfico, y al mismo tiempo ajustar

por una relacin cuadrtica (qfit), para ver si existe rendimientos decrecientes en los

ingresos laborales.

2.3. Mltiple dispersin de puntos

El comando graph matrix nos muestra un til anlisis multivariado. Este comando otorga

una grfica compacta de la relacin entre un nmero de variables por pareja,

permitindole al analista observar los signos de no linealidad, outliers o cluester que

puedan afectar al modelamiento estadstico. Este tipo de grfico tambin es til si se

quiere observar la influencia de una lista de variables explicativas a una variable

dependiente.

Por ejemplo, si se quiere ver grficamente la relacin de un conjunto de factores que

pueden influir en los ingresos laborales de la persona, como es el caso de la edad (p108),

las horas de trabajo (p209t) y el nivel educativo (p109b), se puede ealizar de la siguiente

manera:

24

68

10

0 20 40 60 80 100edad ( en aos )

lningtot Fitted values

Fitted values

2.4. Caja y bigote

La grfica de caja y bigote brinda informacin acerca del centro, amplitud, simetra y

outliers con solo un vistazo. Para obtener este grfico, se debe empelar el comando graph

box.

Si seguimos analizando la distribucin de los ingresos laborales con un grfico de caja y

bigotes se programara la siguiente lnea de comando.

lningtot

edad (en aos

)

total dehoras

trabajadas

aos deestudios

0

5

10

0 5 10

0

50

100

0 50 100

0

50

100

0 50 100

0

5

10

0 5 10

24

68

10

lnin

gto

t

Si se quiere el mismo grfico pero de manera horizontal, se debera usar el comando graph

hbox.

2.5. Pie

Este estilo es muy popular en las presentaciones de grficas, siempre y cuando tengan

pocos valores para trabajar. El comando bsico del grfico de pastel es graph pie.

Si se quiere saber la distribucin de las personas por nivel educativo (p109a) que fue

recodificada a una menor cantidad de niveles (sin nivel, primaria, secundaria, superior)

que lleva como nuevo nombre niveduc, se puede obtener utilizando el comando

mencionado con la opcin over() para que los pedazos del pie lo conformen los cuatro

niveles educativos:

2 4 6 8 10lningtot

2.6. Barras

El grfico de barras provee una simple y verstil exhibicin conjunto de resmenes

estadsticos como media, mediana, suma o conteo. Para obtener barras verticales se debe

utilizar el comando graph bar.

Por ejemplo, si se desea comparar en un grfico de barras el valor de la media y la

mediana del ingreso laboral, se debera especificar los estadsticos a utilizar, en este caso

(mean) y (median). Adems, si se quiere mostrar los valores de estos estadsticos se debe

colocar la opcin blabel(bar).

S que quiere las barras de manera horizontal basta con usar el comando graph hbar.

Sin nivel Primaria

Secundaria Superior

1440.19

1083

0

500

1,0

00

1,5

00

mean of ingtot p 50 of ingtot

CAPTULO IV. MODELO DE REGESIN LINEAL CLSICO (MRLC)

1. Especificacin y supuestos del MRLC

En los modelos de regresin lineal se requiere explicar el comportamiento de una variable

(dependiente ) a partir de otras (regresoras o explicativas ). Utilizamos el concepto de

distribucin de probabilidad condicionada, pues se busca conocer los estimadores de los

parmetros de regresin con la finalidad de estimar finalmente el ( | = ), es decir

buscamos conocer el valor esperado de Y, dado que = (la variable regresora toma un

determinado valor ).

= 0 + 1 +

La variable es la variable dependiente, las variables son las variables explicativas o

regresoras, y es la perturbacin aleatoria o comnmente llamado trmino de error. Los

son los parmetros asociados a cada una de las variables explicativas, tambin llamados

coeficientes de regresin y miden el impacto de cada variable independiente en relacin al

comportamiento de la variable endgena.

Los parmetros son no conocidos. Sin embargo, utilizando informacin muestral se

pueden obtener estimadores de los parmetros (o coeficientes).

Dado la expresin anterior, se considera que se cumplen las siguientes hiptesis clsicas

bsicas:

Linealidad en los parmetros.

No singularidad o multicolinealidad. No existen relaciones lineales entre las

variables explicativas o regresores y estos no son variables aleatorias.

Exogeneidad estricta o no endogeneidad. La esperanza del vector de la variable

aleatoria es cero: () = 0.

Errores esfricos. La matriz de varianzas y covarianzas del vector de variables

aleatorias es: () = 2. Es decir, todos los componentes del vector tienen

varianza idntica (homoscedasticidad), y adems las covarianzas son 0, es decir, los

elementos del vector no estn correlacionados (no autocorrelacin).

Normalidad de los errores. La distribucin de probabilidad del vector de

perturbaciones aleatorias es: ~(0, 2), es decir, es un vector normal esfrico.

Por tanto, las perturbaciones son variables aleatorias independientes e igualmente

distribuidas, normales con media cero y varianza 2. Dado que no es aleatoria,

la distribucin de probabilidad del vector se deriva a partir del vector de

perturbaciones ~(, 2).

2. Estimacin del MRL por el mtodo de Mnimos Cuadrados Ordinarios (MCO)

El mtodo de Mnimos Cuadrados Ordinarios (MCO) permite encontrar los parmetros

desconocidos del modelo, cuyo criterio es minimizar los errores al cuadrado del MRLC.

A partir de este criterio, se puede estimar el valor de los parmetros de la siguiente

manera:

= ()1

Y a su vez la matriz de varianza y covarianza, que servir para calcular los errores

estndar de los estimadores, se obtiene de la siguiente relacin:

() = 2()1

Donde el parmetro 2 se puede estimar de la siguiente manera:

2 =

=

( )( )

Siendo n el tamao de la muestra y k el nmero de parmetros.

A manera de un ejercicio aplicativo, se emplea la base del sistema del Stata auto.dta. En

esta ocasin se desea explicar el precio del auto (price) en funcin de los millages por

galn (mpg), su peso (weight) y su procedencia (foreign). Es decir:

= 0 + 1 + 2 + 3 +

El comando en Stata para estimar un MORLC por la tcnica de MCO es regress, tal y como

se muestra a continuacin:

Los resultados ms importantes de esta regresin se detallan en el cuadro de la parte

inferior, donde en la segunda columna se encuentra los coeficientes o parmetros

estimados asociado a cada variable explicativa. Y en la columna de a lado, se presenta los

errores estndar de estos estimadores el cual servirn como insumo para calcular el

estadstico t-student, y este ltimo a su vez servir para calcular la probabilidad

acumulada.

Tanto el estadstico t-student y la probabilidad son importantes para realizar las pruebas

de significancia individual, para saber si las regresoras obtenidos influyen

significativamente o no sobre la variable dependiente. Por tanto, la hiptesis para evaluar

esta significancia individual es el siguiente:

Ho : = 0 (hiptesis nula)

Ha : 0 (hiptesis alternativa)

La regla de decisin es la siguiente:

Se acepta Ho si: t-calculado < 1.96. Si p-value > 0.05.

Se rechaza Ho si: t-calculado > 1.96. Si p-value < 0.05.

En el caso del ejemplo, se puede apreciar que para la variable mpg tiene un valor de t-

calculado igual a 0.29, menor a 1.96, por lo cual se rechaza la hiptesis nula de

significancia individual. La misma conclusin se obtendra por el lado de la probabilidad

ya que esta es 0.769 mayor al umbral de 0.05.

En cuanto a la significancia conjunta del modelo, es decir, si las regresoras en conjunto

explican el comportamiento de la variable dependiente, es necesario fijarnos el cuadro

superior de lado derecho donde se encuentra el estadstico de Fisher. Para ello hay que

observar el valor de la probabilidad Prob. > F y sigue la misma regla de la significancia

individual, es decir, si es mayor a 0.05 se acepta la hiptesis nula de no significancia

individual, caso contrario se rechaza esta hiptesis nula, lo cual indicar que las variables si

explican significativamente en su conjunto. Para el caso del ejemplo, esta probabilidad es

0.0 menor al 0.05, por lo cual se rechaza la hiptesis nula, lo que significa que son

estadsticamente significativos de manera global.

Otro resultado importante es la bondad de ajuste del modelo que se mide por el

Coeficiente de Determinacin, o tambin llamado R-squared (R2). El valor de este

estadstico es 0.4996 que es igual a decir 49.96%, lo que significa que el 49.96% de la

variabilidad o varianza de Price est siendo explicada por la varianza de las variables

explicativas. Se espera que mientras ms cercano a la unidad este estadstico es mejor el

modelo.

Manual de Stata Básico

Documents