Top Banner

of 30

Manual de Stata Básico

Mar 09, 2016

Download

Documents

rockandroll12

manual de stata nivel basico
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
  • ECOTRAINING

    MANUAL DE STATA BSICO

    POR: Eco. DAVID JOEL ESPARTA POLANCO

  • Contenido

    CAPTULO I. INTRODUCCIN AL STATA .............................................................................. 3

    1. Entorno del Stata .................................................................................................................. 3

    2. Estructura de un Do-file ...................................................................................................... 6

    3. Cargar Bases de Datos ......................................................................................................... 8

    3.1. Cargando una base de datos del Stata ....................................................................... 8

    3.2. Creando manualmente una base de datos en Stata ................................................. 9

    3.3. Convirtiendo bases de datos ....................................................................................... 9

    4. Guardar una Bases de Datos ............................................................................................. 11

    CAPTULO II. GESTIN DE BASE DE DATOS ....................................................................... 12

    1. Inspeccin de la base de datos .......................................................................................... 12

    2. Generacin y transformacin de variables ..................................................................... 14

    3. Transformacin de bases de datos .................................................................................. 16

    4. Fusin de bases de datos .................................................................................................. 18

    CAPTULO III. GRFICOS EN STATA ...................................................................................... 21

    1. Introduccin al Stata Graph .............................................................................................. 21

    2. Tipos de grficos ................................................................................................................. 21

    2.1. Histograma .................................................................................................................. 21

    2.2. Dispersin de puntos (Scatter Plot) ......................................................................... 22

    2.3. Mltiple dispersin de puntos ................................................................................. 23

    2.4. Caja y bigote ................................................................................................................ 24

    2.5. Pie ................................................................................................................................. 25

    2.6. Barras............................................................................................................................ 26

    CAPTULO IV. MODELO DE REGESIN LINEAL CLSICO (MRLC) ............................... 27

    1. Especificacin y supuestos del MRLC ............................................................................. 27

    2. Estimacin del MRL por el mtodo de Mnimos Cuadrados Ordinarios (MCO) ..... 28

  • CAPTULO I. INTRODUCCIN AL STATA

    1. Entorno del Stata

    Al momento de iniciar la sesin en STATA ya sea en cualquiera de su versin ms

    actualizada (versin 11 a la versin 13), esta mostrar cuatro ventanas importantes:

    En el transcurso de la capacitacin, aprenderemos a trabajar con otras ventanas que

    contiene el Stata, como son:

    Otras ventanas a tomar en consideracin son:

    a. STATA Viewer: Podemos acceder a la informacin online y a las ayudas que nos

    otorga el programa.

    b. STATA Do-File Editor: Es una ventana que funciona como editor de texto para

    poder guardar y ejecutar una lista de comandos programados.

    c. STATA Data Editor: Nos permite digitar y modificar los datos de la misma forma

    que una hoja de Excel.

  • d. STATA Browser: Accedemos a la ventana de datos sin poder modificar su

    contenido.

    e. STATA Graphs: Nos muestra una ventana con el grfico que hemos ejecutado.

    Uno de los archivos principales para comenzar a usar el Stata es el archivo de

    programacin Do-file editor, para acceder a este editor podemos hacer clic en la barra de

    herramientas el cono o escribir en la ventana de lnea de comandos lo siguiente:

    A continuacin, nos aparecer una ventana de editor en blanco, donde podemos elaborar

    nuestro primer archivo do-file.

    Estos archivos son muy importantes por los siguientes motivos:

    a. Permite registrar una de serie de comandos, la cual representa todo el

    procedimiento de nuestro trabajo.

  • b. Permite ir corrigiendo posibles errores que se pueden generar en la elaboracin y

    ejecucin de nuestro trabajo.

    c. Permite replicar los procedimientos en sesiones posteriores sin necesidad de

    crearlo nuevamente.

    d. Adems, sirve como un mecanismo de seguridad que permite regresar a la base de

    datos original despus de haberle hecho diversas transformaciones.

    Una de las primeras cosas que debemos aprender para elaborar un do-file es escribir

    comentarios, para ello existen diversas maneras:

    a. Una simple lnea de comentario empieza con un asterisco (*); donde STATA

    ignorar tales lneas.

    b. Para colocar un comentario en la misma lnea donde fue escrito el comando

    utilizamos dos slash (//).

    c. Para lneas con mltiples comentarios, colocamos el texto entre los smbolos (/*) al

    inicio y (*/) al final.

    d. En el caso de que se haga uso de un comando la cual presenta una expresin muy

    larga podemos utilizar triple slash (///) en medio de la expresin y as continuar

    en la siguiente lnea la parte faltante. STATA entender como si fuera una nica

    lnea de comando.

    e. Por ltimo, tambin se utilizan los smbolos de comentarios con fines decorativos.

    Por ejemplo, podemos comenzar escribiendo en nuestro do-file lo siguiente

  • 2. Estructura de un Do-file

    Generalmente, al momento de comenzar a programar en un do-file del Stata, es

    recomendable mantener el siguiente esquema de trabajo:

    Siguiendo esta estructura del do-file, procedemos como primer paso a construir una

    plantilla de trabajo.

    El primer comando que utilizaremos en esta plantilla de trabajo es limpiar informacin

    que podra estar utilizndose (como bases de datos, etiqueta, matrices, escalares, etc.) que

    se haya trabajado previamente con el comando clear.

    Con respecto a las formas de poder ejecutar los comandos, se puede hacer a travs del

    icono (execute do) ubicado en la parte superior derecha de la barra de herramientas

    del archivo Do-file o presionando los teclados Ctrl+D una vez que sombremos el

    comando queramos correr.

  • Una vez realizada esta accin, se reflejar los resultados en la ventana Result View del

    Stata.

    Luego, se debe cambiar la ruta o directorio de trabajo, ya que cuando se inicia una sesin

    en Stata, por defecto se trabaja en la carpeta en donde se encuentra instalado el software.

    Para saber cul es la ruta de trabajo activa se puede ver la parte inferior izquierda del

    entorno del STATA.

    Dentro de nuestra carpeta de trabajo Clase 1 existe una carpeta denominada Bases en

    el cual trabajaremos esta primera sesin. Para acceder a la nueva ruta de trabajo nos

    ubicamos en la carpeta Bases y copiamos la ruta que se encuentra en la parte superior de

    la ventana:

  • Ahora, utilizamos el comando cd para cambiarnos al nuevo directorio creado, indicando la

    nueva ruta entre comillas.

    3. Cargar Bases de Datos

    Existen diferentes de poder emplear una bases de datos en Stata y en la presente seccin

    explicaremos cada una de estas formas.

    3.1. Cargando una base de datos del Stata

    STATA cuenta con bases de datos dentro de su sistema como ejemplos aplicativos, para

    cargarlos se utiliza el comando sysuse. Un ejemplo, es cargar la base de datos auto.dta,

    donde cabe resaltar que todas las bases de datos en formato del Stata se guardan con la

    versin .dta.

    En la parte inferior izquierda del entorno del STATA se apreciar las variables que

    contiene la base de datos auto.dta.

  • 3.2. Creando manualmente una base de datos en Stata

    La manera de editar manualmente una base de datos a travs del dofile es a travs del

    comando input.

    Para realizar esta accin, hay que limpiar la base de datos utilizada en la anterior seccin

    de la siguiente manera. Luego, usamos el comando input, seguido del nombre de las

    variables y a partir de la siguiente lnea de comando se comienza a digitar los datos,

    finalmente se debe terminar con la palabra end.

    3.3. Convirtiendo bases de datos

    STATA cuenta con una herramienta que permite convertir base de datos de SPSS, Matlab,

    Gauss, SAS, Excel, etc. al formato *.dta a travs del software STAT/TRANSFER.

    Para acceder a este software basta con hacerle clic y posteriormente nos saldr una

    ventana de dialogo solicitndonos la siguiente informacin:

    Input File Type: Indicamos el tipo de archivo en la cual se encuentra nuestra base

    de datos original.

    File Specification: Indicamos la ruta donde se encuentra nuestra base de datos

    original haciendo uso del botn Browse.

    Output File Type: Indicamos el tipo de archivo al cual deseamos que la base de

    datos se convierta.

    File Specification: Indicamos la ruta donde queremos colocar la base de datos

    convertida haciendo uso del botn Browse.

  • Para nuestro caso ilustrativo, contamos con la base de datos de la Encuesta de Hogares

    (ENAHO) en formato de SPSS llamada Enaho01-2014-100.savque se encuentra en nuestra

    carpeta de trabajo, el cual queremos convertirlo a un archivo de base de datos del STATA

    con el mismo nombre y que se guarde en la misma carpeta de trabajo.

    Para desarrollar esta aplicacin realizamos los siguientes pasos:

    a. Abrimos la ventana de dilogo del STAT/TRANSFER.

    b. En la seccin Input File Type hacemos clic a la barra desplegable y elegimos el

    formato SPSS Data File ya que se debe un archivo de base de datos del SPSS.

    c. En la seccin File Specification hacemos clic en el botn Browse para definir la

    ruta donde se encuentra nuestra base original.

    d. En la seccin Output File Type hacemos clic a la barra desplegable y elegimos el

    formato Stata Version 4-5 la cual es el formato de la base de datos que queremos

    obtener.

  • e. En la seccin File Specification hacemos clic en el botn Browse para definir la

    ruta donde queremos que se guarde nuestra base convertida. Aunque por defecto

    se ubica en la misma carpeta donde se ubica la base de datos convertida.

    4. Guardar una Bases de Datos

    Parta guardar una base de datos que fue modificada se puede hacer usando con el

    comando save. No obstante, para las versin actuales de Stata 12 y 13 se sugiere usar el

    comando soveold, para que las bases de datos pueda ser reconocido por versiones del

    Stata anteriores a los mencionados.

    Como se puede ver en la lnea de sintaxis, despus de la coma ( , ) viene las opciones del

    comando, en este caso es replace lo que significa que si se vuelve a ejecutar esta sintaxis el

    Stata guardar la base de datos nuevamente de la que ya existe.

  • CAPTULO II. GESTIN DE BASE DE DATOS

    1. Inspeccin de la base de datos

    En esta seccin aprenderemos comandos que nos permitan dar una revisada a la base de

    datos, es decir, saber con qu esquema de datos y tipos de variables estamos trabajando.

    Para ello, vamos a trabajar con una Encuesta de Hogares (ENAHO) del ao 2013, el

    mdulo de esta encuesta ser las Caractersticas de las viviendas encuestadas.

    Previamente establecemos nuestra ruta de trabajo y luego cargamos la base de datos con el

    comando use.

    Usualmente despus de abrir una base de datos, recurrimos a la siguiente rutina de

    inspeccin de una base de datos:

    Observar la base de a travs del comando browse, el cual nos permite ver la base de

    datos sin poder modificarla. En cambio, existe otro comando denominado edit que

    nos permite ver la base de datos pudiendo modificarlo.

    Descripcin de la base de datos con el comando describe.

  • Generando un diccionario de variables con el comando codebook.

    Realizar un cuadro estadstico resumen de diferentes variables numricas con el

    comando summarize.

  • 2. Generacin y transformacin de variables

    Una primera forma de generar variables es utilizando el comando generate, que

    usualmente trabaja conjuntamente con el comando replace. Este comando nos permite

    generar variables haciendo uso de expresiones matemticas, lgicas, numricas.

    Si bien es cierto que STATA solamente reconoce los comandos con letras minsculas,

    tambin es importante decir que hace diferenciacin de los nombres de las variables entre

    si son minsculas o maysculas.

    Por ejemplo, a partir de la base de datos se quiere saber el nmero de hogares que tienen

    internet, esta informacin se encuentra en la pregunta p1141. Para ello, creamos una

    variable dictoma denominada internet donde toma el valor de 0 si el hogar no tiene

    internet y 1 cuando si tiene internet.

    A esta nueva variable se puede introducir etiquetas para una mejor descripcin. Si

    queremos colocar una etiqueta al nombre de la variable utilizamos el comando label

    variable, y si se quiere etiquetar los valores de la variable primero se debe definir una

    etiqueta con label define y luego se utiliza el comando label value para utilizar la etiqueta

    creada en los valores de la variable, tal y como se muestra a continuacin:

    Una vez creada la variable internet se puede hacer una tabla simple de frecuencia con el

    comando tabulate para saber cuntos hogares tienen internet. En este caso, de un total de

    39 767 hogares entrevistadas, el 15,84% tienen internet.

  • Otra forma de generar variables es empleando en comando egen. Este comando es una

    extensin del anterior, que permite utilizar expresiones que incluyan funciones ms

    complejas del STATA, como es el caso de: medias, mximos, mnimos, desviacin

    estndar, promedios mviles, variables estandarizadas, etc.

    A manera de ejemplo se puede calcular una variable que capture el valor promedio,

    mximo y mnimo del pago de alquiler de una vivienda (p106).

    Tambin se puede generar variables a partir de la recodificacin de otras variables con el

    comando recode, el cual permite modificar los valores especficos de una variable. A

    manera de ejemplo se puede crear una variable de regiones naturales del pas (costa, sierra

    y selva) a partir del dominio geogrfico (dominio). Para ello se suele recomendar realizar

    una revisin de las etiquetas de la variable a recodificar con el comando label list.

  • A partir de las etiquetas de los valores se comienza a clasificar y agrupar con el fin de

    luego formas los grupos de recodificacin de la siguiente manera:

    3. Transformacin de bases de datos

    Hay ocasiones en que la base de datos puede requerirse para colapsarlo de tal forma que

    cada grupo de individuos est representada por una observacin en particular, ya sea por

    el promedio, la mediana, desviacin estndar, mximo, mnimo, la suma, etc., de alguna

    variable en particular. Para hacer esta operacin recurrimos al comando collapse.

    A manera de ilustracin cargamos una nueva base de datos denominada kids.dta que

    tiene informacin de nios correspondiente a un cdigo de familia que pertenece, su

    nombre, orden de nacimiento, endad, peso y sexo.

  • A partir de esta pequea base se requiere tener informacin a nivel de familia, donde se

    registre el promedio de aos de edad de los nios, el peso mximo, y el nmero de nios

    hombres. As, que la lnea de sintaxis sera el siguiente:

    Por otro lado, cuando se trabaje con bases de datos de forma panel (un grupo de

    individuos que se recogen informacin en un periodo de tiempo), esta puede tener dos

    formas: larga y ancha. El comando reshape nos permite transponer una base de datos

    panel de forma larga (long) a una de forma ancha (wide) y viceversa. Como se muestra a

    continuacin:

    Por ejemplo, cargamos otra base de datos llamada ingfam.dta, que contiene informacin

    sobre el ingreso de 3 individuos en tres aos (1996, 1997 y 1998).

  • Como se observar, esta base tiene formato wide, y lo que se quiere en transponerlo a

    formato long. Para ello, hay que identificar bien dos cosas: la parte del nombre de la

    variable que se repite y que a su vez sirve como una semilla (ingfam), y la variable que

    identifique al individuo que se colocar en la opcin i(codfam), por ltimo se coloca un

    nuevo nombre a la variable temporal j(tiempo).

    Si se quiere volver al formato anterior, es decir, de long a wide, se debe ejecutar lo

    siguiente:

    4. Fusin de bases de datos

    Es comn la combinacin de varias bases de datos. Se va a mostrar dos operaciones

    bsicas: aadir observaciones y aadir variables.

    En el primer caso, se utiliza el comando append para fusionar bases de datos de manera

    vertical. Aqu ser necesario una base activa o cargada (base master) y una inactiva que se

    va a aadir a la base master (base using), adems la base originada tendrs una forma long.

  • Para ello, abrimos una nueva base de datos denominada base1.dta el cual estar activa y

    ser nuestra base master. Adems, en nuestra carpeta de trabajo existe otra base llamada

    base2.dtael cual estar inactiva (base using) y ser aadida a la primera base. Ambas

    bases de datos contiene informacin de las notas de alumnos (en la primera base existe 3

    alumnos y en la segunda existen 4 alumnos) en los cursos de micro, macro y economa,

    adems de su sexo el turno horario.

    Para fusionar ambas bases de datos e utiliza la siguiente lnea de sintaxis:

    En el segundo tipo de fusin para aadir variables, se utiliza el merge para fusionar bases

    de datos de manera vertical. De la misma manera que en el primer caso, tambin existir

    una base master y una base using.

    Para este ejemplo, se usaran dos bases de datos que ya fueron fusionados de manera

    vertical base12.dta y base34.dta, el primero ser la base using y la segunda la base

    master. Ambas bases contienen informacin de alumnos, por lo cual ser un fusin de

    individuo contra individuo (1:1).

  • Como se puede observar en la fusin, automticamente se crea una variable denominada

    _merge el cual toma valores dependiendo si el registro de los datos est presente en una

    de las bases o en ambos. Cuando el valor de la variable _merge es 1 quiere decir que el

    dato solo aparece en la base master, 2 cuando aparece en la base using y 3 cuando aparece

    en ambos. Usualmente, despus de cada fusin se suele eliminar esta variable con el

    comando drop.

  • CAPTULO III. GRFICOS EN STATA

    1. Introduccin al Stata Graph

    Stata presenta una amplia variedad de grficos, la cual abarca figuras como: matrices de

    ploteos, histogramas, reas, lneas, caja y bigote, etc. Comenzaremos demostrando siete

    tipos de grficos:

    histogram: Histogramas

    graph twoway: Scatterplot, lneas, y otros entre dos variables.

    graph matrix: Matrices de Scatterplots.

    graph box: Grficas de caja y bigotes.

    graph bar: Grficas de barras

    graph pie: Grficas de pastel o pie.

    Para cada uno de estos grficos existen muchas opciones1.

    2. Tipos de grficos

    Los comandos del Stata Graph empiezan con la palabra graph (aunque en algunos casos

    esto es opcional) seguido por la palabra que indica el tipo de grfico.

    A continuacin describiremos los diferentes tipos de grficos que se puede elaborar en el

    ambiente del Stata.

    2.1. Histograma

    La funcin de densidad de una variable puede ser estimada usando un histograma a

    travs del comando histogram. Para ilustrar este comando, utilizaremos la base de la

    Encuesta Permanente de Empleo (EPE) correspondiente al trimestre mvil Enero-Febrero-

    Marzo del ao 2014, la cual contiene informacin referente a la situacin de empleo que

    tiene un individuo en el mercado laboral.

    En esta base se tiene informacin de los ingresos laborales totales de los trabajadores al

    mes (ingtot), el cual se quiere obtener su grfico de frecuencias del logaritmo natural de

    1 Para observa otras tipos de grficos y comandos relacionados a estos, se recomienda escribir en la venta de comandos help graph other.

  • estos ingresos con el fin de reducir la varianza. Adems, comparamos con la distribucin

    para observar si se guardan caractersticas similares, tal y como se muestra a

    continuacin:

    2.2. Dispersin de puntos (Scatter Plot)

    Los diagramas de dispersin de puntos (scatter plot) se accede a travs del comando graph

    twoway scatter. Por ejemplo, queremos ver la relacin que guardan el ingreso laboral total

    (en logaritmos) con la edad (p108).

    0.2

    .4.6

    .8

    Den

    sity

    2 4 6 8 10lningtot

    24

    68

    10

    lnin

    gto

    t

    0 20 40 60 80 100edad ( en aos )

  • No obstante, se puede ajustar un lnea recta (lfit) a este grfico, y al mismo tiempo ajustar

    por una relacin cuadrtica (qfit), para ver si existe rendimientos decrecientes en los

    ingresos laborales.

    2.3. Mltiple dispersin de puntos

    El comando graph matrix nos muestra un til anlisis multivariado. Este comando otorga

    una grfica compacta de la relacin entre un nmero de variables por pareja,

    permitindole al analista observar los signos de no linealidad, outliers o cluester que

    puedan afectar al modelamiento estadstico. Este tipo de grfico tambin es til si se

    quiere observar la influencia de una lista de variables explicativas a una variable

    dependiente.

    Por ejemplo, si se quiere ver grficamente la relacin de un conjunto de factores que

    pueden influir en los ingresos laborales de la persona, como es el caso de la edad (p108),

    las horas de trabajo (p209t) y el nivel educativo (p109b), se puede ealizar de la siguiente

    manera:

    24

    68

    10

    0 20 40 60 80 100edad ( en aos )

    lningtot Fitted values

    Fitted values

  • 2.4. Caja y bigote

    La grfica de caja y bigote brinda informacin acerca del centro, amplitud, simetra y

    outliers con solo un vistazo. Para obtener este grfico, se debe empelar el comando graph

    box.

    Si seguimos analizando la distribucin de los ingresos laborales con un grfico de caja y

    bigotes se programara la siguiente lnea de comando.

    lningtot

    edad (en aos

    )

    total dehoras

    trabajadas

    aos deestudios

    0

    5

    10

    0 5 10

    0

    50

    100

    0 50 100

    0

    50

    100

    0 50 100

    0

    5

    10

    0 5 10

    24

    68

    10

    lnin

    gto

    t

  • Si se quiere el mismo grfico pero de manera horizontal, se debera usar el comando graph

    hbox.

    2.5. Pie

    Este estilo es muy popular en las presentaciones de grficas, siempre y cuando tengan

    pocos valores para trabajar. El comando bsico del grfico de pastel es graph pie.

    Si se quiere saber la distribucin de las personas por nivel educativo (p109a) que fue

    recodificada a una menor cantidad de niveles (sin nivel, primaria, secundaria, superior)

    que lleva como nuevo nombre niveduc, se puede obtener utilizando el comando

    mencionado con la opcin over() para que los pedazos del pie lo conformen los cuatro

    niveles educativos:

    2 4 6 8 10lningtot

  • 2.6. Barras

    El grfico de barras provee una simple y verstil exhibicin conjunto de resmenes

    estadsticos como media, mediana, suma o conteo. Para obtener barras verticales se debe

    utilizar el comando graph bar.

    Por ejemplo, si se desea comparar en un grfico de barras el valor de la media y la

    mediana del ingreso laboral, se debera especificar los estadsticos a utilizar, en este caso

    (mean) y (median). Adems, si se quiere mostrar los valores de estos estadsticos se debe

    colocar la opcin blabel(bar).

    S que quiere las barras de manera horizontal basta con usar el comando graph hbar.

    Sin nivel Primaria

    Secundaria Superior

    1440.19

    1083

    0

    500

    1,0

    00

    1,5

    00

    mean of ingtot p 50 of ingtot

  • CAPTULO IV. MODELO DE REGESIN LINEAL CLSICO (MRLC)

    1. Especificacin y supuestos del MRLC

    En los modelos de regresin lineal se requiere explicar el comportamiento de una variable

    (dependiente ) a partir de otras (regresoras o explicativas ). Utilizamos el concepto de

    distribucin de probabilidad condicionada, pues se busca conocer los estimadores de los

    parmetros de regresin con la finalidad de estimar finalmente el ( | = ), es decir

    buscamos conocer el valor esperado de Y, dado que = (la variable regresora toma un

    determinado valor ).

    = 0 + 1 +

    La variable es la variable dependiente, las variables son las variables explicativas o

    regresoras, y es la perturbacin aleatoria o comnmente llamado trmino de error. Los

    son los parmetros asociados a cada una de las variables explicativas, tambin llamados

    coeficientes de regresin y miden el impacto de cada variable independiente en relacin al

    comportamiento de la variable endgena.

    Los parmetros son no conocidos. Sin embargo, utilizando informacin muestral se

    pueden obtener estimadores de los parmetros (o coeficientes).

    Dado la expresin anterior, se considera que se cumplen las siguientes hiptesis clsicas

    bsicas:

    Linealidad en los parmetros.

    No singularidad o multicolinealidad. No existen relaciones lineales entre las

    variables explicativas o regresores y estos no son variables aleatorias.

    Exogeneidad estricta o no endogeneidad. La esperanza del vector de la variable

    aleatoria es cero: () = 0.

    Errores esfricos. La matriz de varianzas y covarianzas del vector de variables

    aleatorias es: () = 2. Es decir, todos los componentes del vector tienen

    varianza idntica (homoscedasticidad), y adems las covarianzas son 0, es decir, los

    elementos del vector no estn correlacionados (no autocorrelacin).

  • Normalidad de los errores. La distribucin de probabilidad del vector de

    perturbaciones aleatorias es: ~(0, 2), es decir, es un vector normal esfrico.

    Por tanto, las perturbaciones son variables aleatorias independientes e igualmente

    distribuidas, normales con media cero y varianza 2. Dado que no es aleatoria,

    la distribucin de probabilidad del vector se deriva a partir del vector de

    perturbaciones ~(, 2).

    2. Estimacin del MRL por el mtodo de Mnimos Cuadrados Ordinarios (MCO)

    El mtodo de Mnimos Cuadrados Ordinarios (MCO) permite encontrar los parmetros

    desconocidos del modelo, cuyo criterio es minimizar los errores al cuadrado del MRLC.

    A partir de este criterio, se puede estimar el valor de los parmetros de la siguiente

    manera:

    = ()1

    Y a su vez la matriz de varianza y covarianza, que servir para calcular los errores

    estndar de los estimadores, se obtiene de la siguiente relacin:

    () = 2()1

    Donde el parmetro 2 se puede estimar de la siguiente manera:

    2 =

    =

    ( )( )

    Siendo n el tamao de la muestra y k el nmero de parmetros.

    A manera de un ejercicio aplicativo, se emplea la base del sistema del Stata auto.dta. En

    esta ocasin se desea explicar el precio del auto (price) en funcin de los millages por

    galn (mpg), su peso (weight) y su procedencia (foreign). Es decir:

    = 0 + 1 + 2 + 3 +

    El comando en Stata para estimar un MORLC por la tcnica de MCO es regress, tal y como

    se muestra a continuacin:

  • Los resultados ms importantes de esta regresin se detallan en el cuadro de la parte

    inferior, donde en la segunda columna se encuentra los coeficientes o parmetros

    estimados asociado a cada variable explicativa. Y en la columna de a lado, se presenta los

    errores estndar de estos estimadores el cual servirn como insumo para calcular el

    estadstico t-student, y este ltimo a su vez servir para calcular la probabilidad

    acumulada.

    Tanto el estadstico t-student y la probabilidad son importantes para realizar las pruebas

    de significancia individual, para saber si las regresoras obtenidos influyen

    significativamente o no sobre la variable dependiente. Por tanto, la hiptesis para evaluar

    esta significancia individual es el siguiente:

    Ho : = 0 (hiptesis nula)

    Ha : 0 (hiptesis alternativa)

    La regla de decisin es la siguiente:

    Se acepta Ho si: t-calculado < 1.96. Si p-value > 0.05.

    Se rechaza Ho si: t-calculado > 1.96. Si p-value < 0.05.

  • En el caso del ejemplo, se puede apreciar que para la variable mpg tiene un valor de t-

    calculado igual a 0.29, menor a 1.96, por lo cual se rechaza la hiptesis nula de

    significancia individual. La misma conclusin se obtendra por el lado de la probabilidad

    ya que esta es 0.769 mayor al umbral de 0.05.

    En cuanto a la significancia conjunta del modelo, es decir, si las regresoras en conjunto

    explican el comportamiento de la variable dependiente, es necesario fijarnos el cuadro

    superior de lado derecho donde se encuentra el estadstico de Fisher. Para ello hay que

    observar el valor de la probabilidad Prob. > F y sigue la misma regla de la significancia

    individual, es decir, si es mayor a 0.05 se acepta la hiptesis nula de no significancia

    individual, caso contrario se rechaza esta hiptesis nula, lo cual indicar que las variables si

    explican significativamente en su conjunto. Para el caso del ejemplo, esta probabilidad es

    0.0 menor al 0.05, por lo cual se rechaza la hiptesis nula, lo que significa que son

    estadsticamente significativos de manera global.

    Otro resultado importante es la bondad de ajuste del modelo que se mide por el

    Coeficiente de Determinacin, o tambin llamado R-squared (R2). El valor de este

    estadstico es 0.4996 que es igual a decir 49.96%, lo que significa que el 49.96% de la

    variabilidad o varianza de Price est siendo explicada por la varianza de las variables

    explicativas. Se espera que mientras ms cercano a la unidad este estadstico es mejor el

    modelo.