PR`CTICAS DE SERIES TEMPORALES CON EXCEL · PrÆctica 1. Descomposición clÆsica de una serie aditiva p89 PR`CTICAS DE SERIES TEMPORALES CON EXCEL En este texto se presentan un conjunto
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Práctica 1. Descomposición clásica de una serie aditiva p89
PRÁCTICAS DE SERIES TEMPORALES CON EXCEL
En este texto se presentan un conjunto de cuatro prácticas realizadas sobre unos archivosde datos disponibles en formato Excel.
El objetivo de estas prácticas es mostrar, en cada caso, la sistemática de análisis de losdatos utilizando la hoja de cálculo. No pretenden ser un manual de Excel, pero sí dar unainformación detallada de cómo se puede llevar a cabo el estudio en cuestión, a demás deservir de guía para la realización de la práctica que cada alumno tiene encomendada.
PRÁCTICA 1. DESCOMPOSICIÓN CLÁSICA DE UNA SERIE ADITIVA
OBJETIVO: Se dispone del valor diario de la caja resultante de las ventas de unsupermercado a lo largo de 12 semanas. Es necesario analizar los datos de esta seriecronológica, estimar el modelo de comportamiento, estudiar su ajuste y hacer lasprevisiones necesarias. Todo ello se realizará mediante la hoja de cálculo Excel 97 deMicrosoft.
1.1 Recuperacion de los datos
Desde Excel se debe recuperar el archivo que contiene los datos objeto de la práctica, y quese encuentran en el directorio habitual de la red. Para ello, se debe seguir la secuencia(figura 1.1):
Archivo 6666 Abrir
y, ahora, ir al directorio donde se encuentra el archivo Práctica 1.xls, seleccionarlo ypresionar Abrir.
Fig. 1.1
Una vez tenemos el archivo abierto, observamos que consta de una hoja llamada Datosdonde figuran 3 columnas de 72 valores cada una, con la estructura mostrada parcialmenteen la figura 1.2. En cada columna hay 72 valores, es decir, cada columna comienza en la fila1 (con el título) y acaba en la 73.
La columna A, llamada Semana contiene valores de 1 a 12 correspondientes a las 12semanas en que se ha recogido la información; la B, Día, indica el día de la semana; y la Ccontiene los valores de las ventas diarias, que se llaman Y.
En primer lugar, se debe preparar una nueva hoja donde es situarán los sucesivos gráficos,y que se denominará Gráficos. Para ello, al hacer doble clic en la pestaña Hoja2 (figura1.3), esta palabra quedará en vídeo inverso y permitirá escribir Gráficos.
Fig. 1.3
De forma similar, a la Hoja3 la denominaremos Tendencia-Modelo.
1.2 Análisis de la evolución de la serie cronológica
Situados en la hoja Datos, es necesario crear una columna con los valores consecutivos deltiempo y, para mayor facilidad al hacer los gráficos, es bueno que esta columna preceda a lade los valores de las ventas (Y). Hacer clic sobre la letra C del encabezado de la columnaque quedará toda negra; pulsando el botón derecho, seleccionar Insertar (figura 1.4). Eneste momento la columna de los datos se habrá desplazado a la D y habrá dejado la Cvacía; aquí es donde se introducirán los valores correlativos del tiempo. En C1 escribirtiempo, hacer C2 = 1 y arrastrar (tecleando también Ctrl) desde C2+ hasta C73; aquíaparecerá el valor 72 (página 108 de esta práctica).
Para obtener el gráfico de la evolución de las ventas frente al tiempo, se selecciona desdeC1 hasta C73 (tiempo), y desde D1 hasta D73 (ventas =Y) y se pincha el icono de gráficos
o también, en la barra de herramientas, Insertar y después Gráfico.
Entonces surge el Asistente para Gráficos (figura 1.5), donde se debe seleccionar
XY (Dispersión)
y, entonces la opción (3; 1), es decir, Dispersión con puntos conectados por líneas ySiguiente.
Práctica 1. Descomposición clásica de una serie aditiva p93
Fig. 1.7
Con el gráfico seleccionado (de forma que se muestre recuadrado externamente con lasmarcas en el entorno), se puede situar en el lugar adecuado y darle el tamaño que seanecesario.
Si se quiere editar el gráfico y, por ejemplo, eliminar el fondo gris del mismo:
Pinchar sobre este fondo, Área de trazado
Presionar el botón derecho
Formato del área de trazado
Área
¿ Ninguna Aceptar
Para cambiar la escala del eje vertical y aprovechar toda la superficie de la figura:
Situar el cursor sobre el eje de ordenadas, Eje de valores
Hacer doble clic o bien presionar el botón derecho
Formato de ejes (figura 1.8)
Pestaña Escala: Poner el mínimo a 0, el máximo a 12000, la unidad mayora 4000 y la menor a 1000 Aceptar
Si se quiere cambiar la escala del tiempo, por ejemplo para que vaya de 6 en 6 unidades,que son los valores que forman una semana, hay que situar el cursor sobre el eje deabscisas (Eje de valores (X)) y con el botón derecho seguir los mismos pasos que antes,para dejar un mínimo de 1, un máximo de 78, la unidad mayor a 6 y la menor a 1.
El resultado es el gráfico de la página 111 de esta práctica.
Conclusiones: Se detecta una clara estacionalidad, de período p=6, y posiblemente unatendencia decreciente.
1.3 Estabilización de la serie
Para poder modelizar la serie, en primer lugar se debe estabilizar calculando las mediasmóviles de período p; en el caso del ejemplo p=6.
Cálculo de las medias móviles
Situados en la casilla E1 escribir como título de la columna Y(p=6). Al ser de período 6, lamedia de los 6 primeros valores se debe situar entre el tercer y el cuarto lugar, filas 4 y 5;
Práctica 1. Descomposición clásica de una serie aditiva p95
como eso no lo podemos hacer en la hoja de cálculo optamos por empezar en la casilla 5.Situados entonces en E5, hacemos
= Promedio (D2:D7) ↵↵↵↵ (aparece como resultado 6135)
Arrastramos hasta E71, que contendrá la media de los 6 últimos valores de la serie(Promedio(D68:D73)), en este caso 5256,33.
Al ser de período par debemos volver a la media de 2 en 2: la primera media móvil ocuparáel cuarto valor (5ª fila), y la última el 69º (70ª fila), ya que en total se pierden 3 valores al inicioy 3 al final. Situados en F5 escribiremos
= Promedio (E5:E6) ↵↵↵↵ (aparece como resultado 6103,75)
Arrastramos hasta F70, que contendrá la media de los 2 últimos valores de la columnaanterior (Promedio(E70:E71)), en este caso 5262,33.
Titularemos la columna F, Y móvil, y lo escribiremos en F1. En las páginas 107 y 108 sepuede ver el conjunto de valores que resultan.
Gráfico de medias móviles
Seleccionar, manteniendo presionada la tecla Control, desde C2 hasta C73, (tiempo), desdeD2 hasta D73, (Y) y desde F2 hasta F73, (Y móvil).
Con el icono de gráficos
Paso 1: Asistente para Gráficos (figura 1.5),XY (Dispersión)(3; 1), Dispersión con puntos conectados por líneasSiguiente
Paso 2: Siguiente
Paso 3: Poner los títulos, por ejemplo medias móviles (p=6), sacar la leyenda ySiguiente
Paso 4: Situar el gráfico como ¿ Objeto en la hoja gráficos. Terminar
Es aconsejable editar el gráfico, tal como se ha hecho con el anterior, para que la escala deordenadas vaya de cero a doce mil; también se puede cambiar la escala de tiempo comoantes. El resultado es el gráfico de la página 111.
Conclusiones: Se detecta una tendencia decreciente, casi seguramente lineal, pero ¿podríaser cuadrática? Se deberá estudiar en el momento oportuno.
El estudio de la estacionalidad incluye el cálculo de los índices estacionales, en modeloaditivo que es el caso del ejemplo, y su representación gráfica.
Cálculo de los índices estacionales
Este cálculo es muy cómodo hacerlo con una tabla dinámica. En primer lugar se debenobtener los valores de W, que son las diferencias entre los valores de la serie (Y, columnaC) y las medias móviles (Y móvil, columna E). Estos valores se situarán en la columna G.
En la casilla G1 escribir W. Situados en G5, hacer
= D5 – F5 (Y – Y móvil)
y arrastrar hasta G70.
En la barra de herramientas
Datos 6666 Asistente para tablas dinámicas
Paso 1: ¿Dónde están los datos?¿ Lista o base de datos de Microsoft ExcelSiguiente
Paso 2: ¿Dónde están los datos que desea usar?Rango: $AEL:$G$73 (es la opción por defecto,
que incluye todos los datos)Siguiente
Paso 3: arrastrar W a DATOS y Día a FILA (figura 1.9)Doble clic sobre Contar de W
PromedioAceptar (ahora el cuadro es Promedio de W )
El resultado es la siguiente tabla, copiada de la página 108.
A B C D
80 Promedio de W
81 día Total
82 lunes -2331,37
83 martes -939,924
84 miércoles -1963,33
85 jueves 304,7803
86 viernes 3098,348
87 sábado 1898,394
88 Total general 11,14899
Los valores de las casillas C82 – C87 son, respectivamente, E*1, E*2, …, E*6; la casilla C88(llamada Total general en B88) es la media de las anteriores, o sea, E* .
Para calcular los índices estacionales, en la casilla E81 se escribe Ind. Est. como título, y sedefine E82 con la expresión
= C82 - $C$88 (anclar la casilla C88 de la media para que no cambie al arrastrar la fórmula)
Arrastrar hasta E87
Los resultados obtenidos se pueden observar en las páginas 107 y 108.
Repetir los valores de la estacionalidad por los 72 valores de la serie. Situados en lacolumna H, en H1 escribir Ind. Est.
Seleccionar las casillas E82 – E87
Edición 6666 CopiarSituarse en H2
Edición 6666 Pegado especial 6666 Valores Aceptar
Llenar toda la columna (72 valores) cortando de H2 a H7 y pegando sucesivamente desdeH8 hasta H73; también se puede hacer marcando como bloque H2−−−−H7 y, presionando latecla de Ctrl, arrastrarlo desde el extremo inferior derecho del cuadro (+) hasta H73.
Gráfico de la estacionalidad
Seleccionar los valores de los índices estacionales, casillas E82 hasta E87 (o también desdeH2 hasta H7).
Con el icono de gráficos
Paso 1: Líneas6666 Línea con marcadores (2, 1) de la figura 1.11 Siguiente
Práctica 1. Descomposición clásica de una serie aditiva p99
Fig. 1.11
Paso 2: Siguiente
Paso 3: Poner los títulos, por ejemplo Índices estacionales, quitar la leyenda ySiguiente
Paso 4: Situar el gráfico como ¿ Objeto en la hoja Gráficos. Terminar
Situar el gráfico en la posición y con tamaño deseado.
Si se quiere que los valores del eje de abscisas queden fuera del gráfico, situar el cursorsobre el eje de ordenadas (Eje de valores), y haciendo doble clic sale la pantalla Formatode ejes (figura 1.12). En la pestaña Escala se debe entrar al Eje de categorías (X) cruzaen:y cambiar el 0 por −−−−3000
Fig. 1.12
El resultado es el gráfico de la página 113.
Conclusiones: Analizar qué se puede decir de cada día de la semana referente a laestacionalidad. ¿Cuál es el día con más ventas?, ¿y el de menor número? ¿En cuánto difierende la media semanal cada uno de estos días?
Observando el gráfico de las medias móviles, superpuesto a la evolución de los datoscronológicos de la página 111, no se ve nada claro si la tendencia es de tipo lineal ocuadrático; eso, en parte puede ser atribuido al hecho de que la escala vertical del citadográfico no es adecuada para estudiar las medias móviles. De modo que, lo primero que sedebe hacer es un nuevo gráfico con una escala lo más amplia posible.
Seleccionar, manteniendo presionada la tecla Ctrl, desde C2 hasta C73 (Tiempo), y desdeF2 hasta F73 (Y móvil) de la hoja Datos.
Con el icono de gráficos
Asistente para Gráficos (figura 1.5)XY (Dispersión)(3; 1), Dispersión con puntos conectados por líneas
Siguiente
Paso 2: Siguiente
Paso 3: Poner los títulos, por ejemplo Media móvil (tendencia), sacar la leyenda ySiguiente
Paso 4: Situar el gráfico como ¿ Objeto en la hoja gráficos. Terminar
Es necesario editar el gráfico, tal como se ha hecho con el anterior, para que la escala deordenadas vaya desde cinco mil hasta siete mil. El resultado es el gráfico de la página 112.
Con la nueva escala parece bastante claro que puede haber una tendencia cuadrática, poreso, se ha de proceder a ajustar un modelo parabólico con el bien entendido de que si eltérmino cuadrático no fuese significativo ya se detectaría en el análisis de los resultados, yse procedería en consecuencia; es decir, se debería ajustar un nuevo modelo sin el términoque ha resultado no significativo.
Para aligerar la presentación de la hoja de cálculo, realizaremos el estudio de la tendencia,de los residuos y de las previsiones en una nueva hoja, que ya tenemos preparada desde elinicio con el nombre Tendencia-Modelo.
En primer lugar copiaremos todo lo que nos haga falta de la hoja Datos. Situados aquí:
Seleccionar las columnas Tiempo, Y, Y móvil y Ind. Est., es decir, C1−−−−C73, D1−−−−D73, (ymanteniendo presionada la tecla Ctrl) F1−−−−F73 y H1−−−−H73
Edición 6666 Copiar
Acceder a la hoja de Tendencia-Modelo, haciendo clic sobre la pestaña con su nombre.Situados en la casilla A1
Edición 6666 Pegar
En este momento están ocupadas las columnas A, B, C y D. Para poder hacer el ajustemínimo cuadrático para la tendencia, mediante un modelo parabólico, se debe disponer de
Práctica 1. Descomposición clásica de una serie aditiva p101
una columna con los valores del tiempo al cuadrado, que necesariamente ha de estarsituada al lado de la columna del tiempo; por eso tendremos que insertarla entre lascolumnas A y B.
Hacer clic sobre la letra B del encabezado de la columna, que quedará toda negra;presionar el botón derecho para seleccionar Insertar (figura 1.4). La columna de los datosse ha desplazado a la C y ha dejado la B vacía; aquí se introducirán los valores del tiempoal cuadrado.
En B1 escribir Tiempo^2
Situados en B2 escribir la expresión =A2*A2
Arrastrar hasta B73; aquí habrá el valor 5184, que es el cuadrado de 72. En las páginas 109y 110, se puede ver la disposición de los valores.
Abrir Herramientas 6666 Análisis de datos6666 Regresión
Llenar los campos según se presenta en la figura 1.13, es decir:
Rango Y de entrada D5:D70 (medias móviles)Rango X de entrada A5:B70 (tiempo y tiempo^2)
Opciones de salida:
¿ Rango de salida: A93 (casilla vacía, a partir de donde se presentarán los resultados de la regresión)
Los resultados obtenidos se muestran en la figura 1.14, extraída de la página 110.
Conclusiones: El nivel de significación (valor p) de los coeficientes asociados al tiempo y altiempo^2 es inferior a 0,05. Por lo tanto, con un riesgo de la primera especie del 5%, sedebe aceptar el modelo cuadrático, que en este caso es:
2T 6311,51 27,30 t 0,18 t= − +con un R2 del 85,6 %.
Coefs o t p co t Va o pOrd. Origen 6311,5139 51,8296 121,7743 1,7087E-76Tiempo -27,3032 3,2473 -8,4079 6,9185E-12Tiempo^2 0,1832 0,0433 4,2298 7,7177E-05
Fig. 1.14
Una vez obtenida la ecuación de la tendencia, podemos calcular su valor para los diferentestiempos de los que se dispone de información. Para ello crearemos una nueva columna.
Situados en F1 escribir Tendencia, que será el título de la columna
En F2 escribir la expresión que acabamos de obtener,= 6311,51 −−−− 27,3*A2 + 0,18*B2
y arrastrarla hasta F73
Para ver la bondad del ajuste, se puede hacer un gráfico que compare los valores de lasmedias móviles y los de la tendencia ajustada. Por eso seleccionar, presionando la teclaCtrl, desde A1 hasta A73, desde D1 hasta D73 y desde F1 hasta F73
Práctica 1. Descomposición clásica de una serie aditiva p103
Con el icono de gráficos
Asistente para Gráficos (figura 1.5)XY (Dispersión)(3; 1) Dispersión con puntos conectados por líneas
Siguiente
Paso 2: Siguiente
Paso 3: Poner los títulos, por ejemplo Tendencia, sacar la leyenda y Siguiente
Paso 4: Situar el gráfico como ¿ Objeto en la hoja Gráficos. Terminar
Es necesario editar el gráfico, tal como se ha hecho con el anterior, para que la escala deordenadas vaya desde cinco mil hasta a siete mil.
Si se quiere, situados sobre uno de los puntos de la Serie “tendencia”, con el botónderecho seleccionar
Formato de punto de datosMarcador ¿ Ninguno
El resultado es el gráfico de la página 112, donde se puede valorar el ajuste.
1.6 Modelo y residuos
En una serie aditiva, el modelo se obtiene como resultado de sumar la tendencia y laestacionalidad de cada punto.
Situados en G1 escribir, como título, Y mod.
En G2 la expresión = F2 + E2 (tendencia + estacionalidad)
Arrastrar hasta G73, que evidentemente contendrá la expresión F73+E73
Los residuos son la diferencia entre los valores originales, Y, y el modelo, Y mod.
Situados en H1 escribir, como título, Residuos
En H2 la expresión = C2 −−−− G2 (Y − Y mod)
Arrastrar hasta H73
Para hacer la representación gráfica del modelo ajustado en comparación con los valoresoriginales, se debe seleccionar, de la hoja Tendencia−−−−Modelo, los valores del tiempo, de laY y de la Y modelizada, o sea, A1−−−−A73, C1−−−−C73 y G1−−−−G73.
Asistente para Gráficos (figura 1.5)XY (Dispersión)(3; 1), Dispersión con puntos conectados por líneas
Siguiente
Paso 2: Siguiente
Paso 3: Poner los títulos, por ejemplo Modelo ajustado, sacar la leyenda ySiguiente
Paso 4: Situar el gráfico como ¿ Objeto en la hoja Gráficos. Terminar
Si se desea dejar con puntos la serie original y con línea la del modelo ajustado, hay quesituarse sobre uno de los puntos de la Serie “Y”, y con el botón derecho del ratónseleccionar:
Formato de punto de datosLínea ¿ Ninguna
Situarse, luego, sobre un punto de la Serie “Y mod”, y con el botón derecho seleccionar
Formato de punto de datosMarcador ¿ Ninguno
El resultado es el gráfico de la página 113, donde se puede valorar el modelo.
Para hacer la representación gráfica de los residuos en función del tiempo, seleccionar, dela hoja Tendencia−−−−Modelo, los valores del tiempo y de los residuos, o sea, A1−−−−A73 yH1−−−−H73.
Con el icono de gráficos
Asistente para Gráficos (figura 1.5)XY (Dispersión)(3; 1), Dispersión con puntos conectados por líneasSiguiente
Paso 2: Siguiente
Paso 3: Poner los títulos, por ejemplo Residuos, sacar la leyenda y Siguiente
Paso 4: Situar el gráfico como ¿ Objeto en la hoja Gráficos. Terminar
Editar el gráfico para, entre otras cosas, sacar los valores del eje de abscisas fuera delmismo, para ello se sitúa el cursor sobre el eje de ordenadas, Eje de valores (Y), yhaciendo doble clic sale la pantalla Formato de ejes.
Práctica 1. Descomposición clásica de una serie aditiva p105
En la pestaña Escala, modificar
Mínimo: −−−−800Eje de Valores (X) cruza en: −−−−800
En la pestaña Número, en Posiciones decimales poner un cero.El resultado es el gráfico de la página 114.
Conclusiones: La correspondencia entre los datos y el modelo es lo suficientemente buena.No se detecta ningún punto especialmente alejado del comportamiento modelizado por elconjunto. La mayoría de los residuos se mueven en el intervalo de −400 a 400, el másalejado de cero correspondiendo a los valores del tiempo 2, 27 y 33, que no parecenespecialmente anómalos en el gráfico del modelo ajustado.
1.7 Previsiones
Si se quieren conocer las previsiones de las ventas del supermercado que estamosestudiando, a lo largo de las tres próximas semanas (18 días) en la hojaTendencia−−−−Modelo prolongar las columnas del tiempo, la tendencia, la estacionalidad ycrear una nueva columna para las previsiones.
Para la columna A, Tiempo, arrastrar presionando la tecla Ctrl desde la casilla A73 hasta laA91, donde ha de aparecer el valor 90.
En la E74, Estacionalidad, el primer valor que se debe añadir es el que corresponde altiempo 73, es decir múltiple de 6 más 1; por tanto, hay que copiar desde el primer valor delíndice hasta el 18. Marcar como bloque las casillas E2−E19 y hacer Edición 6666 Copiar.
Situados en E74, Edición 6666 Pegar.
En la F, Tendencia, arrastrar la expresión desde el último valor disponible, el 73, hasta eldeseado, el 91.Situados en I1, poner como título Previsiones.
En I74 escribir la expresión = E74 + F74 y arrastrarla hasta E91.
Haciendo eso, obtenemos los resultados que se muestran en la página 110.
El gráfico de las previsiones, junto con la serie original, se obtendrá seleccionando A1−−−−A91,C1−−−−C91 y I1−−−−I91 de la hoja Tendencia−−−−Modelo.
Con el icono de gráficos
Asistente para Gráficos (figura 1.5)XY (Dispersión)(3; 1), Dispersión con puntos conectados por líneasSiguiente
Paso 3: Poner los títulos, por ejemplo Serie y previsiones, tiempo y ventas, sacarla leyenda y Siguiente
Paso 4: Situar el gráfico como ¿ Objeto en la hoja Gráficos. Terminar
Puede ser necesario editar el gráfico por que la escala de abscisas vaya desde cero hastaochenta, y también modificar los tipos de líneas y puntos de la serie Y y de la serieprevisiones, para destacar claramente los dos grupos de puntos.
El resultado es el gráfico de la página 114.
Conclusiones: Las previsiones siguen el mismo tipo de comportamiento que los datosoriginales y, dada la bondad del modelo, pueden considerarse lo suficientemente fiables.
Pero, ¿tenemos derecho a hacer previsiones de aquí a 18 días?; ¿podríamos hacerprevisiones a más largo plazo? La práctica 2 nos dará herramientas para contestar a estaspreguntas.
Coefs o t p co t Va o pOrd. Origen 6311,5139 51,8296 121,7743 1,7087E-76Tiempo -27,3032 3,2473 -8,4079 6,9185E-12Tiempo^2 0,1832 0,0433 4,2298 7,7177E-05
OBJETIVO: Con los datos del valor diario de la caja, resultado de las ventas de unsupermercado a lo largo de 12 semanas, que han sido analizados en la práctica anterior, sehan de calcular los coeficientes de autocorrelación, estudiar su significación estadística yobtener el correlograma; el objetivo final es ver hasta qué valor del tiempo se pueden hacerprevisiones.
Todo eso se realizará mediante la hoja de cálculo Excel 97 de Microsoft.
2.1 Recuperacion de los datos
Desde Excel hay que recuperar el archivo que contiene los datos objeto de la práctica, y quese encuentra en el directorio habitual de la red, siguiendo la secuencia,
Archivo 6666 Abrir
y ahora ir al directorio donde se encuentra el archivo Practica 2.xls, seleccionarlo ypresionar sobre Abrir.
Una vez tenemos el archivo abierto, observamos que consta de una hoja llamada Datosdonde figuran 3 columnas de 72 valores cada una. En cada columna hay 72 valores, esdecir, empieza en la fila 1 (con el título) y acaba en la 73. Recordemos que son los mismosvalores de la práctica 1.
2.2 Cálculo de los coeficientes de autocorrelación
Según hemos visto en el texto sobre series temporales, el coeficiente de autocorrelación secalcula como
kk
0
ˆr s
ˆ=
γγ
donde
N k
i i ki 1
k
(Y Y ) (Y Y )ˆ
N
−
+=
− −=
∑γ y
N2
ii 1
0
(Y Y)ˆ
N=
−=
∑γ
con la recomendación de N > 50 y k ≤ N/4.
En el caso de la práctica, el número de observaciones es N = 72, hecho que nos permitellegar hasta un valor de k igual a 18.
En primer lugar debemos disponer de los valores de la variable centrada, o sea de
iY Y− . Escribimos Y−−−−Ybar como título en la casilla D1, y en la D2 la expresión
Observaremos que se ha fijado el conjunto de valores de Y (columna C) con el símbolo $,con la finalidad de que al arrastrar la fórmula no vayan cambiando los valores con los que secalcula la media. Extendemos la expresión hasta D73.
En la casilla G1 escribimos como título gamma_0, y en la G2 la expresión que permitecalcular su valor
= VARP(C2:C73)
Aquí se ha utilizado VARP en lugar de VAR para que el divisor sea N y no N−1 como seríaen el otro caso.
Para comenzar a preparar la tabla de resultados, se titulan
En F9 se introduce el valor 1, y se arrastra en forma de incremento (presionandosimultáneamente la tecla de Ctrl) hasta F26; aquí habrá un 18.
En la columna G introducimos la expresión de la covariancia, γk, de la página anterior, queen el numerador tiene el producto escalar de dos vectores: el primero va desde Y1− Y
hasta 72 KY Y− − , o sea, de D2 a D(73–k), y el segundo de Y1+k − Y hasta Y72 − Y , o sea, deD(2+k) a D73. Esto es un problema para arrastrar la fórmula de una casilla a las siguientes,ya que al aumentar el desplazamiento k un subíndice aumenta, (el 2+k), pero el otrodisminuye, (el 73−k). Este hecho obligará a escribir la fórmula, arrastrarla y, después,manualmente, y casilla a casilla, modificar el contador que tiene que decrecer. Ateniéndonosa ello en G9 debemos introducir la expresión de la covariancia para Kl, que se puede hacermediante la función SUMAPRODUCTO; es decir, presionaremos sobre el icono de
funciones y seleccionaremos, de entre las Matemáticas y trigonométricas, laSUMAPRODUCTO (figura 2.1), que no es más que el producto escalar de dos vectores,
En el cuadro siguiente (figura 2.2), especificaremos los valores que vamos a utilizar,teniendo cuidado de fijar las posiciones inamovibles ($2 del primer vector y $73 por elsegundo), ya que, como se ha comentado, el primer vector siempre empieza en el primervalor de la Y centrada, eso es, D2, mientras que el segundo siempre acaba en el últimovalor de Y centrada, o sea, D73. Así el primer vector va de D$2 hasta D72 y el segundo deD3 hasta D$73. Una vez se presiona la tecla Aceptar, en la ventana superior queda escritala expresión = SUMAPRODUCTO(D$2... D$73): dicha expresión hay que ponerla entreparéntesis y dividirla por el número total de observaciones (72 en este caso) a fin de obtenerla autocovariancia para k=1. En la figura 2.3 se muestra cómo finalmente queda definida lacasilla G9.
Fig. 2.2
Fig. 2.3
Esta expresión se debe arrastrar hasta G26 y, de momento, no hacer caso de lo queresulte. Ahora hay que cambiar la posición final del segundo elemento de la fórmula en cadacasilla de esta columna. Así
Observar los valores resultantes en la página 120.
En H9, escribir la expresión del coeficiente de autocorrelación, eso es: = G9/G$2, y arrastrarhasta H26, donde figurará =G26/G$2.
La columna I tiene los cuadrados de los coeficientes de autocorrelación; para ello hay quehacer I9 =H9*H9 y extenderlo hasta I26.
En la columna J se ha de calcular la variancia de cada coeficiente, que según el texto deteoría es
1
1V(r )
N≅ y
k 12
k ii 1
1V(r ) 1 2 r
N
−
=
≅ + ∑
Hacer J9 = 1/72J10 = (1+2*SUMA(I$9:I9))/72
y arrastrar hasta J26 donde habrá la expresión =(1+2*SUMA(I$9:I25))/72. Los extremos delintervalo de no significación, ± 2S(r_k), estarán en las columnas K y L.
K9 = −−−−2*RAIZ(J9)L9 = 2*RAIZ(J9)
Arrastrar estas expresiones hasta K26 y L26. La tabla completa de resultados está en laspáginas 120 y 121.
2.3 Autocorrelograma
El gráfico se obtiene seleccionando F9 − F26, H9 − H26, K9 − K26 y L9 − L26.
Con el icono de gráficos
Asistente para GráficosXY (Dispersión)(3; 1), Dispersión con puntos conectados por líneas
Paso 2: SiguientePaso 3: Poner los títulos, por ejemplo Autocorrelograma, quitar la leyenda y
Siguiente
Paso 4: Situar el gráfico con ¿ Objeto en la actual hoja Datos. Terminar
Situar el gráfico en la posición y el tamaño deseado, y editarlo para que presente el aspectohabitual de un correlograma.
Seleccionando un punto de la Serie 1, y haciendo clic con el botón derecho del ratón, sale elcuadro de la figura 2.4. Seleccionar:
Tipo de gráfico 6 Columnas Aceptar
Fig. 2.4
Igualmente, sobre un punto de la Serie 2, en la pantalla de la figura 2.4, hacer
Formato de serie de datos
Carpeta Tramas:
Z Línea suavizada Marcador ¿Ninguno
Repetir la misma operación, una vez situados en un punto de la Serie 3.
Si es necesario, se pueden quitar decimales del eje de ordenadas; para eso tendremos quesituarnos sobre el Eje de valores, y entonces, con doble clic, o presionando el botónderecho del ratón, seguir la secuencia
Formato de ejesCarpeta Número Posiciones decimales
y para quitar los valores de k de dentro del gráfico, en el Eje de categorías, eje de abscisas,
Formato de ejesCarpeta Tramas Rótulos de marca de graduación ¿ Ninguno
El resultado es el gráfico de la página 121.
Comentarios: En el correlograma se confirma claramente la estacionalidad de período 6.El coeficiente de autocorrelación asociado a k=18 aún es significativo, por eso se puedenhacer previsiones para los próximos 18 días, o sea, 3 semanas de ventas.
PRÁCTICA 3. MODELIZACIÓN DE UNA SERIE CON VARIABLES CATEGÓRICAS
OBJETIVO: Se dispone de la evolución de un indicador económico a lo largo de 62trimestres. Tenemos que analizar los datos de esta serie cronológica, estimar el modelo decomportamiento con variables categóricas, estudiar su ajuste y hacer las previsionespertinentes. Todo esto se realizará mediante la hoja de cálculo Excel 97 de Microsoft.
3.1 Recuperación de los datos
Desde Excel recuperar el archivo que contiene los datos objeto de la práctica, y que seencuentran en el directorio habitual de la red. Por esto hemos de seguir la secuencia (figura3.1):
Archivo 6 Abrir
Y ahora ir al directorio donde se encuentra el archivo Practica 3.xls, seleccionarlo y Abrir.
Fig. 3.1
Una vez tenemos el archivo abierto, observamos que consta de una hoja denominada Datosdonde figuran 2 columnas de 62 valores cada una, con la estructura mostrada parcialmenteen la figura 3.2. En cada columna hay 62 valores, es decir, se empieza en la fila 1 (con eltítulo) y se acaba en la 63.
La columna A, llamada t, contiene valores de 1 a 62, correspondientes a los 62 intervalos detiempo (trimestres) en que se ha recogido la información, y la B, con el nombre de Y,contiene los valores del indicador económico que se está estudiando.
Práctica 3. Modelización de una serie con variables categóricas p123
3.2 Análisis de la evolución de la serie cronológica
En primer lugar, hemos de analizar la evolución de la serie, cosa que ya hemos hecho en lapráctica nº1, pero es suficientemente rápido como para hacerlo de nuevo. Se selecciona
desde A1 hasta B63 (columnas t y Y) y se presiona el icono de gráficos , o también,en la barra de herramientas, Insertar y después Gráfico.
En el Asistente para Gráficos (figura 3.3) hemos de seleccionar XY (Dispersión) y ahorala opción (3; 1), es decir, Dispersión con puntos de datos conectados con líneas yTerminar.Situar el gráfico en el lugar que se desee, y editarlo según convenga.
Fig. 3.3
El resultado es el primer gráfico de la página 134 de esta práctica.Parece detectarse una estacionalidad de período 4, hecho que debemos confirmar medianteel correlograma. Este gráfico ha sido el objetivo de la práctica 2; aplicando la metodologíaexpuesta a los datos actuales resulta el correlograma mostrado en la página 132, donde sepuede ver, por una parte, la evidencia de una estacionalidad de período 4 y, por otra, que esadmisible hacer previsiones para cinco intervalos de tiempo.
Conclusiones: Se detecta una clara estacionalidad, de período p=4, y posiblemente unatendencia creciente y cuadrática. El modelo que se tendrá que estudiar será
Y = αααα0 + αααα1 t + αααα2 t2 + ββββ2 Q2 + ββββ3 Q3 + ββββ4 Q4 + ββββ5 Q2 t + ββββ6 Q3 t + ββββ7 Q4 t + εεεε
Para poder modelizar la serie, en primer lugar hemos de crear las variables categóricas, oindicatrices, teniendo en cuenta que, en el caso de la práctica, el período p es igual a 4.Para ello, se preparan los títulos de las columnas que contendrán los valores de lasvariables categóricas. Recordando que las representamos por Q y que sus índices vandesde 2 hasta p (teoría de series temporales), en las casillas C1, D1 y E1 escribiremos Q2,Q3, y Q4, tal como muestra la figura 3.4.
A continuación rellenaremos cada variable categórica con sus valores. Al ser el período iguala 4, hay 4 combinaciones diferentes de ceros y unos, una para cada componente delperíodo, y sabiendo que Qi vale la unidad si el orden del tiempo asociado es igual a i, y valecero en cualquier otro caso, el conjunto de valores es el que se muestra en el bloque C2−E5, de la figura 3.4.
Una vez lleno el bloque anterior, sólo hemos de seleccionarlo y con Cortar y Pegar, llenartodas las casillas C ... E hasta la fila 63, o bien arrastrar el bloque presionandosimultáneamente el Ctrl (página 130).
Además, para estudiar el modelo, es necesario disponer de las columnas con los valorestQ2, tQ3 y tQ4, tiempo (t) y tiempo al cuadrado (t^2). Estos valores están en las columnas F,... J. Para llenar estas columnas, es ya evidente que lo que debemos hacer es definirlascomo
Práctica 3. Modelización de una serie con variables categóricas p125
Obtención del modelo
De acuerdo con la naturaleza de los datos hay que plantear el modelo
20 1 2 2 2 3 3 4 4 5 2 6 3 7 4
ˆ ˆ ˆ ˆ ˆ ˆˆ ˆ ˆ ˆY t t Q Q Q Q t Q t Q t= + + + + + + + +α α α β β β β β β
Para estimar los coeficientes y estudiar su significación, el procedimiento es:
Herramientas 6666 Análisis de datos 6666 Regresión
En este momento aparece la pantalla de la figura 3.5, donde debemos rellenar los campossiguientes
Rango Y de entrada: $B$1:$B$63 (los valores de Y)
Rango X de entrada: $C$1:$J$63 (los valores de los regresores)
Z Rótulos
n Rango de salida $A$125 (una casilla que esté vacía)
Los resultados se pueden ver en la página 133, con el título •••• Primer paso
Conclusiones: El coeficiente del término Q2 no es significativo (su nivel de significación es p= 0,292 > 0,05). Debemos eliminarlo del modelo lineal y volver a estimar los coeficientes.
Para eliminar el término Q2 y rehacer la regresión, con la rutina Regresión de Excel, esnecesario que todos los términos del modelo estén juntos; por tanto hemos de eliminar lacolumna de Q2. Hacerlo así directamente podría ocasionar problemas y modificaciones enotras columnas ligadas a ésta. Para evitarlo recomendamos lo siguiente:
Seleccionar con el ratón desde B1 hasta J63, presionar el botón derecho y hacerCopiar.
Situarse, por ejemplo, en la casilla S1 (fila a partir de la cual todo está vacío) ydesplegar el menú Insertar (figura 3.6).
Fig. 3.6
Seleccionar Pegado especial y ahora ¿¿¿¿Valores (figura 3.7)
Práctica 3. Modelización de una serie con variables categóricas p127
Ahora eliminar la columna asociada a Q2 (la T en el caso del ejemplo): para ello sepincha sobre la letra T distintiva de la columna, que quedará enmarcada por una líneaque parpadea; entonces se presiona el botón derecho y se selecciona Eliminar. Deesta manera las columnas siguientes avanzan un lugar y vuelven a estar todas juntas,es decir, empiezan en la S (valores de Y) y acaban en la Z (valores de t^2)
Y ahora hay que proceder como antes:
Herramientas 6666 Análisis de datos 6666 Regresión
modificando los campos siguientes:
Rango X de entrada: $S$1:$Z$63 (los nuevos regresores)
n Rango de salida $A$150 (una casilla que esté vacía)
Los resultados se pueden ver en la página 133 con el título • Segundo paso
Conclusiones: El modelo definitivo es
Y = 97,81 + 2,03 t + 0,014 t2 − 7,75 Q3 + 20,57 Q
4 + 0,39 t Q
2 + 0,85 t Q
3 + 0,99 t Q
4
• Analizar y comentar los valores de los coeficientes del modelo, su significación y el valordel coeficiente de determinación (R^2) del ajuste.
3.4 Estimaciones y residuos
Valores estimados
Una vez establecido el modelo tenemos que examinar el ajuste entre los datos y los valoresestimados según el modelo ajustado.
Por eso, en primer lugar cogemos un bloque con los términos y los coeficientes del modelodefinitivamente obtenido y hacemos un Cortar y Pegar en L2; en L1 escribimos Modelo:resultarán las casillas destacadas en azul en la página 131.
Después, en N1 escribimos el título de la columna, Yest, y en N2 el modelo, es decir
Debemos destacar la exigencia de fijar las celdas que contienen los coeficientes del modelo,para que al arrastrar la fórmula se mantengan constantes.
Arrastrando la casilla N2 hasta la N63 se obtienen los valores calculados, comoestimaciones de la variable estudiada, que se pueden ver en la página 131.
Gráfico de los valores reales enfrente de los estimados
Es necesario seleccionar desde B2 hasta B63 y, presionando la tecla Ctrl, desde N2 hasta
N63. Después se presiona el icono de los gráficos yAsistente para Gráficos
Líneas(2, 1) Línea con marcadores… Terminar
Situaremos el gráfico como Objeto en la misma hoja, y lo editaremos, en la posición, laamplitud y el estilo deseados. El resultado se puede ver en el segundo gráfico de lapágina 134.
Gráfico de residuos
En primer lugar debemos calcular los residuos; para esto es prepara la columna con eltítulo y se calculan los valores:
O1 : Res O2 = B2 −−−− N2 (arrastrar hasta O63 (página 131))
Para hacer el gráfico se selecciona desde O2 hasta O63, se presiona y
Asistente para GráficosLíneas
(2, 1) Línea con marcadores… Terminar
Situaremos el gráfico como Objeto en la misma hoja, y lo editaremos, en la posición, laamplitud y el estilo deseados. El resultado se puede ver en el primer gráfico de la página135.
Conclusiones: Observar y analizar detalladamente la evolución de los dos gráficos.
3.5 Previsiones
Atendiendo a que, según el correlograma (página 132), se pueden hacer previsiones paralos próximos 5 valores del tiempo, es necesario ampliar las columnas de las variablescategóricas y del tiempo con los 5 valores nuevos, del 63 hasta el 67. Estos valores se hande incorporar al final de la columna A, es decir desde A64 hasta A68 (página 130).
El primer valor para el que hay que hacer previsiones corresponde a t = 63, que es unmúltiple de 4 (15×4 = 60) más 3. Por tanto, la variable categórica Q3 valdrá 1 y las demás 0.Situados en C64 podemos copiar el bloque C4 – E8, que es el de las categóricas que seinicia en una tercera estación. Ahora seleccionaremos con el ratón desde F63 hasta J63 yarrastraremos hasta llenar la fila 68, que corresponde a la última previsión (página 130).
arrastraremos hasta K68 y tendremos los valores de las 5 previsiones (página131).
Para hacer el gráfico se selecciona desde B2 hasta B68 y, presionando el Ctrl, desde K2
hasta K68 y desde N2 hasta N68. Se presiona el icono de los gráficos y
Asistente para GráficosLíneas
(2, 1) Línea con marcadores…Terminar
Situaremos el gráfico como Objeto en la misma hoja, y lo editaremos, en la posición, eltamaño y el estilo deseados. El resultado se puede ver en el segundo gráfico de la página135.
Conclusiones: Analizar detalladamente el gráfico de las observaciones y las previsiones.Pensando que los datos corresponden a un indicador económico medido trimestralmente,comentar su evolución actual y futura así como el comportamiento diferencial propio decada trimestre.
K L M N O231,526 1,234254,283 2,557273,960 -2,600313,863 -2,443245,464 -1,564269,881 -1,461291,520 -0,270332,095 -0,135259,859 -4,399285,935 -2,405309,537 -1,717350,782 3,938274,710 1,870302,445 2,275
PRÁCTICA 4. MODELIZACIÓN Y PREVISIONES POR SUAVIZADO EXPONENCIAL (MÉTODO DE BROWN)
OBJETIVO: Se dispone de la evolución de un indicador económico durante 31 días. Hay queanalizar los datos de esta serie cronológica, estimar el modelo de comportamiento y hacerlas previsiones pertinentes. Todo esto se realizará mediante la hoja de cálculo Excel 97 deMicrosoft.
4.1 Recuperación de los datos
Desde Excel recuperar el archivo que contiene los datos objeto de la práctica, y que seencuentran en el directorio habitual de la red. Para ello, debemos seguir la secuencia (figura4.1)
Archivo 6 Abrir
y ahora ir al directorio donde se encuentra el archivo Práctica 4.xls, seleccionarlo ypresionar Abrir.
Fig. 4.1
Una vez está abierto el archivo, observamos que consta de una hoja denominada Datos con2 columnas de 31 valores cada una y la estructura mostrada en la figura 4.2.La columna A, llamada Tiempo, contiene valores de 1 a 31 y la B, llamada Y, contiene losvalores del índice económico que se está estudiando.
Práctica 4. Modelización y previsiones por suavizado exponencial p137
4.2 Análisis de la evolución de la serie cronológica
En primer lugar, hay que analizar la evolución de la serie: para ello se selecciona desde B1
hasta B32 (valores de Y) y se presiona el icono de gráficos , o también, en la barra deherramientas, Insertar y después Gráfico. En el Asistente para Gráficos (figura 4.3),seleccionar Líneas.
Fig. 4.3
Y ahora la opción (2; 1), es decir, Línea con marcadores en cada valor de datos yTerminar.
Situar el gráfico como Objeto en la misma hoja, y editarlo en la posición y el tamañodeseados.El resultado es el gráfico de la página 142.
Se muestra una tendencia creciente y no parece detectarse ningún tipo de estacionalidad,cosa que se confirmará mediante el correlograma. Este gráfico ha sido el objetivo de lapráctica 2; para obtenerlo copiamos todos los datos de la práctica en una nueva hoja quellamaremos Correl. Aplicando la sistemática se obtienen los resultados mostrados en lapáginas 143 y 144, que confirman la no estacionalidad y la posibilidad de hacer previsionespara los tres próximos días. Se debe recalcar que no se está en las mejores condicionespara hacer un correlograma, porque tan sólo se dispone de 30 valores.
Conclusiones: Sin estacionalidad y con tendencia creciente, se puede estudiar la serieaplicando el suavizado exponencial según el método de Brown que incorpora una tendenciarectilínea y cambiante a lo largo del tiempo.
Para modelizar una serie con este procedimiento hemos de seleccionar un valor delparámetro λ y calcular la serie suavizada, la doble suavizada, la ordenada en el origen, lapendiente, el valor de la serie estimada, el error en cada instante y el error cuadrático medio.Cambiando el valor de λ se repite el proceso y se selecciona, como parámetro demodelización, el que minimice el error cuadrático medio.
Selección de λ
En la casilla A40 escribimos el valor inicial de λ, λ = 0,1 para empezar, y etiquetamos lascolumnas según el contenido que tenemos destinado. Así:
A B C D E F G H I1 Tiempo Y S S(2) a^ b^ Y est Error Y prevista2
Las expresiones utilizadas serán según el texto de series temporales, y su ubicación en lahoja de cálculo será:
casilla Expresión
S1 = Y1
St = λ Yt + ( 1 - λ) St−1
C2
C3
= B2
= $A$40*B3+(1−−−−$A$40)*C2 arrastrar hasta C32
S1
(2) = Y1
St
(2) = λ St + ( 1 - λ) St−1
(2)
D2
D3
= B2
= $A$40*C3+(1−−−−$A$40)*D2 arrastrar hasta D32
(2)t t ta 2S S= − E2 = 2*C2−−−−D2 arrastrar hasta E32
(2)t tb (S S )
1λ
λ= −
− F2 = ($A$40/(1−−−−$A$40))*(C2−−−−D2) arrastrar hasta F32
t t 1 t 1ˆ ˆˆY a b− −= + G3 = E2+F2 arrastrar hasta G32
t t t tR e Y Y= = − H3 = B3−−−−G3 arrastrar hasta H32
La casilla G33 se etiqueta como ECM para escribir en H34 la expresión
Práctica 4. Modelización y previsiones por suavizado exponencial p139
Se deben guardar los valores de cada λλλλ y su ECM, a fin de escoger la óptima. En casillasvacías preparamos una tabla como la que muestra la figura 4.4, donde etiquetamos C40como Lambda y D40 como E.C.M. A continuación escribimos en C41 el valor 0,1 ( λutilizada en los cálculos) y en D41 7,777, valor resultante de ECM según ha salido en lacasilla H34. (Esto lo podemos hacer manualmente o con Cortar y Pegar sólo valores).
Sustituyendo el valor de λ de la casilla A40 por 0,2, automáticamente cambiarán todos losvalores de los cálculos de las columnas C − H. Ahora anotamos 0,2 en C42 y el valor deH34 (2,679 en este caso) en D42.
Sucesivamente se van cambiando los valores de λ (A40) por 0,3,… 0,9, y anotando juntocon sus ECM, desde C43−−−−D43 hasta C49−−−−D49. Con los datos actuales, se detecta que elóptimo estará entre 0,4 y 0,5; por tanto, ponemos 0,45 en A40 y lo pasamos a C50juntamente con su ECM (H34), que en este caso es igual a 1,822 y que anotamos en D50.
Una vez escogida la λ de trabajo, se puede pasar a calcular los valores previstos para lospróximos tres días, según se ha deducido del correlograma. Por eso prolongamos lacolumna A con los tres nuevos valores del tiempo (A33 = 32; A34 =33; A35 = 34).
El valor previsto para el instante t + T (31+T, en el caso de la práctica) es
t T t tˆY a b T+ = +#
En la casilla I33, perteneciente a la columna I etiquetada como Y prevista, se deberáescribir la expresión
y arrastrarla hasta I35. Así acabamos de calcular los valores previstos para los próximos tresdías del índice económico estudiado. Todos los resultados se muestran en la página 141.
Análisis de los gráficos
Seguidamente, y como ya es habitual, se procederá a la obtención del gráfico de los valoresreales, los modelizados y los previstos, y del gráfico de los errores.
Para ello se selecciona, presionando la tecla Ctrl, desde B1 hasta B32 (valores de Y), desdeG1 hasta G32 (valores de Y estimada) y desde I1 hasta I35 (valores de Y prevista), y se
presiona el icono de gráficos , o también, en la barra de herramientas, Insertar ydespués Gráfico.
En el Asistente para Gráficos seleccionar
XY (Dispersión)
(3,1) Dispersión con puntos de datos conectados por líneas
Terminar
Situaremos el gráfico como Objeto en la misma hoja, y lo editaremos en la posición y eltamaño deseados. El resultado es el gráfico de la página 142.
Para obtener el gráfico de los errores se procede seleccionando desde H1 hasta H32(valores de los errores) y exactamente igual que en el gráfico anterior. El resultado es elgráfico de la página 143.
Conclusiones: Las previsiones siguen muy bien todos los datos, a lo largo del tiempo derecogida de información. Los errores no muestran ninguna particularidad destacable.