Top Banner
STATGRAPHICS – Rev. 4/25/2007 ©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 1 Series de Tiempo – Métodos Descriptivos Resumen El procedimiento de Métodos Descriptivos crea varias tablas y gráficas para datos de series de tiempo. Una serie de tiempo consiste en un conjunto datos numéricos secuenciales tomados en intervalos de tiempo igualmente espaciados, usualmente sobre un período de tiempo o espacio. El procedimiento grafica los datos y muestra las autocorrelaciones, autocorrelaciones parciales y el periodograma de la muestra. Se realizan pruebas para determinar si las observaciones podrían ser muestras de un proceso aleatorio o “ruido blanco”. Si se aporta una segunda serie de tiempo, también se calculan y se muestran las correlaciones cruzadas entre las dos series. StatFolio de Muestra: tsdescribe.sgp Datos Muestrales: El archivo golden gate.sf6 contiene volúmenes del tráfico mensual del puente Golden Gate en San Francisco para un período de n = 168 meses desde enero de 1968 hasta diciembre de 1981. La tabla de abajo muestra una lista parcial de los datos de ese archivo: Month Traffic 1/68 73.637 2/68 77.136 3/68 81.481 4/68 84.127 5/68 84.562 6/68 91.959 7/68 94.174 8/68 96.087 9/68 88.952 10/68 83.479 11/68 80.814 12/68 77.466 1/69 75.225 Los datos fueron obtenidos de una publicación del Puente Golden Gate.
24

Series de Tiempo – Métodos Descriptivos · STATGRAPHICS – Rev. 4/25/2007 ©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 1 Series de Tiempo – Métodos

Sep 21, 2018

Download

Documents

ngodieu
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Series de Tiempo – Métodos Descriptivos · STATGRAPHICS – Rev. 4/25/2007 ©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 1 Series de Tiempo – Métodos

STATGRAPHICS – Rev. 4/25/2007

©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 1

Series de Tiempo – Métodos Descriptivos Resumen El procedimiento de Métodos Descriptivos crea varias tablas y gráficas para datos de series de tiempo. Una serie de tiempo consiste en un conjunto datos numéricos secuenciales tomados en intervalos de tiempo igualmente espaciados, usualmente sobre un período de tiempo o espacio. El procedimiento grafica los datos y muestra las autocorrelaciones, autocorrelaciones parciales y el periodograma de la muestra. Se realizan pruebas para determinar si las observaciones podrían ser muestras de un proceso aleatorio o “ruido blanco”. Si se aporta una segunda serie de tiempo, también se calculan y se muestran las correlaciones cruzadas entre las dos series. StatFolio de Muestra: tsdescribe.sgp Datos Muestrales: El archivo golden gate.sf6 contiene volúmenes del tráfico mensual del puente Golden Gate en San Francisco para un período de n = 168 meses desde enero de 1968 hasta diciembre de 1981. La tabla de abajo muestra una lista parcial de los datos de ese archivo:

Month Traffic 1/68 73.637 2/68 77.136 3/68 81.481 4/68 84.127 5/68 84.562 6/68 91.959 7/68 94.174 8/68 96.087 9/68 88.952 10/68 83.479 11/68 80.814 12/68 77.466 1/69 75.225 … …

Los datos fueron obtenidos de una publicación del Puente Golden Gate.

Page 2: Series de Tiempo – Métodos Descriptivos · STATGRAPHICS – Rev. 4/25/2007 ©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 1 Series de Tiempo – Métodos

STATGRAPHICS – Rev. 4/25/2007

©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 2

Captura de Datos El cuadro de diálogo de captura de datos requiere el nombre de la columna que contiene los datos de series de tiempo:

• Datos: columna numérica que contiene n observaciones igualmente espaciadas.

• Intervalo de Muestreo: define el intervalo entre observaciones sucesivas. Por ejemplo, los datos del Puente Golden Gate fueron recabados una vez al mes, iniciando en enero de 1968.

• Estacionalidad: la amplitud de la estacionalidad s, si la hay. Los datos son estacionales si existe un patrón que se repite en un período de tiempo fijo. Por ejemplo, los datos mensuales como el tráfico en el puente Golden Gate tienen una estacionalidad de s = 12. Los datos por hora que se repiten todos los días tienen una estacionalidad de s = 24. Si no se introduce nada, se asume que los datos no tienen estacionalidad (s = 1).

• Ajuste por Jornadas Financieras: una variable numérica con n observaciones usadas para normalizar las observaciones originales tales como el número de días laborales en un mes. Las observaciones en la columna Datos serán divididas por estos valores antes de ser graficadas o analizadas.

• Selección: selecciona el subconjunto.

Page 3: Series de Tiempo – Métodos Descriptivos · STATGRAPHICS – Rev. 4/25/2007 ©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 1 Series de Tiempo – Métodos

STATGRAPHICS – Rev. 4/25/2007

©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 3

Resumen del Análisis El Resumen del Análisis muestra el número de observaciones en la serie de tiempo y la amplitud de la estacionalidad: Métodos Descriptivos - Traffic Datos/Variable: Traffic (Golden Gate Bridge Traffic Volume) Número de observaciones = 168 Indice Inicial = 1/68 Intervalo de Muestra = 1.0 mes(es) Longitud de la estacionalidad = 12

Nota: una cantidad limitada de datos faltantes está permitida, siempre que no haya demasiados valores faltantes juntos. Los valores faltantes son reemplazados por valores interpolados de acuerdo con el método señalado en la sección Cálculos.

Tabla de Datos La Tabla de Datos despliega la captura de datos:

Tabla de Datos para Traffic Periodo Datos Ajustados 1/68 73.637 1.8671 2/68 77.136 1.88726 3/68 81.481 1.91106 4/68 84.127 1.92494 5/68 84.562 1.92718 6/68 91.959 1.96359 7/68 94.174 1.97393 8/68 96.087 1.98266 9/68 88.952 1.94916 10/68 83.479 1.92158 11/68 80.814 1.90749 12/68 77.466 1.88911 … … …

• Periodo: el índice de la muestra t. • Datos: la observación yt. • Ajustados: los datos ajustados ty′ , si un ajuste ha sido especificado usando Opciones

de Análisis.

Opciones de Análisis Opciones de Análisis permite que los datos sean transformados antes de que sean graficados o analizados:

Page 4: Series de Tiempo – Métodos Descriptivos · STATGRAPHICS – Rev. 4/25/2007 ©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 1 Series de Tiempo – Métodos

STATGRAPHICS – Rev. 4/25/2007

©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 4

• Matemática: transforma los datos mediante la realización de la operación matemática

indicada. Con excepción de la transformación de Box-Cox, las selecciones son auto explicatorias. La transformación de Box-Cox es usada cuando es necesario que los datos sean más Gaussianos. Para una discusión detallada, ver la documentación para el procedimiento Transformaciones de Box-Cox.

• Estacional: ajuste estacional de datos usando el método indicado. Los ajustes

estacionales están diseñados para remover cualquier componente estacional de los datos. Los métodos usados son discutidos en la documentación para el procedimiento Descomposición Estacional.

• Tendencia: remueve una tendencia ajustando y substrayendo el tipo de tendencia

indicado. Los datos transformados son los residuos de la línea de tendencia. Las ecuaciones para cada tipo de tendencia es discutida en la documentación para el procedimiento Predicción.

• Diferenciación: transforma los datos al tomar las diferencias no estacionales de orden

d y/o las diferencias estacionales de orden D. La Diferenciación es usada algunas veces para estabilizar una serie de tiempo no estacionaria que no tiene una media constante. Una diferencia no estacional de orden d es creada al substraer consecutivas observaciones d veces. Por ejemplo, la primera diferencia (d = 1) es dada por:

1−−=′ ttt yyy (1)

Mientras que una segunda diferencia (d = 2) está dada por:

Page 5: Series de Tiempo – Métodos Descriptivos · STATGRAPHICS – Rev. 4/25/2007 ©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 1 Series de Tiempo – Métodos

STATGRAPHICS – Rev. 4/25/2007

©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 5

( ) ( )211 −−− −−−=′ ttttt yyyyy (2)

Una diferencia estacional de orden 1 (D = 1) está dada por:

sttt yyy −−=′ 3)

Una diferencia estacional de orden 2 (D = 2) está dada por:

( ) ( )stststtt yyyyy 2−−− −−−=′ (4)

• Inflación: ajusta los datos por la inflación usando la tasa de inflación especificada

λ. Aplicada al inicio del período, el ajuste es:

( ) )1( 01 +−+=′

ttt

ty

(5)

Donde t0 es el índice de la primera observación. Si se aplica a la mitad del período, el ajuste es:

)5.0( 0)1( +−+=′

ttt

ty

(6)

Si más de una transformación es requerida, éstas serán aplicadas en el siguiente orden:

1. Ajuste de días hábiles 2. ajuste por inflación 3. ajuste matemático 4. ajuste estacional 5. ajuste de tendencia 6. diferenciación

Gráfica de Secuencia de Tiempo Horizontal La Gráfica de Secuencia de Tiempo Horizontal muestra los datos de la serie de tiempo en orden secuencial:

Page 6: Series de Tiempo – Métodos Descriptivos · STATGRAPHICS – Rev. 4/25/2007 ©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 1 Series de Tiempo – Métodos

STATGRAPHICS – Rev. 4/25/2007

©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 6

Gráfica de Serie de Tiempo para Traffic

1/68 1/71 1/74 1/77 1/80 1/8373

83

93

103

113

Traf

fic

Los datos del tráfico contienen algunas características muy interesantes:

1. Una tendencia general ascendente. 2. Una ciclicidad regular anual alrededor de la tendencia, con un pico en el tráfico

que ocurre en los meses de verano. 3. Dramáticos cambios a la línea de tendencia ocurriendo a finales de 1973, cuando

el embargo al petróleo de Arabia convirtió a la gasolina en un bien difícil de conseguir. Un suceso similar pero menos dramático ocurrió durante 1978.

Opciones de Cuadro

• Puntos: grafica símbolos de puntos en cada observación. • Líneas: conecta las observaciones con una línea.

Gráfica de Secuencia de Tiempo Vertical La Gráfica de Secuencia de Tiempo Vertical muestra la serie de tiempo dibujando líneas verticales desde una línea base para cada observación:

Page 7: Series de Tiempo – Métodos Descriptivos · STATGRAPHICS – Rev. 4/25/2007 ©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 1 Series de Tiempo – Métodos

STATGRAPHICS – Rev. 4/25/2007

©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 7

Gráfica de Serie de Tiempo para Traffic

1/68 1/71 1/74 1/77 1/80 1/8373

83

93

103

113

Traf

fic

Opciones de Cuadro

• Línea base: posición de la cual las líneas verticales son dibujadas.

Autocorrelaciones Una herramienta importante en la modelación de datos de series de tiempo es la función de autocorrelación. La autocorrelación en el rezago k mide la fuerza de la correlación entre las observaciones durante k períodos de tiempo. La autocorrelación muestral del rezago k se calcula de la siguiente manera:

( )( )

( )∑

=

=+

−−= n

tt

kn

tktt

k

yy

yyyyr

1

2

1 (7)

Page 8: Series de Tiempo – Métodos Descriptivos · STATGRAPHICS – Rev. 4/25/2007 ©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 1 Series de Tiempo – Métodos

STATGRAPHICS – Rev. 4/25/2007

©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 8

El cuadro de Autocorrelaciones muestra las autocorrelaciones muestrales junto con los errores estándar de los rezagos grandes y los límites de probabilidad: Autocorrelaciones Estimadas para Traffic Límite en 95.0% Límite en 95.0% Retraso Autocorrelación Error Estd. Inferior Superior 1 0.840362 0.0771517 -0.151215 0.151215 2 0.601514 0.119832 -0.234866 0.234866 3 0.329537 0.136627 -0.267785 0.267785 4 0.0932316 0.141279 -0.276902 0.276902 5 -0.108987 0.141645 -0.277619 0.277619 6 -0.169318 0.142143 -0.278596 0.278596 7 -0.11148 0.143339 -0.280939 0.280939 8 0.0723794 0.143854 -0.281949 0.281949 9 0.274421 0.14407 -0.282373 0.282373 10 0.490762 0.147149 -0.288407 0.288407 11 0.664932 0.156589 -0.306909 0.306909 12 0.735963 0.172579 -0.338249 0.338249 13 0.618444 0.190346 -0.373072 0.373072 14 0.411699 0.201953 -0.395821 0.395821 15 0.173765 0.206888 -0.405494 0.405494 16 -0.0384742 0.207755 -0.407193 0.407193 17 -0.219497 0.207797 -0.407276 0.407276 18 -0.280273 0.209173 -0.409972 0.409972 19 -0.229326 0.211397 -0.41433 0.41433 20 -0.0606596 0.212872 -0.417223 0.417223 21 0.126304 0.212975 -0.417424 0.417424 22 0.338969 0.21342 -0.418297 0.418297 23 0.506746 0.216601 -0.424532 0.424532 24 0.580971 0.223547 -0.438145 0.438145 El error estándar para rk es calculado con el supuesto de que las autocorrelaciones han “desaparecido” por el rezago k y son iguales a 0 en todos los rezagos mayores o iguales a k. El error estándar se calcula de la siguiente manera:

⎭⎬⎫

⎩⎨⎧

+= ∑−

=

1

1

2211][k

ikk r

nrse (8)

Este error estándar se usa para calcular 100(1-α)% límites de probabilidad alrededor de cero, usando un valor crítico de la distribución normal estándar: ][0 2/ krsezα± (9) Si α = 0.05, las autocorrelaciones muestrales que caen fuera de esos límites son estadísticamente significativamente diferente de 0 en un nivel de significancia de 5%. El StatAdvisor señala ese tipo de autocorrelaciones con rojo. Para los datos del tráfico, note que hay valores significativos para los 3 primeros rezagos y también en la vecindad de s = 12 y 2s = 24. Los valores significativos en los primeros

Page 9: Series de Tiempo – Métodos Descriptivos · STATGRAPHICS – Rev. 4/25/2007 ©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 1 Series de Tiempo – Métodos

STATGRAPHICS – Rev. 4/25/2007

©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 9

rezagos ocurren porque existen observaciones cercanas en el tiempo que están correlacionadas. Los rezagos significativos alrededor de 12 y 24 son causados por el fuerte patrón estacional. Cuadro de Opciones

• Número de retrasos: máximo rezago k para calcular la autocorrelación. • Nivel de Confianza: valor de 100(1-α)% usado para calcular los límites de

probabilidad.

Función de Autocorrelación La gráfica de Función de Autocorrelation muestra las autocorrelacionadas muestrales y los límites de probabilidad:

Autocorrelaciones Estimadas para Traffic

0 5 10 15 20 25retraso

-1

-0.6

-0.2

0.2

0.6

1

Aut

ocor

rela

cion

es

Page 10: Series de Tiempo – Métodos Descriptivos · STATGRAPHICS – Rev. 4/25/2007 ©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 1 Series de Tiempo – Métodos

STATGRAPHICS – Rev. 4/25/2007

©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 10

Las barras que se extienden más allá de los límites superior e inferior corresponden a autocorrelaciones estadísticamente significativas.

Autocorrelaciones Parciales Otra importante herramienta en la modelación de datos de series de tiempo es la función de autcorrelación parcial. Las autocorrelaciones parciales son usadas para ayudar a identificar el orden adecuado del modelo autorregresivo para usar en la descripción de la serie de tiempo observada. La autocorrelación parcial kkφ̂ del rezago muestral k se calcula como se describe en la sección de Cálculos. El cuadro de Autocorrelaciones Parciales muestra las autocorrelaciones parciales muestrales junto con errores estándar de rezagos grandes y límites de probabilidad:

Autocorrelaciones Parciales Estimadas para Traffic Parcial Límite en 95.0% Límite en 95.0% Retraso Autocorrelación Error Estd. Inferior Superior 1 0.840362 0.0771517 -0.151215 0.151215 2 -0.356356 0.0771517 -0.151215 0.151215 3 -0.220746 0.0771517 -0.151215 0.151215 4 -0.0325883 0.0771517 -0.151215 0.151215 5 -0.132289 0.0771517 -0.151215 0.151215 6 0.294114 0.0771517 -0.151215 0.151215 7 0.174468 0.0771517 -0.151215 0.151215 8 0.309939 0.0771517 -0.151215 0.151215 9 0.0754963 0.0771517 -0.151215 0.151215 10 0.219082 0.0771517 -0.151215 0.151215 11 0.252541 0.0771517 -0.151215 0.151215 12 0.0188762 0.0771517 -0.151215 0.151215 13 -0.267034 0.0771517 -0.151215 0.151215 14 -0.0880152 0.0771517 -0.151215 0.151215 15 -0.00778138 0.0771517 -0.151215 0.151215 16 -0.023474 0.0771517 -0.151215 0.151215 17 -0.137019 0.0771517 -0.151215 0.151215 18 -0.0313481 0.0771517 -0.151215 0.151215 19 -0.0791926 0.0771517 -0.151215 0.151215 20 0.0714297 0.0771517 -0.151215 0.151215 21 -0.0340022 0.0771517 -0.151215 0.151215 22 0.12536 0.0771517 -0.151215 0.151215 23 0.0894574 0.0771517 -0.151215 0.151215 24 0.0420213 0.0771517 -0.151215 0.151215

El error estándar para kkφ̂ es calculado a partir de:

nse kk

1]ˆ[ =φ (10)

Page 11: Series de Tiempo – Métodos Descriptivos · STATGRAPHICS – Rev. 4/25/2007 ©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 1 Series de Tiempo – Métodos

STATGRAPHICS – Rev. 4/25/2007

©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 11

Este error estándar se usa para calcular 100(1-α)% límites de probabilidad alrededor de cero, usando un valor crítico de la distribución normal estándar: ]ˆ[0 2/ kksez φα± (11) Si α = 0.05, cualquiera de las autocorrelaciones parciales muestrales que caen fuera de estos límites son estadísticamente significativamente diferente de 0 a un nivel de significancia de 5%. El StatAdvisor señala cualquier autocorrelación parcial de ese tipo con rojo. Para los datos del tráfico, note que existen valores significativos a lo largo de los primeros 13 rezagos. Esto implica que se necesitaría un modelo autorregresivo más complicado para describir los datos observados, lo cual no sería sorprendente dada su naturaleza (tendencia) no estacionaria. Cuadro de Opciones

• Número de retrasos: máximo rezago k para calcular la autocorrelación parcial. • Nivel de Confianza: valor de 100(1-α)% usado para calcular los límites de

probabilidad.

Función de Autocorrelación Parcial La Función Parcial de Autocorrelación grafica las autocorrelaciones parciales muestrales y los límites de probabilidad:

Page 12: Series de Tiempo – Métodos Descriptivos · STATGRAPHICS – Rev. 4/25/2007 ©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 1 Series de Tiempo – Métodos

STATGRAPHICS – Rev. 4/25/2007

©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 12

Autocorrelaciones Parciales Estimadas para Traffic

0 5 10 15 20 25retraso

-1

-0.6

-0.2

0.2

0.6

1A

utoc

orre

laci

ones

Par

cial

es

Las barras que se extienden más allá de los límites superior o inferior corresponden a autocorrelaciones parciales significativas.

Periodograma Las autocorrelaciones y autocorrelaciones parciales describen el comportamiento de los datos en el dominio del tiempo, por ejemplo, al estimar estadísticos basados en un espacio del tiempo entre observaciones. También es útil examinar los datos en el dominio de la frecuencia al considerar qué tanta variabilidad existe en diferentes frecuencias. Se ha demostrado que cualquier serie de tiempo discreta puede ser representada como la suma de un conjunto de senos y cosenos en un conjunto de frecuencias llamadas frecuencias de Fourier. Un típico componente tiene la forma:

( ) ( )tfbtfa iiii ππ 2sin2cos + (12)

donde fi es la i-ésima frecuencia de Fourier. La i-ésima frecuencia de Fourier es

nifi = (13)

Para i = 0, 1, …, n/2 si n es par y i = 0, 1, …, (n-1)/2 si n es impar. El periodograma calcula la potencia de los datos en cada frecuencia de Fourier al calcular:

( ) ( )22

2 iii banfI += (14)

Page 13: Series de Tiempo – Métodos Descriptivos · STATGRAPHICS – Rev. 4/25/2007 ©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 1 Series de Tiempo – Métodos

STATGRAPHICS – Rev. 4/25/2007

©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 13

El cual se mide de acuerdo con una escala tal que la suma de las ordenadas del periodograma a través de todas las frecuencias de Fourier excepto para i = 0, arroja la suma de las desviaciones cuadradas de la serie de tiempo alrededor de su media, por

ejemplo ( )∑=

−n

ii yy

1

2 . En efecto, el periodograma genera un análisis de varianza por

frecuencia. El cuadro del periodograma muestra la siguiente tabla:

Periodograma para Traffic Suma Periodograma i Frecuencia Periodo Ordenada Acumulada Integrado 0 0.0 1.57558E-23 1.57558E-23 1.66608E-27 1 0.00595238 168.0 1387.62 1387.62 0.146731 2 0.0119048 84.0 866.251 2253.87 0.238332 3 0.0178571 56.0 465.451 2719.32 0.28755 4 0.0238095 42.0 90.789 2810.11 0.297151 5 0.0297619 33.6 447.388 3257.5 0.344459 6 0.0357143 28.0 68.8937 3326.39 0.351744 7 0.0416667 24.0 60.3328 3386.72 0.358124 8 0.047619 21.0 28.0432 3414.77 0.361089 9 0.0535714 18.6667 36.3759 3451.14 0.364936 10 0.0595238 16.8 61.0357 3512.18 0.37139 11 0.0654762 15.2727 40.4935 3552.67 0.375672 12 0.0714286 14.0 24.073 3576.74 0.378217 13 0.077381 12.9231 1.28899 3578.03 0.378354 14 0.0833333 12.0 4968.08 8546.11 0.903696 15 0.089285157 1511.2 30.471915 8576.58 0.906918 … … … … … …

La tabla incluye: • Frecuencia: la i-ésima frecuencia de Fourier fi = i/n. • Periodo: el periodo asociado por la frecuencia de Fourier dado por 1/ fi. Este es el

número de observaciones en un ciclo completo en esa frecuencia. • Ordenada: la ordenada del periodograma I(fi). • Suma Acumulada: la suma de las ordenadas del periodograma en todas las

frecuencias hasta e incluyendo la i-ésima. • Periodograma Integrado: la suma acumulada dividida entre la suma las ordenadas

del periodograma en todas las frecuencias de Fourier. Esta columna representa la proporción de la potencia en la serie de tiempo en o debajo de la i-ésima frecuencia.

Por ejemplo, la frecuencia 14a de Fourier corresponde a una oscilación con un periodo de 12 meses. Hay una ordenada muy grande en esa frecuencia porque los datos tienden a subir y caer sobre una base anual. Si se fuera a ajustar un modelo de regresión en esa frecuencia, tomaría la forma:

Page 14: Series de Tiempo – Métodos Descriptivos · STATGRAPHICS – Rev. 4/25/2007 ©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 1 Series de Tiempo – Métodos

STATGRAPHICS – Rev. 4/25/2007

©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 14

tt etbtacY +⎟⎠⎞

⎜⎝⎛+⎟

⎠⎞

⎜⎝⎛+=

122sin

122cos ππ (15)

donde c es una constante y et es el término de error. Ajustando este modelo usando el procedimiento Regresión Múltiple arroja:

⎟⎠⎞

⎜⎝⎛+⎟

⎠⎞

⎜⎝⎛−=

122sin89233.5

122cos94209.49783.93ˆ ttYt

ππ (16)

Un diagrama de puntos de éste modelo se muestra abajo:

Gráfico X-Y Múltiple

1/68 1/71 1/74 1/77 1/80 1/83Month

73

83

93

103

113 VariablesRegressionTraffic

Note qué tanto de la variabilidad ha sido explicada por aquel simple componente. Cuadro de Opciones

• Remover media: verifica para sustraer la media de la serie de tiempo antes de

calcular el periodograma. Si la media no es removida, la ordenada en i = 0 será probablemente muy grande.

Page 15: Series de Tiempo – Métodos Descriptivos · STATGRAPHICS – Rev. 4/25/2007 ©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 1 Series de Tiempo – Métodos

STATGRAPHICS – Rev. 4/25/2007

©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 15

• Menguar: porcentaje de los datos en cada final de la serie de tiempo en el cual un grabador de datos será aplicado antes de que el periodograma sea calculado. Siguiendo a Bloomfield (2000), STATGRAPHICS usa un ajustador de coseno que disminuye la importancia de las observaciones cercanas a i = 1 y i = n. Esto es útil para corregir el sesgo si las ordenadas del periodograma van a ser suavizadas para crear una estimación de la función de densidad espectral subyacente.

Gráfica de Periodograma La Gráfica de Periodograma muestra las ordenadas del periodograma:

Periodograma para Traffic

0 0.1 0.2 0.3 0.4 0.5frecuencia

0

1

2

3

4

5(X 1000.0)

Ord

enad

a

Note un pico enorme en la frecuencia 1/12 meses. Dos pequeñas elevaciones pueden ser observadas en el primer y segundo armónicos (2/12 y 3/12) porque la oscilación estacional no es puramente senoidal. Existe también alguna potencia en las frecuencias muy pequeñas, causado por las tendencias y cambios repentinos en la serie de tiempo del tráfico. Cuadro de Opciones

Page 16: Series de Tiempo – Métodos Descriptivos · STATGRAPHICS – Rev. 4/25/2007 ©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 1 Series de Tiempo – Métodos

STATGRAPHICS – Rev. 4/25/2007

©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 16

• Remover media: verifica para substraer la media de la serie de tiempo antes de calcular el periodograma.

• Puntos: si es verificado, serán mostrados símbolos de puntos. • Líneas: si es verificado, las ordenadas serán conectadas por una línea. • Menguar: porcentaje de los datos en cada final de la serie de tiempo en los cuales un

ajustador de datos será aplicado antes de que el periodograma sea calculado.

Periodograma Integrado El Periodograma Integrado muestra las sumas acumuladas de las ordenadas del periodograma divididas entre la suma de las ordenadas de todas las frecuencias de Fourier:

Periodograma para Traffic

0 0.1 0.2 0.3 0.4 0.5frecuencia

0

0.2

0.4

0.6

0.8

1

Ord

enad

a

Se incluye una línea diagonal sobre la gráfica junto con bandas de Kolmogorov de 95% y 99%. Si la serie de tiempo es puramente aleatoria, el periodograma integrado debería caer dentro de esas bandas el 95% y 99% del tiempo. Para los datos del tráfico, es seguro concluir que los datos no forman una serie de tiempo aleatoria.

Page 17: Series de Tiempo – Métodos Descriptivos · STATGRAPHICS – Rev. 4/25/2007 ©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 1 Series de Tiempo – Métodos

STATGRAPHICS – Rev. 4/25/2007

©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 17

Prueba para Aleatoriedad El cuadro de Pruebas para Aleatoriedad muestra los resultados de pruebas adicionales realizadas para determinar si o no la serie de tiempo es puramente aleatoria:

Prueba de Aleatoriedad de Traffic (1) Corridas arriba o abajo de la mediana Mediana = 94.323 Número de corridas arriba o abajo de la mediana = 32 Número esperado de corridas = 85.0 Estadístico z para muestras grandes = 8.12529 Valor-P = 4.44089E-16 (2) Corridas arriba y abajo Número de corridas arriba y abajo = 47 Número esperado de corridas = 111.667 Estadístico z para muestras grandes = 11.8052 Valor-P = 0.0 (3) Prueba Box-Pierce Prueba basada en las primeras 24 autocorrelaciones Estadístico de prueba para muestras grandes = 677.926 Valor-P = 0.0

Se realizan tres pruebas:

1. Corridas arriba y debajo de la mediana: calcula el número de veces que la serie va arriba o debajo de su mediana. Este número es comparado con el valor esperado para una serie de tiempo aleatoria. Una serie con tendencia como la de los datos del tráfico, es probable que muestre significativamente menos corridas a las esperadas. Pequeños P-values (menos que 0.05 si se opera en un nivel de significancia de 5%) indican que la serie de tiempo no es puramente aleatoria.

2. Corridas arriba y abajo: calcula el número de veces que la serie sube y baja. Éste

número se compara con el valor esperado para una serie de tiempo aleatoria. Una serie con fuerte oscilación, tal como los datos del tráfico, es muy probable de mostrar significativamente menos corridas que las esperadas. Pequeños P-values indican que la serie de tiempo no es puramente aleatoria.

3. Prueba de Box-Pierce: construye una prueba estadística basada en las primeras k

autocorrelaciones muestrales al calcular:

∑=

=k

iirnQ

1

2 (17)

Éste estadístico se compara con una distribución chi-cuadrada con k grados de libertad. Como con las otras dos pruebas, pequeños P-values indican que la serie de tiempo no es puramente aleatoria.

Page 18: Series de Tiempo – Métodos Descriptivos · STATGRAPHICS – Rev. 4/25/2007 ©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 1 Series de Tiempo – Métodos

STATGRAPHICS – Rev. 4/25/2007

©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 18

Nuevamente, no hay alguna duda de que la serie de tráfico contiene una estructura no aleatoria significativa. Cuadro de Opciones

• Número de retrasos: número de rezagos k para incluir en la prueba de Box-Pierce.

Correlaciones Cruzadas El cuadro de Correlaciones Cruzadas muestra correlaciones cruzadas entre la serie de tiempo principal y la segunda serie especificada usando las Opciones de Cuadro. Las correlaciones cruzadas entre una serie de tiempo Y en el tiempo t y una segunda serie de tiempo X en el tiempo t-k se denota como cxy(k). Un uso típico de las correlaciones cruzadas es en la identificación de “indicadores principales” o en una relación insumo-producto. Por ejemplo, Box, Jenkins y Reinsel (1994) presentan datos de insumo y producto de un horno de gas en intervalos de 9 segundos los cuales se encuentran en el archivo furnace.sf6. Los datos consisten en:

1. Serie de producto Y: % Co2 en el gas obtenido 2. Serie de insumo X: tasa de gas introducido en pies cúbicos por minuto

La tabla de correlaciones cruzadas se muestra abajo: Correlaciones Cruzadas Estimadas para Output con Input Retraso Correlación Cruzada -8 -0.179456 -7 -0.206068 -6 -0.226716 -5 -0.242871 -4 -0.260351 -3 -0.286432 -2 -0.328542 -1 -0.393467 0 -0.484451 1 -0.598405 2 -0.725033 3 -0.84282 4 -0.924592 5 -0.95032 6 -0.914593 7 -0.82932 8 -0.71652

Page 19: Series de Tiempo – Métodos Descriptivos · STATGRAPHICS – Rev. 4/25/2007 ©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 1 Series de Tiempo – Métodos

STATGRAPHICS – Rev. 4/25/2007

©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 19

Algunas correlaciones negativas grandes son notables, con un pico en k = 5. Esto sugiere que los incrementos en el insumo tasa de gas usado causan decrementos en el % de Co2 en la tasa de gas obtenido con un pico alrededor de 45 segundos después. Cuadro de Opciones

• Segunda Serie de Tiempo: las observaciones para la serie de tiempo X. • Número de rezagos: máximo rezago k (positivo y negativo) en el cual se calculan las

correlaciones cruzadas.

Gráfica de Correlaciones Cruzadas La Gráfica de correlaciones cruzadas muestra las correlaciones cruzadas estimadas:

Correlaciones Cruzadas Estimadas para Output con Input

-25 -15 -5 5 15 25retraso

-1

-0.6

-0.2

0.2

0.6

1

Cor

rela

cion

es C

ruza

das

Page 20: Series de Tiempo – Métodos Descriptivos · STATGRAPHICS – Rev. 4/25/2007 ©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 1 Series de Tiempo – Métodos

STATGRAPHICS – Rev. 4/25/2007

©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 20

Note las correlaciones negativas grandes en los rezagos positivos.

Guardar Resultados Los siguientes resultados pueden ser guardados en la hoja de base de datos:

1. Datos – las observaciones originales junto con cualquier valor interpolado reemplazado para los datos faltantes.

2. Datos Ajustados – datos de la serie de tiempo después que cualquier ajuste se

haya hecho.

3. Etiquetas de periodo – identificación del tiempo t para cada observación.

4. Autocorrelaciones – autocorrelaciones muestrales.

5. Autocorrelaciones parciales – autocorrelaciones parciales muestrales.

6. Correlaciones cruzadas – correlaciones cruzadas muestrales.

7. Ordenadas de Periodograma –ordenadas del periodograma calculadas.

8. Frecuencias de Fourier – Frecuencias de Fourier que corresponden a las ordenadas del periodograma.

Page 21: Series de Tiempo – Métodos Descriptivos · STATGRAPHICS – Rev. 4/25/2007 ©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 1 Series de Tiempo – Métodos

STATGRAPHICS – Rev. 4/25/2007

©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 21

Cálculos Datos Faltantes Un limitado número de datos faltantes está permitido, mientras no haya muchos valores faltantes que se encuentren cerca. Antes que los datos sean analizados, los valores faltantes son reemplazados por valores interpolados, los cuales son determinados de acuerdo con la siguiente regla:

1. Si yt, la observación en el tiempo t, falta, encuentre las dos observaciones en la misma estacionalidad que preceden el tiempo t (yt-s y yt-2s) y las dos observaciones en la misma estacionalidad que vienen después del tiempo t (yt+s y yt+2s).

2. Si ninguna de las cuatro observaciones falta, entonces el valor de reemplazo para

yt es:

18312123 22 stststst

tyyyy

y ++−− −++−= (18)

3. Si yt+2s falta pero los otros tres no, entonces el valor de reemplazo para yt es:

332 ststst

tyyy

y +−− ++−= (19)

4. Si yt+s está faltando pero los otros tres no, entonces el valor de reemplazo para yt

es:

683 2 ststst

tyyy

y +−− ++−= (20)

5. Si yt+s está faltando pero los otros tres no, entonces el valor de reemplazo para yt es:

638 22 ststst

tyyy

y ++− −+= (21)

6. Si yt-2s está faltando pero los otros tres no, entonces el valor de reemplazo para yt

es:

33 ststst

tyyy

y ++− −+= (22)

7. Si yt+s y yt+2s están faltando pero los otros dos no, entonces el valor de reemplazo

para yt es:

Page 22: Series de Tiempo – Métodos Descriptivos · STATGRAPHICS – Rev. 4/25/2007 ©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 1 Series de Tiempo – Métodos

STATGRAPHICS – Rev. 4/25/2007

©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 22

ststt yyy −− +−= 22 (23)

8. Si yt-s y yt+2s están faltando pero los otros dos no, entonces el valor de reemplazo

para yt es:

322 stst

tyy

y +− += (24)

9. Si yt-s y yt+s están faltando pero los otros dos no, entonces el valor de reemplazo

para yt es:

222 stst

tyy

y +− += (25)

10. Si yt-2s y yt+2s están faltando pero los otros dos no, entonces el valor de reemplazo

para yt es:

2stst

tyy

y +− += (26)

11. Si yt-2s y yt+s están faltando pero los otros dos no, entonces el valor de reemplazo

para yt es:

32 2stst

tyy

y +− += (27)

12. Si yt-2s y yt-s están faltando pero los otros dos no, entonces el valor de reemplazo

para yt es:

ststt yyy 22 ++ −= (28) Si más de 2 de las cuatro observaciones están faltando, un mensaje de error será mostrado y el análisis no será realizado. Los valores interpolados están diseñados para reproducir perfectamente una tendencia cuadrática (si solamente una de las observaciones falta) o una tendencia lineal (si faltan dos observaciones), siempre que no haya ruido presente.

Page 23: Series de Tiempo – Métodos Descriptivos · STATGRAPHICS – Rev. 4/25/2007 ©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 1 Series de Tiempo – Métodos

STATGRAPHICS – Rev. 4/25/2007

©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 23

Autocorrelaciones Parciales

⎪⎪⎪

⎪⎪⎪

−=

∑−

=−

=−−

1

1,1

1

1,1

1

ˆ1

ˆˆ

k

jjjk

k

jjkjkk

kk

r

rr

r

φ

φφ para 1

1

>

=

k

k

(29)

donde

jkkkkjkkj −−− −= ,1,1ˆˆˆˆ φφφφ para j = 1, 2, …, k-1

(30) Pruebas de Corridas Refiérase a la documentación para el procedimiento Cuadros de Rachas o Corridas. Correlaciones Cruzadas

yx

xyxy ss

kckr

)()( = (31)

donde

( )( )∑−

=+ −−=

kn

tkttxy yyxx

nkc

1

1)( para k = 0, 1, 2, … (32)

( )( )∑+

=− −−=

kn

tkttxy xxyy

nkc

1

1)( para k = 0, -1, -2, … (33)

n

xx

n

tt∑

== 1 (34)

n

yy

n

tt∑

== 1 (35)

Page 24: Series de Tiempo – Métodos Descriptivos · STATGRAPHICS – Rev. 4/25/2007 ©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 1 Series de Tiempo – Métodos

STATGRAPHICS – Rev. 4/25/2007

©2006 por StatPoint, Inc. Series de Tiempo – Métodos Descriptivos - 24

)0(xxx cs = (36)

)0(yyy cs = (37)