EVALUACIÓN DE AUTOCORRELACIÓN ESPACIAL GLOBAL Y LOCAL PARA ZONAS DE TRANSITO JULIO CESAR LAVADO YARASCA Universidad del Pacifico – Discente Rede Ibero-americana de Estudo em Polos Geradores de Viagens - Red PGV / Brasil RESUMEN Este trabajo aborda las técnicas de autocorrelación espacial e indicadores locales de asociación espacial, el método estadístico propuesto para efectuar nuestro análisis espacial entorno a la generación de viajes, considera la dependencia espacial entre las unidades de observación, de este modo las características geográficas asociadas a la generación de viajes y su distribución regional pueden ser analizados a través de estas técnicas que consideran la dependencia espacial y la autocorrelación espacial, dando un paso más allá de la evaluaciones clásica de los coeficientes tradicionales de correlación y de la estadística descriptiva clásica, para el presente trabajo se utilizo las variables de producción y atracción de viajes asociadas a las zonas de transito las cuales son utilizadas en los modelos de transporte, buscando verificar en cuánto contribuye cada unidad espacial a la formación del valor global y la evaluación global per se. ABSTRACT This paper deals with spatial autocorrelation techniques and indicators of spatial association, the proposed statistical method to perform spatial analysis around our trip generation, consider the spatial dependence between observational units thus geographic features associated with the generation travel and its regional distribution can be analyzed by these techniques that consider the spatial dependence and spatial autocorrelation, taking a step beyond the classical evaluations traditional correlation coefficients and classical descriptive statistics for this study variables was used production and associated travel attraction traffic areas which are used in transport models, trying to verify how much space each unit contributes to the formation of aggregate value and overall assessment per se. PALABRAS CLAVE: Geoestadística, zonas de tránsito, asociación espacial. 1. INTRODUCION El Análisis Exploratorio de Datos Espaciales AEDE, puede definirse como el conjunto de técnicas que describen y visualizan las distribuciones espaciales, identifican localizaciones atípicas o “atípicos espaciales” (“spatial outliers”), descubren esquemas de asociación espacial, agrupamientos (“clusters”) o puntos calientes (“hot spots”) y sugieren estructuras espaciales u otras formas de heterogeneidad espacial (Anselin, 1999). Por tanto, estos métodos tienen un carácter descriptivo (estadístico) más que confirmatorio (econométrico), aunque la detección de estructuras espaciales en las variables geográficas, hace posible la
14
Embed
EVALUACIÓN DE AUTOCORRELACIÓN ESPACIAL … · PALABRAS CLAVE: Geoestadística, zonas de tránsito, asociación espacial. 1. INTRODUCION ... así como en los ejercicios de predicción-extrapolación
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
EVALUACIÓN DE AUTOCORRELACIÓN ESPACIAL GLOBAL Y LOCAL PARA
ZONAS DE TRANSITO
JULIO CESAR LAVADO YARASCA
Universidad del Pacifico – Discente
Rede Ibero-americana de Estudo em Polos Geradores de Viagens - Red PGV / Brasil
RESUMEN
Este trabajo aborda las técnicas de autocorrelación espacial e indicadores locales de asociación espacial, el
método estadístico propuesto para efectuar nuestro análisis espacial entorno a la generación de viajes, considera
la dependencia espacial entre las unidades de observación, de este modo las características geográficas asociadas
a la generación de viajes y su distribución regional pueden ser analizados a través de estas técnicas que
consideran la dependencia espacial y la autocorrelación espacial, dando un paso más allá de la evaluaciones
clásica de los coeficientes tradicionales de correlación y de la estadística descriptiva clásica, para el presente
trabajo se utilizo las variables de producción y atracción de viajes asociadas a las zonas de transito las cuales son
utilizadas en los modelos de transporte, buscando verificar en cuánto contribuye cada unidad espacial a la
formación del valor global y la evaluación global per se.
ABSTRACT
This paper deals with spatial autocorrelation techniques and indicators of spatial association, the proposed
statistical method to perform spatial analysis around our trip generation, consider the spatial dependence between
observational units thus geographic features associated with the generation travel and its regional distribution
can be analyzed by these techniques that consider the spatial dependence and spatial autocorrelation, taking a
step beyond the classical evaluations traditional correlation coefficients and classical descriptive statistics for this
study variables was used production and associated travel attraction traffic areas which are used in transport
models, trying to verify how much space each unit contributes to the formation of aggregate value and overall
assessment per se.
PALABRAS CLAVE: Geoestadística, zonas de tránsito, asociación espacial.
1. INTRODUCION
El Análisis Exploratorio de Datos Espaciales AEDE, puede definirse como el conjunto de
técnicas que describen y visualizan las distribuciones espaciales, identifican localizaciones
atípicas o “atípicos espaciales” (“spatial outliers”), descubren esquemas de asociación
espacial, agrupamientos (“clusters”) o puntos calientes (“hot spots”) y sugieren estructuras
espaciales u otras formas de heterogeneidad espacial (Anselin, 1999). Por tanto, estos
métodos tienen un carácter descriptivo (estadístico) más que confirmatorio (econométrico),
aunque la detección de estructuras espaciales en las variables geográficas, hace posible la
formulación de hipótesis previas para la modelización econométrica y, en su caso, posible
predicción espacial de nuevos datos.
Es decir, el AEDE debe constituir la fase previa a toda modelización econométrica espacial,
sobre todo cuando no exista un marco formal o teoría previa acerca del fenómeno que se
pretende explicar, como es el caso de algunos análisis interdisciplinares realizados en las
ciencias sociales, sobre todo en el campo de la economía regional, así como en los ejercicios
de predicción-extrapolación de datos, en los que puede no existir una identificación entre
relaciones económicas establecidas en diversos ámbitos o escalas territoriales (Arbia, 1989).
Las principales técnicas del AEDE contemplan los dos citados elementos de alisado “smooth”
(global) y asperezas “rough” (local) desde una perspectiva reticular o “lattice” (dicha
perspectiva en el estudios de la dependencia espacial es el concepto de matriz de pesos y el
asociado retardo espacial, entendiéndose como retardo espacial al promedio ponderado de los
valores que adopta una variable en el subconjunto de observaciones vecinas a una dada).
Análisis de Datos
Análisis exploratorio de
datos
Análisis exploratorio de
datos espaciales
AD
AED
AEDE
· Contraste de hipotesis
· Analisis de relacionentre variables
· Búsqueda de relaciones sistémicas
· Descubrimiento de patrones de comportamiento para la
formulación de hipótesis
· Conjunto de técnicas para describir, estimar y
visualizan las distribuciones espaciales.
Figura 1: Análisis exploratorio de datos espaciales
Tabla 1: Técnicas del análisis exploratorio de datos espaciales AEDE
Distribucion espacial Univariante Diagrama/mapa de caja
Multivariante Diagrama dispersion - caja
Asociacion espacial Global Mapa de continuedades espaciales
Grafico del retardo espacial
Diagrama/mapa de dispersion de Moran
Local Puntos atipicos en el diagrama de dispersión de Moran
Mapas LISA
Diagrama de caja LISA
Multivariante Diagrama de dispersion multivariante de Moran
Heterogeniedad espacial Mapa del histograma de frecuencias
Diagrama de dispersion
El presente trabajo se centran en las asociaciones espaciales, estando dentro de este concepto
la dependencia o autocorrelación espacial (Global, local y multivariante), utilizado las
herramientas de I de Moran e Indicadores Locales de Asociación Espacial (LISA).
2. AUTOCORRELACIÓN ESPACIAL (AE)
Definida de manera simple la autocorrelación espacial (AE) es la concentración o dispersión
de los valores de una variable en un mapa. Es decir la AE refleja el grado en que objetos o
actividades en una unidad geográfica son similares a otros objetos o actividades en unidades
geográficas próximas (Goodchild, 1987). Este tipo de autocorrelación prueba la primera ley
geográfica de Tobler (1979) de que “Todo está relacionado con todo lo demás, pero que las
cosas cercanas están más relacionadas que las cosas distantes”.
Por lo tanto, la autocorrelación espacial tiene que ver tanto con la localización geográfica
como con los valores hallados de la variable que se esté estudiando. Para determinar si el
patrón de distribución espacial dista del meramente aleatorio, debe utilizarse un índice de
comparación. Se entiende por autocorrelación espacial positiva, cuando, en el espacio
geográfico, los valores altos de una variable están rodeados por valores altos y viceversa; Por
el contrario, existe autocorrelación espacial negativa esta configuración, en la que se
produce una mayor disimilitud entre unidades geográficas cercanas que entre las lejanas y por
último, se produce ausencia de autocorrelación espacial en una variable geográfica cuando
ésta se distribuye de manera aleatoria sobre el espacio.
3. MATRIZ DE INTERACCIONES ESPACIALES
Los autocorrelación espacial (AE) o contrastes de dependencia, pueden basarse en una noción
de continuidad binaria entre las unidades espaciales designando el valor de 0 para una
ausencia de continuidad y 1 en caso contrario, dicha estructura espacial suele expresarse
formalmente a través de una matriz de interacciones espaciales, también llamada “matriz de
pesos espaciales, de retardos o de contactos” (Moreno S.; Vayá V. 2000). Existen diversas
formas de establecer una frontera común entre una celda y las que le rodean en analogía con
el juego del ajedrez, estas situaciones han sido denominadas, continuidad tipo reina, torre y
alfil. Por ejemplo, para una región conformada por 4 entidades se muestra su matriz de
interacciones espaciales tomando como criterio la continuidad tipo reina y torre
respectivamente (ver figura 2).
1 2 3 4
1
2
3
4
0
0
0
0
0
0
0
0
1
1 1
1
1 1
1 1
12
3 4
1 2 3 4
1
2
3
4
0
0
0
0
1
1
1
1
1
1 1
1
1 1
1 1
“Reina” “Torre”
Figura 2: Matriz de pesos espaciales
Debemos resaltar que para la construcción de una matriz de pesos no existe un criterio único
como consecuencia de poder definir la continuidad con diversos criterios no solo de frontera
sino también de distancia, continuidad de orden 2° o superiores, distancias económicas,
sugiriendo por ejemplo, la definición de Wij como Wij =1/ [xi-xj], donde xi y xj son
observaciones de características socioeconómicas, tales como renta per capita, por lo cual
quedaría claro que debe analizarse diversos escenarios según los objetivos buscados y realizar
sensibilidades cambiando la matriz de pesos.
4. CONTRASTES DE AUTOCORRELACIÓN ESPACIAL GLOBAL
La perspectiva global del fenómeno de AE tiene por objeto el contraste de la presencia de
tendencias o estructuras espaciales generales en la distribución de una variable sobre un
espacio geográfico completo. Es decir, se trata de contrastar la hipótesis de que una variable
se encuentre distribuida de forma totalmente aleatoria en un sistema espacial o, si por el
contrario, existe algún tipo de asociación significativa de valores similares o distintos entre
regiones vecinas. Para ello, se han propuesto en la literatura varios estadísticos de
dependencia espacial, como los tests; Moran’s I, Geary’s c, Mantel’s Γ, Getis and Ord’s G(d),
que son los contrastes más utilizados y fáciles de computar, aunque su interpretación no
siempre sea muy directa, para la evaluación de la autocorrelación espacial de la variable de
generación de viajes se utilizara el Test I de Moran.
4.1. Test I de Moran
El test I de Moran fue inicialmente formulado como función de una variable (Y), considerada
en los puntos del espacio (i,j), en desviaciones a la media, y los elementos de la matriz binaria
de interacciones espaciales [ij]. Esta expresión inicial de Moran podría ser generalizada,
sustituyendo la matriz de interacciones por la más general matriz de pesos espaciales, wij, de
la manera siguiente:
N
i
i
jiij
yy
yyyyw
S
NI
1
2
2
0
(1)
Donde: wij: elemento de la matriz de pesos espaciales correspondiente al par (i, j).
20 iji j ij wwS , es decir, la suma de los pesos espaciales.
y : Valor medio o esperado de la variable y
N: Número de observaciones (puntos o polígonos).
Cuando se utiliza una matriz de interacciones espaciales estandarizada por filas, que es la
situación óptima de aplicación de este test, el término S0 = N, dado que la suma de los valores
de cada fila es igual a la unidad. De este modo, el estadístico I queda reducido al cociente del
producto espacial cruzado de los valores de la variable partido por la varianza:
N
i
i
jiij
yy
yyyywI
1
2
2
(2)
Siendo la media teórica de la I de Moran es el cociente 1
1
N
.
Respecto a la distribución del contraste I, según Cliff y Ord (1981) cuando el tamaño muestral
es suficientemente amplio, la expresión estandarizada del test I se distribuye como una normal
tipificada, N(0,1), como el test de recuento de vínculos de Moran. Por eso, también en este
caso, en lugar de considerarse el estadístico inicial I, el proceso inferencial suele utilizar los
valores estandarizados (z) de cada uno de ellos, obtenidos, como bien es sabido, a través del
cociente entre la diferencia del valor inicial y la media teórica, y la desviación típica teórica,
del modo siguiente:
ISD
IEIz I
(3)
Siendo E[I]: Media teórica del estadístico I.
SD[I]: Desviación típica del estadístico I.
La interpretación de los valores estadísticamente significativos de la variable tipificada zI
sería la siguiente:
· Valores no significativos del test I estandarizado, zI, correspondiente a una variable Y,
conducirían a aceptar la hipótesis nula de no AE o inexistencia de patrones de
comportamiento de dicha variable sobre el espacio.
· Valores significativos de zI > 0 serían indicativos de AE (+), es decir, que es posible
encontrar valores parecidos (altos o bajos) de la variable Y, espacialmente agrupados, en
mayor medida de como estarían por casualidad.
· Valores significativos de zI < 0 serían indicativos de AE (-), es decir, que se produce una
no-agrupación de valores similares (altos o bajos) de la variable Y superior a lo normal en
un patrón espacial aleatorio.
Así mismo existen dos métodos para el cálculo de la desviación típica del estadístico I
(SD[I]), el método de normalización y otra opción eso realizar "un proceso conocido como
randomization o de aleatorización” donde los datos de las unidades espaciales se intercambian
(permutan) al azar es decir una aleatorización por permutación, obteniéndose diferentes
valores de autocorrelación que se comparan con el valor obtenido. Al realizar este tipo de test,
inicialmente hay que definir la hipótesis nula que responde a la afirmación Ho la
configuración espacial se produce de manera aleatoria, y la alternativa Ha la configuración
espacial no se produce de manera aleatoria. Luego se especifica el nivel de significancia que
0-1.96
2.5%
1.96
2.5% 1%
2.54
*E(I)= –1/(n-1)
–1/(n-1)
Rechaza Ho al 5%
Rechaza Ho
Rechaza Ho al 1%
indica la probabilidad de rechazar la hipótesis nula siendo ésta verdadera. Por lo tanto, es la
probabilidad que se está dispuesto a cometer al aceptar la hipótesis alternativa. Se suele elegir
de acuerdo a la importancia del problema y generalmente es
del 5 % (0.05) y 1 % (0.01) (Buzai y Baxendale,
2006).
Figura 3: Test estadístico para una distribución de frecuencias normal
Como parte de la evaluación también se tiene al diagrama de dispersión de Moran en el que se
representa también la línea de regresión, cuya pendiente, en este caso, será el valor del test I
de Moran que, por este motivo, puede ser utilizado como indicador del grado de ajuste, así
como de la presencia de valores atípicos en la nube de puntos. Por último, tampoco debe
olvidarse la importancia que tiene la matriz de pesos espaciales en el proceso de contraste del
fenómeno de AE global, pues está bien demostrado que los resultados obtenidos por los
diferentes estadísticos pueden variar, a veces de forma sensible, en función de la matriz W
especificada.
5. CONTRASTES DE AUTOCORRELACIÓN ESPACIAL LOCAL
Los estadísticos de autocorrelación global, centrados en el análisis de dependencia general
propia de todas las unidades de un espacio geográfico, no son capaces de detectar la
inestabilidad o deriva espacial de ciertas estructuras locales de asociación (“hotspots” o
puntos calientes/fríos) o inestabilidades locales que pueden estar, a su vez, presentes o no en
una estructura global de dependencia (Getis y Ord, 1992), este problema de la dependencia
espacial local puede plantearse desde dos puntos de vista: (1) Existe la posibilidad de que, en
un espacio dado, no se detecte la presencia de autocorrelación espacial global en la
distribución de una variable aunque, de hecho, existan pequeños “clusters” espaciales en los
que dicha variable experimenta una concentración (o escasez) importante; (2) Existe también
la posibilidad de que, habiéndose detectado dependencia a nivel global en una variable, no
todas las regiones del espacio considerado contribuyan con igual peso en el indicador global,
es decir, que coexistan unas zonas en las que la variable se distribuya de forma aleatoria junto
a otras con una importante contribución a la dependencia existente.
Para responder a estas cuestiones, se definen a continuación dos grupos de contrastes de
asociación local que indican hasta qué punto una región se encuentra rodeada por otras con
valores altos o bajos de una variable determinada los indicadores locales de asociación
espacial (LISA), propuestos por Anselin (1995). Ambos tipos de contrastes parten de la
hipótesis nula de ausencia de autocorrelación espacial global, aunque los indicadores LISA
serán también capaces de responder a la segunda de las cuestiones planteadas, demostrando la
presencia de regiones con una participación en el estadístico global muy superior a la media
(“outliers”).
5.1. Indicadores Locales de Asociación Espacial (LISA)
Anselin (1995) propone un conjunto de indicadores locales de asociación espacial, LISA
(“Local Indicators of Spatial Association”), capaces de detectar la contribución de cada región
a un indicador de dependencia espacial global (por ejemplo, el estadístico I de Moran). Este
tipo de indicadores permiten la obtención de bolsas de inestabilidad (no estacionariedad)
espacial, es decir, la presencia de valores atípicos que también pueden ser visualizados
mediante el diagrama de dispersión de Moran.
Los indicadores LISA presentados para este trabajo serán basado en I de Moran.
a) Estadístico local de Moran. Se define un indicador de dependencia local basado en el
test I de Moran, Ii, del modo siguiente:
iJ
j
jijii zwzI1
(4)
Donde zi, zj: Variable yi estandarizada y ∑: Sumatorio que únicamente incluye los valores
vecinos a i: j pertenece a Ji. La matriz de pesos wij debería estar estandarizada por filas
(aunque no es necesario). Es posible calcular los momentos de Ii, bajo la hipótesis nula de
ausencia de asociación espacial, para el supuesto inferencial de aleatoriedad o muestreo
aleatorio (Cliff y Ord, 1973). Cualquier contraste de significación de asociación espacial local
puede basarse en estos momentos, aunque la distribución exacta de un estadístico de este tipo
aún se desconoce. Para facilitar su interpretación, puede utilizarse una distribución normal,
pero hay que saber que se trata sólo de una simple aproximación. Alternativamente, es
también posible utilizar una aproximación aleatoria condicional (hipótesis de permutación)
que, dada la estructura del estadístico local de Moran, consistiría en el cálculo del sumatorio
∑j wij zj, para cada permutación (dado que el cociente 2mz i permanece constante en todas las
localizaciones).
La interpretación del estadístico local Ii de Moran como un indicador de inestabilidad local se
desprende fácilmente de la relación entre estadísticos locales y globales. En concreto, la
media de Ii será igual a la del estadístico global I por un factor de proporcionalidad. Las
máximas contribuciones de los valores de Ii al estadístico global I pueden ser identificadas a
través de criterios sencillos, como el “doble-sigma” o identificando los puntos atípicos en un
gráfico de caja. Debe advertirse que este concepto de “extremosidad” únicamente pone de
manifiesto la importancia de la observación i en la determinación del estadístico global.
Anselin propone también el diagrama de dispersión de Moran (Scatterplot de Moran), aunque
no es un indicador LISA en sentido estricto (no ofrece información alguna acerca de la
existencia o no de autocorrelación espacial local), como buen instrumento para la detección
de puntos atípicos en una distribución (Lopes S.B, 2005)
Figura 4: diagrama de dispersión de Moran
6. APLICACION PRACTICA PARA LAS ZONAS DE TRANSITO EN LA CIUDAD
DE LIMA
La información utilizada en esta investigación corresponde a la matriz de viajes origen destino
de transporte público del 2012, calibrada para la ciudad de Lima con motivo de la evaluación
de demanda de la Línea 2 del Metro de Lima, de dicha matriz se extrajo los vectores orígenes
y destinos correspondientes a las Zonas de Transito - ZT circunscritas a los distritos del
Cercado de Lima, Breña, Pueblo Libre, Jesus Maria, La Victoria y San Luis, con un total de
85 Zonas de tránsito, el área de estudio corresponde a la parte céntrica de la Ciudad
Metropolitana de Lima encontrándose en ella las estaciones centrales y de intercambio modal
de los dos Ejes de transporte público principales en la ciudad, la Línea 1 del Metro de Lima y
el Metropolitano. La evaluación realizada será para cuatro vectores que contiene: Viajes cuyo
origen están en las ZT en la hora pico de la mañana (Orig HPM), Viajes cuyo destino están en
las ZT en la hora pico de la mañana (Dest HPM), Viajes cuyo origen están en las ZT en la
hora pico de la tarde (Orig HPT) y Viajes cuyo destino están en las ZT en la hora pico de la
tarde (Orig HPT).
Figura 5: Zonas de tránsito en el centro de la Ciudad
Al observar este patrón espacial de los viajes tanto en la HPM y HPT de los viajes generados
surgen las siguientes preguntas:
-3 -2 -1 0
-0.5
-1
-1.5
-2
1.5
1
0.5
0
2
1 2 3
Y
WY
Ausencia de dependencia espacial
-3 -2 -1 0
-0.5
-1
-1.5
-2
1.5
1
0.5
0
2
1 2 3
Y
WY
Dependencia espacial positiva
-0.5
-1
-1.5
-2
1.5
1
0.5
0
2
Y
WY
Dependencia espacial negativa
¿Representa éste un patrón espacialmente aleatorio en una distribución de viajes?, el factor de
temporalidad (mañana o tarde) su direccionalidad como influyen (origen - destino). ¿Las ZT
de acuerdo a su intensidad se encuentran concentradas o dispersas en la ciudad? y ¿Cuál es la
probabilidad de que este patrón geográfico no sea aleatorio?. La forma de responderla es
precisamente calculando el nivel de concentración o dispersión y probando si ese nivel es
estadísticamente aleatorio o no, para la aplicación de la teoría expuesta en acápites anteriores
se utilizara el software GeoDA en su versión 1.4.1 el cual es de uso libre y actualmente está
siendo desarrollando por el “Centro de Análisis Geoespacial y Computación” de la
Universidad Estatal de Arizona, para la visualización se utilizo el software TransCAD en su
versión 5.0, software utilizado para la elaboración de las ZT y la matriz origen destino.
Determinación de los
indicadores a nivel
Global y Local (I,Ii)
Determinación de la
Matriz de Pesos Wij
Interpretación de los
indicadores y graficos
Figura 6: Metodología desarrollada
6.1. Matriz de Pesos (Wij)
En relación a la matriz de matriz de interacciones espacial o matriz de pesos wij , se utilizo el
patrón tipo reina, ya que es necesario contar con un análisis de toda la vecindad entorno al ZT
lo cual es lógico en un tramado urbano. El software GeoDA crea un archivo con extensión
*.gal el cual tiene el formato mostrado en la siguiente figura donde para la ZT 20 existen 3 ZT
en su vecindad las cuales son 22, 21 y 19.
Figura 7: Determinación de la matriz de pesos Wij
6.2. Determinación de indicadores de autocorrelación espacial globales y locales
Utilizando el software GeoDA se obtuvieron los siguientes resultados para cada uno de los
vectores analizados.
Tabla 2: Resultados de autocorrelación espacial
I E Mean Sd Z - Value Pseudo P-Value
Origen -0.0389368 -0.0119 -0.0115 0.0649 -0.4226 0.3498