통계연구(2013), 제18권 제2호, 111-127 연결형 마이크로맵 도표를 활용한 데이터 시각화 1) 박세진 2) ․ 안정용 3) 요약 통계그래프(statistical graphs) 및 데이터 시각화(data visualization) 기법은 데이터에 대한 직관적 이고 쉬운 이해를 제공한다. 데이터에 대한 초기 탐색단계에서부터 분석 결과의 발표에 이르기 까지 데이터 시각화는 매우 중요한 역할을 수행하며, 최근에는 지리 정보를 갖는 데이터 (geographically referenced data, location data)를 표현하기 위해 다양한 형태의 통계지도 (statistical maps)가 활용되고 있다. 본 연구에서는 새로운 데이터 시각화 방법인 연결형 마이크 로맵 도표를 소개하고, 우리나라 지도를 마이크로맵으로 제작하는 방법을 제시하고자 한다. 또 한, 연결형 마이크로맵 도표를 이용하여 우리나라 16개 광역시도에 대한 통계정보를 표현할 수 있는 모듈을 개발한다. 개발된 모듈은 지역사회건강조사의 비만 및 체중조절에 관한 자료와 통 e-지방지표의 고용에 관한 자료에 적용하여 변수들 사이의 관련성, 지역별 비교, 지리적 패턴 등 을 파악하는 사례로 제시하였다. 본 연구는 연결형 마이크로맵 도표에서 이용되는 기법을 우리 나라 지도에 적용하여 통계정보를 제공할 수 있는 방안을 탐색하는데 그 목적이 있다. 주요용어 : 데이터 시각화, 연결형 마이크로맵 도표, R 모듈, 통계지도 1. 서론 통계지도(statistical maps)는 통계정보를 지역별로 보여주는 특별한 형태의 지도이 며, 행정구역에 따라 어떤 정보를 보여주거나 데이터 범주에 따른 지리학적 특성을 나타낸다. 예를 들면, 행정구역별로 지지율이 가장 높은 정당을 보여주거나 강수량을 범주화하여 같은 범주에 해당하는 지리학적 특성을 보여주는 등 다양한 분야의 정보 를 제공하는데 이용되고 있다. 통계지도는 데이터 표현 방식에 따라 단계구분도 (choropleth map), 등치선도(isopleth map), 비례기호지도(proportional symbol map), 점 통계지도(dot map) 등으로 구분할 수 있으며, 현재 단계구분도가 가장 많이 활용 되고 있다. 단계구분도는 색 또는 명암을 이용하여 데이터의 지역별 분포를 나타내는 단순한 형태의 통계지도이며, 1938년 Wright에 의해 소개되어 많은 연구가 이루어졌다 (Wright, 1938; Murray와 Shyy, 2000; Armstrong 등, 2004; Cromley와 Cromley, 2009). 이 지도는 지역의 특성을 쉽게 나타낼 수 있고, 데이터의 지역별 분포를 직관 적으로 이해할 수 있는 장점을 가지고 있는 반면에 다음과 같은 단점도 가지고 있다 (Robinson 등, 1978; Dent, 1993; Harris, 1999). 첫째, 지역의 면적에 관련된 문제로 1) 박세진의 석사학위논문 내용을 확장한 논문임 2) 전주시 덕진구 백제대로 567, 전북대학교 통계학과, 박사과정. E-mail: [email protected]3) 교신저자, 전주시 덕진구 백제대로 567, 전북대학교 통계학과(응용통계연구소). 교수. E-mail: [email protected]
17
Embed
연결형 마이크로맵 도표를 활용한 데이터 시각화1)kostat.go.kr/file_total/18-2-06.pdf · 도 위주로 통계지도가 이용되고 있으며, 미국을 제외한
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
통계연구(2013), 제18권 제2호, 111-127
연결형 마이크로맵 도표를 활용한 데이터 시각화1)
박세진2) ․ 안정용3)
요약
통계그래프(statistical graphs) 및 데이터 시각화(data visualization) 기법은 데이터에 대한 직관적
이고 쉬운 이해를 제공한다. 데이터에 대한 초기 탐색단계에서부터 분석 결과의 발표에 이르기
까지 데이터 시각화는 매우 중요한 역할을 수행하며, 최근에는 지리 정보를 갖는 데이터
(geographically referenced data, location data)를 표현하기 위해 다양한 형태의 통계지도
(statistical maps)가 활용되고 있다. 본 연구에서는 새로운 데이터 시각화 방법인 연결형 마이크
로맵 도표를 소개하고, 우리나라 지도를 마이크로맵으로 제작하는 방법을 제시하고자 한다. 또
한, 연결형 마이크로맵 도표를 이용하여 우리나라 16개 광역시도에 대한 통계정보를 표현할 수
있는 모듈을 개발한다. 개발된 모듈은 지역사회건강조사의 비만 및 체중조절에 관한 자료와 통
e-지방지표의 고용에 관한 자료에 적용하여 변수들 사이의 관련성, 지역별 비교, 지리적 패턴 등
을 파악하는 사례로 제시하였다. 본 연구는 연결형 마이크로맵 도표에서 이용되는 기법을 우리
나라 지도에 적용하여 통계정보를 제공할 수 있는 방안을 탐색하는데 그 목적이 있다.
주요용어 : 데이터 시각화, 연결형 마이크로맵 도표, R 모듈, 통계지도
1. 서론
통계지도(statistical maps)는 통계정보를 지역별로 보여주는 특별한 형태의 지도이
며, 행정구역에 따라 어떤 정보를 보여주거나 데이터 범주에 따른 지리학 특성을
나타낸다. 를 들면, 행정구역별로 지지율이 가장 높은 정당을 보여주거나 강수량을
범주화하여 같은 범주에 해당하는 지리학 특성을 보여주는 등 다양한 분야의 정보
를 제공하는데 이용되고 있다. 통계지도는 데이터 표 방식에 따라 단계구분도
(choropleth map), 등치선도(isopleth map), 비례기호지도(proportional symbol map),
통계지도(dot map) 등으로 구분할 수 있으며, 재 단계구분도가 가장 많이 활용
되고 있다.
단계구분도는 색 는 명암을 이용하여 데이터의 지역별 분포를 나타내는 단순한
형태의 통계지도이며, 1938년 Wright에 의해 소개되어 많은 연구가 이루어졌다
(Wright, 1938; Murray와 Shyy, 2000; Armstrong 등, 2004; Cromley와 Cromley,
2009). 이 지도는 지역의 특성을 쉽게 나타낼 수 있고, 데이터의 지역별 분포를 직
으로 이해할 수 있는 장 을 가지고 있는 반면에 다음과 같은 단 도 가지고 있다
(Robinson 등, 1978; Dent, 1993; Harris, 1999). 첫째, 지역의 면 에 련된 문제로
Harris, R.L. (1999). Information graphics: A comprehensive illustrated reference,
Oxford University Press, New York.
Monmonier, M. (1993). Mapping it out: Expository cartography for the humanities
and social sciences, University of Chicago Press, Chicago
Murray, A.T. and Shyy, T.K. (2000). Integrating attribute and space characteristics
in choropleth display and spatial data mining, International Journal of
Geographical Information Science, 14, 649-667.
Olsen, A.R., Carr, D.B., Courbois, J.P. and Pierson, S.M. (1996). Presentation of
data in linked attribute and geographic space, Proceedings of the Joint
Statistical Meetings, American Statistical Association, 271.
Payton, Q. and Olsen, T. (2013). Package ‘micromap’, http://cran.r-project.org/web/
packages/micromap/micromap.pdf
Robinson, A., Sale, R. and Morrison, J. (1978). Elements of cartography (Fourth
Edition), John Wiley and Sons, New York.
Symanzik, J. and Carr, D.B. (2008). Interactive linked micromap plots for the
display of geographically referenced statistical data, in C. Chen, W.
Hardle & A. Unwin, eds, Handbook of Data Visualization, Springer,
Berlin, 267-294.
Wright, J.K. (1938). Notes on statistical mapping, with special reference to the
mapping of population phenomena, Population Association of America,
Washington.
연결형 마이크로맵 도표를 활용한 데이터 시각화 127
Visualizing Statistical Data using Linked Micromap Plots
Sejin Park1) ․ Jeongyong Ahn2)
Abstract
Statistical graphics and techniques for data visualization are critical elements of modern data analysis. From initial exploration of a dataset to the final presentation of results to the end user, data visualizations play a vital role in shaping our understanding of data and many types of statistical maps are recently used for representation of geographically referenced data. In this study, we introduce the micromap and design linked micromap plots. First, we introduce the method to construct micromap using the map of South Korea with 16 regional local governments. Second, we develop some R modules to visualize statistical information of geographically referenced data using the linked micromap plots.
Key words : Data visualization, Linked micromap plots, R modules, Statistical maps
1) Graduate Student, Dept. of Statistics, Chonbuk National University, 567 Baekje-daero,
Deokjin-gu, Jeonju-si, Jeollabuk-do 561-756, Korea. E-mail: [email protected]
2) (Corresponding author) Professor, Dept. of Statistics (Institute of Applied Statistics),
Chonbuk National University, 567 Baekje-daero, Deokjin-gu, Jeonju-si, Jeollabuk-do