지방자치단체의 빅데이터 도입을 위한 제언*Ⅰ. 서론 최근 정부는 정부3.0 비전 선포식을 하자마자 공공데이터 잠재력에 주목하고, 데이터 기 반의 새로운 성장 동력을 찾기 위해 지난 2013년 6월 ‘공공데이터 제공 및 이용 활성화에 관 한 법률’을 제정했다. 공공데이터는 정부나 지방자치단체 또는 산하기관이 보유하고 있는 공 공목적으로 사용할 수 있는 데이터를 말한다(이만재, 2011). 공공부문에서의 빅데이터 분석 과 활용에 대한 수요가 크게 증가하고 있는 추세이다. 정부가 가진 데이터를 전면 개방해서 제공한다면 정부3.0에서 강조하는 투명한 정부, 서비스 정부를 국민의 자발적인 참여로 만들 어 낼 수 있다. *** 이 논문은 2013년도 광운대학교 교내학술연구비 지원에 의해 연구되었음. *** 제1저자 *** 교신저자
29
Embed
지방자치단체의 빅데이터 도입을 위한 제언*¹€신곤_조재희.pdf · 대한 텍스트 데이터와 지리 정보를 제공하여 상세한 정보를 바탕으로
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
연구논단 한국지역정보화학회지 제16권 제3호(2013. 9): 13~41
13
지방자치단체의 빅데이터 도입을 위한 제언*1)
김신곤***
조재희***
<요 약>
세계적인 이슈로 떠오른 빅데이터가 기업 뿐 아니라 국가의 경쟁력에도 지대한 영향을 미칠 것이
므로 다양한 분야에서 빅데이터 활용 사례는 급속히 증가할 것으로 전망된다. 주요 국가의 정부 및
지자체는 국가 경쟁력 향상을 위하여 경쟁적으로 공공데이터의 개방과 활용 정책을 추진하고 있으며
빅데이터의 활용 방향은 크게 빅데이터 기반의 국가미래전략을 추진하고 있다는 점과 사회 현안 해
결을 위한 새로운 방법으로 활용함으로써 공공서비스의 효율을 높이고 있는 것으로 요약할 수 있다.
본고에서는 국내외의 사회, 의료 보건, 금융, 교통, 재난 국방 치안과 같이 다섯 가지 공공부문에 적
용된 대표적인 빅데이터 사례를 32개 선정하고 전반적인 동향과 시사점을 정리하였다. 지제체의 성
공적인 빅데이터 도입을 위하여는 사전 준비가 필요하다. 지자체의 빅데이터 도입 전략에 반드시 고
려해야 할 사항들과 지역정보화 관점에서 지자체의 준비 사항을 살펴보았다.
<주제어> 빅데이터, 빅데이터 활용 사례, 공공데이터, 지자체, 국가경쟁력
Ⅰ. 서론
최근 정부는 정부3.0 비전 선포식을 하자마자 공공데이터 잠재력에 주목하고, 데이터 기
반의 새로운 성장 동력을 찾기 위해 지난 2013년 6월 ‘공공데이터 제공 및 이용 활성화에 관
한 법률’을 제정했다. 공공데이터는 정부나 지방자치단체 또는 산하기관이 보유하고 있는 공
공목적으로 사용할 수 있는 데이터를 말한다(이만재, 2011). 공공부문에서의 빅데이터 분석
과 활용에 대한 수요가 크게 증가하고 있는 추세이다. 정부가 가진 데이터를 전면 개방해서
제공한다면 정부3.0에서 강조하는 투명한 정부, 서비스 정부를 국민의 자발적인 참여로 만들
어 낼 수 있다.
*** 이 논문은 2013년도 광운대학교 교내학술연구비 지원에 의해 연구되었음. *** 제1저자
*** 교신저자
한국지역정보화학회지 제16권 제3호
14 │ Journal of Korean Association for Regional Information Society
비단 우리만 공공데이터에 주목하는 것은 아니다. 미국・영국・EU 등 세계 각국도 정부 투
명성 제고와 경제 활성화를 위해 경쟁적으로 공공데이터 개방과 활용 정책을 추진하고 있다.
미국은 2013년 5월, 오바마 2기의 열린 정부를 완성할 오픈데이터 정책을 발표하였다. 이 정
책의 핵심은 정부에서 만든 모든 데이터의 무조건적인 개방이다. 또한 영국의 캐머런 수상은
활용도가 높은 공공데이터를 구체적으로 적시하고 각 부처가 빠르게 개방하라는 지시를 내렸
다. EU는 이미 2011년에 27개 회원국의 모든 공공데이터를 의무적으로 개방하라는 오픈데
이터 전략을 수립했고, 2013년 6월에 ‘공공정보 재활용 지침’을 개정하였다.
공공데이터를 더 많이 개방할수록 더 많은 가치를 발견할 가능성은 커진다. 공공데이터는
정부가 주어진 역할을 제대로 수행하고 있는지를 감시하는 데에도 활용할 수 있으며 국민생
활을 더 편리하게 하는 서비스를 개발하는 데에도 활용할 수 있다. 이에 따라 정부 차원의 빅
데이터 확보와 활용을 통해 신산업과 일자리 창출 등을 추구함으로써 국가의 산업경쟁력 향
상을 도모하고 있으며 재난방재, 질병 방지, 치안, 물가관리 등 공공 서비스 영역에서 예상하
지 못한 불규칙한 사건의 예측 및 예방 등 사회 현안을 해결하기 위한 빅데이터 활용이 증가
하는 추세이다(이응용, 2012).
미국정부는 빅데이터 이니셔티브를 통해 공공정책 각 분야에 빅데이터 분석을 전방위적
으로 확산해 국가적 난제해결에 나서고 있다. 우리 정부도 최근정부3.0 비전을 발표하면서 데
이터기반의 과학적 정책수립에 나서고 6대 분야에 걸쳐 21개의 시범사업을 추진할 예정이다.
하지만 국내 공공분야의 빅데이터 활용은 여전히 초기단계에 머물러 있다. 공공기관들은
경제, 일자리, 교통, 교육, 보건, 복지, 안전, 행정효율화 등 다양한 분야에서 빅데이터를 도입
해보고자 하는 의지는 강하지만 국내의 경우 주요 선진국에 비하여 기술격차가 존재하고, 아
이디어 및 데이터는 있으나 빅데이터 분석 환경 및 활용 경험이 부족하고 전문 인력도 부족한
실정이어서 서비스 도입에 어려움을 겪고 있는 상황이다.
본고에서는 주요 선진국의 빅데이터 추진 전략을 살펴보고 국내외의 사회, 의료・보건, 금
융, 교통, 재난・국방・치안과 같이 다섯 가지 공공부문에 적용된 대표적인 빅데이터 사례를
32개 선정하여 전반적인 동향과 시사점을 정리하였다. 지자체의 성공적인 빅데이터 도입을
위해서 사전 준비가 필요하다. 지자체의 빅데이터 도입 시 고려할 사항들과 지역정보화 관점
에서 지자체의 준비 사항을 살펴보았다.
지방자치단체의 빅데이터 도입을 위한 제언
15
Ⅱ. 주요 선진국의 빅데이터 추진 전략
빅데이터는 기업 뿐 아니라 국가의 경쟁력에도 지대한 영향을 미친다. 주요 국가의 정부
및 지자체들은 빅데이터 분석을 향후 국민편익 향상, 공공서비스 효율화, 시민 복지 향상, 선
제적 정책, 미래전략 수립을 위한 중요한 수단으로 인식하고 있다. 세계 각국이 이처럼 공공
데이터의 빅데이터 활용에 주력하는 이유는 데이터가 가진 무한한 가치 때문이다. 주요 국가
의 정부 및 지자체가 빅데이터를 활용하는 방향은 크게 두가지로 볼 수 있다. 첫째는 빅데이
터 기반의 국가미래전략을 추진하고 있다는 점과 둘째로 빅데이터를 사회 현안 해결을 위한
새로운 방법으로 활용함으로써 공공서비스의 효율화를 추구하고 있다는 점이다.
미국, 영국, EU, 싱가포르와 같은 선진국들을 시작으로 빅데이터의 활용은 국가차원의 전
략으로 확산되고 있는데, 그 추진 현황을 살펴보면 다음과 같다(빅데이터 전략연구센터a,
2012).
1. 미국
미국은 범정부 차원의 빅데이터 거버넌스 체계를 구축하였다. 미국 대통령 과학기술자문
위원회(PCAST)1)는 2010년 12월 모든 연방정부는 빅데이터 전략 수립이 필요하고, 이를 위
해 연방 정부 수준에서의 빅데이터 관련 기술 투자의 필요성을 제시(Design a Digital Futur
e)2) 하였다. 이에 과학기술정책실(OSTP)3)은 2억 달러 규모의 ‘빅데이터 연구개발 이니셔티
브’(Big Data R&D Initiative)를 발표(2012.3) 하였다(빅데이터 전략연구센터c, 2013). 과학
1) President’s Council of Advisors on Science and Technology2) Every Federal agency needs to have a “big data” strategy.3) Office of Science and Technology Policy4) Federal Networking and IT R&D의 약자. 2002년부터 추진되고 있는 연방 정부 차원의 범부처 IT R&D
프로그램으로 대규모 네트워크, 고성능 컴퓨팅 시스템, 소프트웨어, 정보관리 등 기술 분야의 연구개발은
물론 신기술이 사회와 경제 및 노동에 미치는 영향 등을 분석하는 등 다양한 연구 영역이 상호 유기적으
로 연계되어 진행(한국인터넷진흥원, 2012)5) Big Data Senior Steering Group
한국지역정보화학회지 제16권 제3호
16 │ Journal of Korean Association for Regional Information Society
적으로 추진하고 있다.
미국 정부(data.gov)는 클라우드 기반의 개방형 데이터 플랫폼을 제공하여 개별 부처가
보유한 공공데이터를 쉽게 공유할 수 있도록 하고 있다. 또한 연방정부에서는 다양하고도 방
대한 텍스트 데이터와 지리 정보를 제공하여 상세한 정보를 바탕으로 정부정책을 결정하고
제안하도록 하고 있다.
2. 영국
영국은 공공데이터에 쉽게 접근하도록 공개하여 데이터의 활용기회를 증대시키고 있다.
이를 위해 내각사무처는 ‘공개 데이터 연구소(Open Data Institute)’를 설립하고 공개 데이터
활용을 통해 비즈니스 모델 개발과 데이터 생태계 구축을 지원하고 있다.
영국의 기업혁신기술부(BIS)는 공공정보를 개방하고 접근성을 높여 데이터 기반의 가치
창출을 위해 ‘데이터 전략위원회(Data Strategy Board)’를 2012년 3월 설립하였다. 영국 정
부는 데이터 전략위원회를 통해 오픈 데이터 전략6)에 2013년 4월부터 700만 파운드를 지원
할 계획이며, 각 부처가 무료로 데이터를 공개할 수 있도록 적극 지원할 예정이다. 이에 기업
혁신기술부(BIS)를 비롯한 총 16개 부처7)는 부처별 특성에 맞는 ‘오픈 데이터 전략(Open
Data Strategy)’을 2012년 6월 발표하였다.
각 부처는 데이터 공유플랫폼(data.gov.uk)8)의 재정비를 통하여 검색기능 개선, 정보이용
방법의 단순화, GIS 데이터의 시각화 등 보유 목록에 대한 접근성 강화 및 서비스 활성화 방
안을 모색하고 있다. 또한 팀 버너스 리(Tim Berners-Lee)가 데이터 품질과 재이용성을 평가
하기 위해 개발한 평가방법을 기준으로 정부의 각 부처가 공개하는 오픈 데이터 평가를 도입
하였다.
3. EU
EU는 금융위기 극복과 사회의 복잡성을 이해하기 위한 FuturICT와 불확실한 미래탐구를
6) 상세내용은‘Ⅲ. 사회현안 해결을 위한 주요국의 빅데이터 추진전략’ 참조
7) 16개 부처는 내무부, 기업혁신기술부, 지역사회지방정부부, 노동연금부, 교육부, 국제개발부, 에너지기후
변화부, 외무부, 보건부, 국세청, 국방부, 법무부, 재무부, 교통부, 문화매체체육부, 환경식품농촌부 이다.8) 2012년 현재 Linked Data 형태로 8,400개의 데이터 세트 제공
지방자치단체의 빅데이터 도입을 위한 제언
17
위한 iKnow 프로젝트를 추진하고 있다. FuturICT는 지구 신경망시스템, 전체 지구 시뮬레이
적으로 관리하고 운용하는 기술, 인간과 유연한 상호작용으로 쉽게 정보를 활용할 수 있는 기
술 등을 개발하여 선진적인 IT서비스를 인간사회에 적용하는 것이다. 경제산업성이 추진하
9) 약신호는 사회 변화의 시작을 가리키는 신호로서, 미래에 발생할 가능성이 있는 사건을 의미하고, 와일드
카드는 발생 가능성이 매우 낮으나, 발생했을 경우 엄청난 사회적 영향을 미칠 수 있는 사건을 의미한다.10) Risk Assessment Horizontal Scanning11) http://www.mindef.gov.sg/imindef/publications/pointer/journals/2007/v33n3/feature2.html
한국지역정보화학회지 제16권 제3호
18 │ Journal of Korean Association for Regional Information Society
는 ‘정보대항해(情報大航海) 프로젝트’의 추진 목표는 많은 정보 중에서 사용자가 원하는
정보를 정확하게 검색・ 분석하는 기술을 개발하는 것이다(조문래, 2012). 총무성은 차기 ICT
전략인 ‘액티브 재팬 전략(Active Japan ICT)’의 5대 중점영역12)에 ‘빅데이터 이용과 활용에
의한 사회・경제 성장’을 포함(2012.7)시키고, 빅데이터 및 오픈 데이터를 통한 신규시장 창출
을 위해 2013년 89.3억 엔의 예산을 투자할 계획이다(일본 총무성, 2012).
일본은 데이터 개방, 기반기술 연구개발, 표준화, 활용인재 확보, 사물 간 통신 촉진, 규제
개선 등 산학관이 제휴하여 위의 전략을 추진하고 성과평가 방법을 마련하는 등 민간분야를
고려하면서 빅데이터 활용 활성화 정책을 추진하고 있다.
6. 한국
한국정보화진흥원은 빅데이터를 기반으로 중장기 미래전략 수립을 지원하는 빅데이터 전
략연구센터를 개설(2012.4) 하였다. 여기서는 산・학・연・관이 협력할 수 있는 빅데이터 국가
전략 포럼13)을 지원하고 있으며, 빅데이터 기반 미래사회 대응전략 수립, 빅데이터 글로벌 선
진사례 연구, 공공부문 데이터 분석 및 활용 방안 등의 연구를 수행하고 있다.
국가정보화전략위원회는 빅데이터를 활용한 스마트정부 구현안을 제시하는 등 국가 차원
의 사업을 추진하고 있으며 빅데이터 활용추진단이 신설되어 빅데이터 경쟁력을 높이기 위한
국가・사회적 기반 확보에 나서고 있다.
7. 주요 선진국 빅데이터 추진전략의 시사점
앞서 살펴 본 주요 선진국의 빅데이터 추진 전략과 활용에 나타난 시사점을 요약하면 다
음과 같다.
12) 액티브 재팬 전략 실현을 위한 5대 추진 전략: 1) 액티브 데이터 전략 (빅데이터 이용과 활용에 의한 사회
경제 성장), 2) 액티브 라이프 전략 (적극적이고 쾌적한 생활환경 실현), 3) 리치 콘텐츠 전략 (풍부한 콘
텐츠 개발 및 플랫폼 실현), 4) 안심 안전 고신뢰 ICT 전략 (세계 최고 수준의 사이버보안 환경 실현), 5) 액티브 커뮤니케이션 전략 (견고하고 유연한 ICT 인프라 구축)
13) http://bigdataforum.or.kr
지방자치단체의 빅데이터 도입을 위한 제언
19
1) 국가 미래전략과 선제적 정책 수립에 적극 활용
미국, 영국, 싱가포르는 2,000년대 중반부터 빅데이터 분석을 통해 자국의 안전과 새로운
기회를 포착하기 위한 수단으로 정부 차원의 노력을 집중하고 있다. 특히 국가 위기관리 등
범정부 차원의 분석과제를 발굴하고 여기에 빅데이터를 적용하고 있다. 그 밖에 빅데이터 협
력 체계를 범정부 차원에서 구축, 각 부처가 보유한 데이터의 연계・및 활용을 촉진하고 있으
며 의료, 복지, 교육 등 국민생활과 직결된 분야에 빅데이터를 적극 활용함으로써 다양한 국
민맞춤형 서비스 개발과 국가혁신을 주도하고 있다.
2) 기술개발 및 인력양성 등 빅데이터 활성화를 위한 연구개발에 주력
2000년대 후반, 스마트 기기가 본격적으로 보급되면서 개인 및 조직의 행태를 추론할 수
있는 비구조화된 데이터의 급속한 증가로 빅데이터의 중요성이 대두되었다. 이러한 대용량
데이터는 데이터간의 관계성을 통합하여 가시적으로 표현됨으로써 사실에 근거한 정책의사
결정을 지원하고 있다. 각국 정부는 비정형・대용량 데이터에 대하여 다양한 분석이 가능하도
록 정부 주도로 신기술을 개발하고, 빅데이터의 분석・활용을 위한 연구에 대학・민간 부문이
자발적으로 참여하도록 지원하고 있다. 또한 데이터 과학자에 대한 중요성을 인지하고 인재
확보와 내부 역량 강화에도 노력하고 있다.
3) 공공데이터의 개방과 공유 추진
공공데이터가 지닌 무한한 경제적 가치를 발굴하도록 하기 위하여 공공데이터의 개방과
공유는 필수적이다. 공공데이터의 개방·공유 환경 조성을 위하여 각국 정부는 정보 공개를 위
한 제도적 기반을 마련할 뿐 아니라 플랫폼 조성을 위한 오픈 API14), Linked Data(이만재,
2011) 등 기술적 기반도 제공하고 있으며 재난방재, 범죄 예방 및 치안, 테러, 보건·의료, 복지
향상 등 공공데이터 제공을 위한 플랫폼(예: data.gov)도 구축하고 있다. 각국의 개방된 공공
데이터를 살펴보면 2013년 1월 현재, 미국은 392,000종, 영국 8,000여종, 싱가포르 5,000여
종인데 반하여 한국은 400여종으로 미미한 상태이다(정보통신정책연구원, 2013).
EU는 공공데이터의 개방과 재이용을 통한 직간접적인 경제적 효과가 1,400억 유로에 달
14) 웹사이트 내부 데이터를 외부에서 활용할 수 있도록 공개된 프로그래밍 인터페이스
한국지역정보화학회지 제16권 제3호
20 │ Journal of Korean Association for Regional Information Society
할 것으로 예측했다. 영국 정부가 구축한 공공데이터 포털에 축적돼 있는 8,000개 남짓한 데
이터 셋의 경제적 가치는 160억 파운드로 추산되고 있다. 우리나라 역시 전문가에 따라 차이
는 있지만 공공데이터를 전면 개방해서 잘 활용하면 2017년까지 15∼52만 명의 일자리가 창
출된다고 예측하고 있다.
Ⅲ. 공공부문의 빅데이터 활용사례
문헌 연구를 통해 국내외 공공부문에 적용된 빅데이터 사례를 32가지 선정하였으며, 이는
사회, 의료・보건, 금융, 교통, 재난・국방・치안과 같이 다섯 가지 적용분야로 분류하였다. 먼
저 각 사례의 요점을 설명한 후 전반적인 동향과 시사점을 정리해 본다.
1. 사회 분야
빅데이터 분석은 주요 일간지, 소셜 데이터, 혹은 민원 센터의 로그 데이터를 이용하여 사
회이슈의 자동감지와 특정 주제에 대한 동향 분석을 통해 잠재적 정책 수요의 발굴이 가능하
다. 또한 지역별 이슈를 도출할 수 있으며 지역별 맞춤형 대국민 서비스 전략 수립에도 활용
할 수 있다.
① 사회통합을 위한 민원동향 분석 사례
한국 국민권익위원회에서는 연간 300만여 건의 민원을 분석, 민원동향분석시스템을 구축
해 민원 발생원인을 차단하고, 행정 서비스의 만족도를 제고시키고 있다(민원정보분석센터,
2013). 2011년에는 이 시스템을 기반으로 이민자 민원현황을 분석하여 신규정책 수립 및 제
도 개선을 지원하였다.
② 구제역 민원현황 분석 사례
한국 국민권익위원회는 2010년 안동 지역 구제역 민원현황을 분석하여 관련기관에 제공
하고, 이후 추가로 정책에 활용하기 위해 2011년 국민신문고 접수 민원을 대상으로 민원분석
보고서를 작성하였다. 이 보고서는 질병 및 전염병관리와 관련한 사회 이슈를 분석, 맞춤형
민원 서비스를 달성한 사례로 꼽히고 있다15).
지방자치단체의 빅데이터 도입을 위한 제언
21
③ 자살 문제 해결을 위한 사례
서울의 모 종합병원과 소셜분석 전문기업이 공동으로 SNS 텍스트마이닝 기법을 사용하
여 자살 위험이 높은 시기를 예측하는 시스템을 세계 최초로 개발하였다. 연구팀은 2008년 1
월 1일부터 2009년 12월 31일까지 국가 자살통계와 SNS 상에서 자살이나 자살 관련 단어의
빈도를 비교하는 방식으로 블로그나 트위터 등에서 '힘들어 죽겠다'거나 '자살하고 싶다'는 등
의 용어가 많아지면 국내에서 자살률이 높아진다는 사실을 규명했다. 이 프로그램을 2010년
자살 통계에 적용한 결과, 정확률이 79%였다. 앞으로 SNS와 빅데이터 분석을 더 광범위하게
활용하면 정확도를 90%대까지 끌어올릴 수 있을 것으로 기대되며, 국가 차원에서 활용하면
좀 더 효율적인 자살 예방 사업을 펼칠 수 있을 것으로 기대된다(권정은 외 1인, 2012).
④ 미국 콜로라도주 교육부 통합자료 시스템 사례
미국 콜로라도주 교육부는 데이터 관리원칙을 바탕으로 주 전체에 걸쳐서 통합자료 시스
템을 개발하였고, 데이터에 쉽게 접근할 수 있도록 하였다. 이 시스템은 178개 초중고 학교지
구와 28개 공립대학들로부터 학생들의 복지, 소득, 인력 데이터를 수집해 하나의 통합 플랫폼
에 제공함으로써 학생들의 학업 성취도를 취학 전 시기부터 대학 졸업 전 단계까지 분석할 수
있게 해 준다16).
2. 의료 및 보건 분야
의료 및 복지 지출 데이터, 민원센터 로그, 소셜 데이터, 해당 기관 홈페이지 및 포털 게시
판, 주요 일간지 등을 통합 분석하면 의료보험 비용 분석을 통한 사업 최적화, 부당 청구방지,
복지정책 입안과 만족도 분석, 지역별 복지 불균형 해소 등의 문제를 해결할 수 있다.
공중보건 분야에서는 전국의 의료 데이터를 연계하여 전염병 발생과 같은 긴박한 순간에
빠른 의사결정을 할 수 있게 하여 준다.
15) “안동・예천 구제역 피해농가 36가구 보상”, 국민권익위원회블로그, 2011년 6월 30일, http://blog.daum.net/loveacrc/4063
16) 빅데이터 전략연구센터(2013), 새로운 미래를 여는 빅데이터 시대, p.194.
한국지역정보화학회지 제16권 제3호
22 │ Journal of Korean Association for Regional Information Society
⑤ 환자 임상정보 분석 사례
2011년 미국의 ‘세톤 헬스케어 패밀리’라는 병원이 IBM의 인공지능 슈퍼컴퓨터 왓슨
(Watson)의 ‘의료용 콘텐츠 및 예측 분석기술’을 이용하여 환자 데이터를 분석하였다. 이 기
술은 방대한 양의 환자 데이터에서 임상정보를 추출・분석해 미래를 예측하고 대비함으로써
환자의 재입원과 병원 방문횟수를 감소시킬 수 있었다17).
⑥ 1000 유전체 프로젝트 사례
1000개 유전체 프로젝트는 2008년 1월 영국, 미국, 중국이 합작하여 다양한 인종으로 구
성된 인간 1000명의 유전체를 3년 내 해독하는 국제 프로젝트로써 그 동안 데이터 용량이 너
무 커서 일부 연구자들만 사용할 수 있었으나, 향후 컴퓨팅 서비스에 대한 비용만 요구할 계
획이다18).
⑦ 단백질 데이터 은행 사례
미 국립보건원은 전 세계 단백질 구조 관련 데이터 저장 및 유통 촉진을 위해 ‘단백질 데
이터 은행’을 운영하고 있다. 미국, 영국, 일본이 공동 운영하는 이 사이트는 현재 8,000여 개
의 단백질 구조 데이터를 저장하고 있으며, 매달 1 테라 바이트 규모의 단백질 데이터가 축적
되고, 매달 140개국 21만 1,000여 명의 사용자가 방문하고 있다19).
⑧ Pillbox 프로젝트를 통한 의료개혁 사례
미국은 국립보건원 사이트를 통한 알약 검색 정보를 활용하는 ‘필박스(pillbox) 프로젝트’
를 수행하였다. 필박스를 통해 수집된 빅데이터를 통해 후천성면역결핍증(HIV) 등 관리대상
인 주요 질병의 분포, 연도별 증가 등에 대한 통계치 확보가 가능하게 되었고, 연간 약 560억
원을 절감할 수 있었다20).
17) 상게서, p.41818) 빅데이터 전략연구센터(2012), 빅데이터로 진화하는 세상: Big Data 글로벌 선진 사례, pp.68∼71.19) 상게서, p.16120) 상게서, pp.72∼75.
지방자치단체의 빅데이터 도입을 위한 제언
23
⑨ 구글 검색어 분석을 통한 독감예보 서비스 사례
실시간으로 독감이 검색되고 있는 추이를 보여주고 있는 구글의 독감예보시스템은 독감,
인프루엔자 등 감기와 관련된 검색어 쿼리의 빈도를 조사, ‘구글 독감 동향(Google Flu
Trends)’이라는 독감확산 조기경보서비스를 만들었다. 이 서비스는 미국 보건당국보다 한발
앞서 시간 및 지역별 독감 유행정보를 제공하고 있다21).
⑩ LA 카운티 육아서비스 보조금 부당청구 적발 사례
LA 카운티는 증가하는 육아서비스 관련 사기범죄에 전문적인 사기단이 연루된 것으로
추정하여 빅데이터 분석을 통해 보조금 수령인과 서비스 공급자를 파악 후 사기 행위에 연루
될 가능성이 큰 대상과 기금의 대량 손실이 발생할 우려가 있는 분야를 예측하여 조사 우선순
위를 결정하고 있다. 육아서비스 부당 청구 적발로 연간 $7M∼ $31M 비용절감을 하였고 부
정거래 검출 정확도를 85%로 향상시켰다22).
⑪ 동식물 및 인체 전염병 확산 대응 사례
영국은 글로벌 차원의 동식물 및 인간의 전염병에 효과적으로 대응하기 위해 정책을 제시
하고, USN, 데이터마이닝, 유전공학, 생물정보학 등을 이용하여 HIV/AIDS, 말라리아 등 다
양한 전염병에 대한 전망과 대응방안을 마련하였다. 또한 위성으로부터 농작물의 색깔 분포
등 특징을 파악한 후, 농작물의 위치, 건강 상태에 대한 정보를 추가로 수집하여 풍향과 기타
지리적 요소를 근거로 농작물 전염병의 이동 경로를 파악한다. 이러한 정보를 바탕으로 전염
병 확산에 대응하기 위한 농작물 전염병 영향예측 시스템을 개발하였다(Steinberg and
Bowman, 2004).
⑫ 영국의 비만대책 수립 사례
영국 정부는 2050년까지 남자의 60%, 여자의 50%가 비만이 될 것임을 밝히고, 매년 499
억 파운드가 소요될 것으로 전망하였다. 따라서 비만 문제는 더 이상 개인의 문제가 아닌 사
회적 문제임을 선언하고, 향후 40년간 영국사회의 비만문제를 효과적으로 대응하기 위해서
빅데이터를 통한 과학적 근거를 기반으로 정부, 기업, 시민사회의 공조하여 지속가능한 비만
21) 상게서, pp.88∼89.22) 한국지역정보개발원(2012), 빅 데이터 시대의 데이터 활용과 전략, 지역정보화 동향분석 제3호, p.8
한국지역정보화학회지 제16권 제3호
24 │ Journal of Korean Association for Regional Information Society
대책을 수립하였다23).
⑬ 싱가포르 조류독감 시뮬레이션 사례
본 연구의 목적은 조류독감이 싱가포르에 전염됨으로써 벌어질 수 있는 미래 시나리오를
연구하고 대응방안을 마련하는 것이다. 조류 독감 상황에 대한 시스템 맵이 구축되어 분석가
들이 지역에서 벌어지는 독감 출현의 위협 수준들을 평가한다24).
⑭ 농축산물 유통정보 분석 사례
농축산물에 대한 이력정보부터 농축산물의 토질, 온도와 습도, 일조량, 농약 및 유통경로
등 유통정보를 분석함으로써 안전한 먹거리 시스템을 강화하는 데에도 빅데이터가 활용되고
있다25).
3. 금융 분야
조세, 금융 거래 데이터와 소셜 데이터의 통합 분석을 통하여, 금융 거래 이상 징후, 조세
회피와 탈세 등의 패턴 감지와 조기 대응력 확보, 금융 및 조세 정책에 대한 시민 인식과 지역
별, 기간별 동향에 대한 분석을 수행하는데 빅데이터 분석을 활용할 수 있다. 빅데이터 기반
탈세방지시스템은 세무분야에서도 큰 성과를 나타내고 있다. 최근 정부가 지하경제 양성화를
추진하는 것도 세원 확대 없이는 복지재원 마련이 어렵기 때문이다. 빅데이터를 탈세방지에
접목한 뉴욕주의 사례는 시사하는 바가 크다.
⑮ 탈세방지 시스템 통한 국가재정 강화 사례
미국 국세청(IRS: International Revenue Service)은 사기성 납세신고 및 환급에 의한 탈
세 유형 적발을 목적으로 운영하고 있는 RRP(Return Review Program)에 빅데이터 실시간
분석 기법을 적용하는 프로젝트를 추진하였다. 빅데이터 솔루션을 기반으로 빅데이터에서 이
상 징후를 찾아내고, 예측 모델링을 통해 과거 행동정보를 분석해 사기패턴과 유사한 행동을
23) 빅데이터 전략연구센터(2013), 새로운 미래를 여는 빅데이터 시대, p.6124) 빅데이터 전략연구센터(2013), 새로운 미래를 여는 빅데이터 시대, pp.42∼43.25) 상게서, p.49.
지방자치단체의 빅데이터 도입을 위한 제언
25
파악하며, 소셜네트워크 분석에 기반 한 범죄네트워크 분석기능을 통해 문제점을 찾아낸
다26).
⑯ 탈세 방지 시스템 사례
미국의 뉴욕주는 빅데이터를 탈세방지에 접목한 탈세방지시스템인 CISS(Case
Identification & Selection System)를 개발하여 환급사기적발에 큰 성과를 거두었다. CISS
도입 이후 부양가족의 허위신고와 판매세 허위환급이 사라졌다. 빅데이터 기반 탈세방지시스
템은 세원이 한정된 반면 탈세나 탈루 수법은 갈수록 지능화되고 있는 한국 등 여러 국가에서
사기방지에 혁신을 일으킬 수 있을 것으로 기대된다27).
⑰ 미국 주 정부 세금 시스템 사례
미국 오하이오와 오클라호마 주 정부가 국세청 데이터와 고용데이터를 연동하여 신규 세
원, 미납세금 확인 등에 활용하고 있다(정용찬, 2012).
⑱ 금융감독원의 저축은행 여신상시 감시시스템 사례
2012년 12월 16일 금융감독원은 여신상시 감시시스템을 구축하여 2013년 1월부터 본격
가동하였다. 저축은행의 여신관련 정보를 이용하여 데이터마이닝 기법인 연관성 분석을 통해
불법 및 부실혐의 여신을 사전에 탐지 할 수 있다. 금융감독원은 심도 있는 현장 여신검사를
할 수 있게 되고, 저축은행 스스로 불법 및 부실여신 취급을 자제하도록 하는 예방효과를 기
대할 수 있다28).
⑲ 한국석유공사 국내 유가예보 서비스 사례
한국석유공사는 2011년 말, 데이터분석 전문회사와 협력하여 유가예보 시스템을 개발하
였다. 고유가에 따른 소비자 부담을 감소시키기 위해 유가의 단기 미래가격을 예측하여 제공
하는 오피넷 시스템을 구축한 것이다. 오피넷 웹서비스를 통해 국내 1,300여 개의 주유소로
26) 빅데이터 전략연구센터(2013), Big Data 글로벌 10대 선진 사례, pp.6∼8.27) “빅데이터! 세금도둑도 잡는다?”, 머니투데이, 2013년 7월 16일,
http://news.mt.co.kr/mtview.php?no=2013071511335624582&type=128) "정신 못차리는 저축은행", 서울경제, 2013년 9월 22일,
26 │ Journal of Korean Association for Regional Information Society
부터 수집된 휘발유 가격정보를 제공한다29).
4. 교통 분야
도로 센서 네트워크, 사건사고 로그, 날씨, 명절 및 스포츠 등의 이벤트 데이터와 빅데이터
에 기반한 교통 흐름 모델링과 예측, 최적화 시스템 구현, 교통 신호 체계와 유지보수 정책에
반영이 가능하다.
⑳ 서울시 심야버스 노선 최적화
서울시는 시민들의 휴대폰 통화량을 기반으로 한 KT의 유동인구 데이터와 시가 보유한
교통 데이터를 융합・분석해 최적의 심야버스 노선을 구축했다. 시민들이 자정부터 새벽 5시
까지 심야 시간대에 사용한 휴대폰 콜 데이터 30억여 건과 시민들이 이용한 심야택시 승・하
차 데이터 500만 건의 빅데이터를 융합하여 분석한 결과가 반영되었다. 이어 기존의 버스노
선과 시간・요일별 유동인구 및 교통수요 패턴을 분석하고, 노선부근 유동인구 가중치를 계산
하는 등 재분석을 거쳐 최적의 노선과 배차간격을 도출했다. 이번 심야노선 구축은 행정 데이
터만 활용하던 과거의 시 정책에서 민・관이 구축한 빅데이터를 융합했다는 데 의미가 있으며
도시교통정책에 빅데이터를 활용한 사례이다30).
㉑ 센서데이터를 활용한 지능형 교통안내 시스템 사례
일본은 센서데이터를 활용한 지능형 교통안내 시스템은 실시간으로 GPS 데이터를 분석
하여 최적의 교통정보를 사용자에게 전달하는 서비스를 제공한다. 택시 및 정보 제공에 동의
한 내비게이터 사용자로부터 얻어진 교통상황과 관련된 데이터를 종합 분석하여 실시간으로
출발지에서 목적지까지의 최적경로를 안내한다. 사용자에게 최적의 교통상황 및 경로를 안내
함으로써 에너지 효율을 높이고, 교통체증을 감소시키는 효과를 거두었다31).
29) 빅데이터 전략연구센터(2012), 빅데이터로 진화하는 세상: Big Data 글로벌 선진 사례, pp.42∼45.30) “서울시, 빅데이터로 심야버스 노선 구축”, 중앙일보, 2013년 7월 2일,
http://article.joins.com/news/article/article.asp?total_id=11959173&ctg=121331) 빅데이터 전략연구센터(2013), Big Data 글로벌 10대 선진 사례, p.9.
지방자치단체의 빅데이터 도입을 위한 제언
27
㉒ 밀라노 교통상황 예측 사례
교통흐름에 영향을 주는 다양한 정보들을 종합적으로 분석하여 최적의 교통안내 서비스
를 제공하고 있으며, 5분에서 15분 간격으로 수집된 데이터를 분석하여 향후 2∼24시간 후의
교통상황 예측이 가능하다32).
5. 재난 국방 치안 분야
센서 데이터, CCTV, 소셜 데이터로부터 도심 내의 문제를 조기 파악하거나 재난의 조기
감지하고 대응할 수 있으며 도시민과 재난 지역의 시민 목소리를 바르게 이해, 응급 시 활동
에 반영할 수 있는 정책 의제 발굴에 활용이 가능하다. 뿐만 아니라 국가 안보, 국방, 치안 분
야 업무에도 적용 가능하다.
㉓ 재난관리청 실시간 재난 모니터링 사례
미국의 공공기관인 재난관리청(FEMA)은 재난에 신속하게 대응할 수 있도록 소셜미디어
및 타 정부기관과 연계시스템을 구축하였다. 페이스북, 트위터 등의 소셜미디어를 통하여 위
기상황과 구조요청 정보를 획득하여 실시간으로 응답하거나 위기관리 담당자에게 긴급상황
메시지를 전달할 수 있게 되었다. 재난관리청은 약 3만 명의 팔로워를 거느린 트위터 페이지
를 운영하고 소셜미디어 글의 모니터링에 주력하였다(국가정보화기획단, 2010).
㉔ 수해관리 프로젝트 사례
영국 해안의 침식은 가정과 경제에 큰 위협을 가하고 있으며, 수백만 명이 이 위험에 노출
되고 있으며, 해마다 홍수에 대한 피해가 20배씩 증가하고 있다. 이처럼 영국을 순식간에 위
협할 수 있는 잠재적 위험에 대한 위험관리 프로젝트을 통해 30∼100년 이후를 대비한 위험
관리 대책을 마련하였다. 이 프로젝트를 통하여 기후변화, 강의 형태, 생태계의 변화 등 홍수
피해를 줄 수 있는 데이터 기반의 과학적 의사결정을 지원하고 있다33).
32) 빅데이터 전략연구센터(2012), 빅데이터로 진화하는 세상: Big Data 글로벌 선진 사례, pp.14∼15.33) 빅데이터 전략연구센터(2012), “선진국의 데이터기반 국가미래전략 추진현황과 시사점”, IT&Future
Strategy 제2호, p.21.
한국지역정보화학회지 제16권 제3호
28 │ Journal of Korean Association for Regional Information Society
㉕ 맨홀 안전관리 사례
뉴욕시는 오랫동안 맨홀 뚜껑이 폭발하는 사고가 이어져 왔다. 이에 미국의 통계학자 신
시아 루딘은 뉴욕시의 맨홀 5만1000개에 관련된 방대한 데이터로 예측 변수 106가지를 산출
하고, 이를 바탕으로 터질 위험이 있는 맨홀을 예측했다. 그리고 이후 심각한 사고를 일으킨
맨홀의 44%가, 루딘이 지목한 ‘위험성 상위 10%’에 포함된 것으로 나타나 분석의 유용성이
입증되었다34).
㉖ 테러 예측 시스템 사례
9.11 테러 이후, 국토안보부를 중심으로 테러 및 범죄방지가 주목을 받았다. 따라서 국토
안보부의 과학기술국에서 블로그, 소셜미디어, 수범사례 등 범정부적 빅데이터를 수집하고
분석하여 예측체계를 도입하였다. 특히, 사이버안보를 위해 빅데이터를 활용한 클라우드 보
안 인프라를 구축하였다35).
㉗ 해상 상황 인식 프로젝트 사례
싱가포르 국방부는 미국합동군사령부 그리고 북대서양조약기구와 공동으로 해상 안전 확
립을 위해 해상 상황인식 프로젝트를 추진하였다. 해상 테러, 해안침투 등 해상상황에 관한
의사결정을 지원하기 위해 위크시그널과 예상 시나리오 등 정보처리와 시각화를 수행하였다
(Lim, 2007).
㉘ 범죄 예방 시스템으로 안전 지역사회 구축 사례
샌프란시스코는 빅데이터 분석을 활용하여 과거 8년 동안 범죄가 발생했던 지역과 유형
을 세밀하게 분석하여 후속 범죄 가능성을 예측함으로써 범죄를 사전 예보하는 시스템을 구
축하였다. 이는 과거 범죄에 대한 통계 정보를 제공하는 것과 달리 새로운 범죄 가능성 정보
를 제공한다는 것에 큰 의미가 있다. 정책적 시사점은 과거 범죄자 및 범죄 유형을 소셜 네트
워크를 통해 지속적으로 관찰함으로써 그와 관련된 조직 및 범죄에 대한 예방이 가능하다는
것이다36).
34) “‘빅 데이터’ 세계를 꿰뚫다”, 시사인라이브, 2013년 7월 26일, http://www.sisainlive.com/news/articleView.html?idxno=17271
35) 빅데이터 전략연구센터(2013), “새로운 미래를 여는 빅데이터 시대”, pp.69∼70.
지방자치단체의 빅데이터 도입을 위한 제언
29
㉙ 유전자 색인 시스템 사례
FBI는 유전자 감식 결과 도출된 고유한 패턴을 데이터베이스에 저장, 검색할 수 있도록
해당 법안을 개정하고 구축된 유전자 데이터베이스를 기초로 입력 대상, 활용범위 등을 지속
적으로 확장시켜 효율적인 범죄자 감식 시스템을 마련하였다. 유전자 정보은행 CODIS
(Combined DNA Index System)는 미제 사건 용의자 및 실종자에 대한 DNA 정보 1만 3,000
건을 포함한 12만 명의 범죄자 DNA 정보를 보유하고 있다37).
㉚ 소셜네트워킹 분석을 이용한 범죄예방 사례
미국 워싱턴주 노동산업부는 소셜네트워킹 분석을 통해 개인 범죄 연루자와 사기범죄 조
직을 파악함으로써 사기행각을 적발하고, 주변인들의 범죄 공모 여부, 범죄 조직과의 연관성
등을 파악하고 있다38).
㉛ 수배자 위치추적 프로그램 사례
위치추적 서비스 MetaCarta는 AI와 빅데이터를 접목하여 수천 개의 서류를 분석하고 그
결과를 대규모 지리 데이터베이스를 이용하여 상호 검증하도록 하여 위치를 정확히 제시해
준다. 즉, 수배 중인 사람의 이름이나 관련 키워드를 입력하면 그 사람의 소재위치를 정확하
게 지도에 맵핑해 주는 프로그램이다. 이 서비스는 범죄활동의 패턴을 추적하여 그 활동패턴
이 집중되는 위치를 찾아내는 데 활용이 가능하다39).
㉜ 스마트 CCTV를 이용한 사회안전망 사례
USN, CCTV 등 사회 전반에 IT 기기가 보급됨에 따라 데이터 분석에 의한 사회 안전망
서비스는 지속적으로 진화하고 있다. 특별한 움직임이 감지되었을 때만 움직이는 스마트
CCTV는 보안 관서에 정보를 제공함으로써 실시간으로 사회 안전을 확보하는데 기여하고 있
다. 또한 이른 새벽 낯선 사람들의 움직임 등 부자연스러운 행동 패턴을 탐지함으로써 경찰서
나 보안 서비스 업체에 경보를 발령하는 등 진화하고 있다40).
36) 빅데이터 전략연구센터(2013), Big Data 글로벌 10대 선진 사례, pp.40∼41.37) 빅데이터 전략연구센터(2013), Big Data 글로벌 10대 선진 사례, p.38.38) 빅데이터 전략연구센터(2013), 새로운 미래를 여는 빅데이터 시대, p.184.39) 상게서, p.419.
한국지역정보화학회지 제16권 제3호
30 │ Journal of Korean Association for Regional Information Society
적용분야
번호 사례 내용 / 효과데이터유형
지역범위
국가
사회
①민원동향분석시스템:
국민권익위원회 300만건 민원 분석
민원 발생원인 차단, 행정서비스 만족 제고
소셜 N 한국
②구제역 민원 현황 분석:
국민권익위원회질병 및 전염병 관리, 사회이슈
분석, 맞춤형 민원서비스소셜 N 한국
③ 자살 예측 시스템 SNS 1.5억건 실시간 분석 소셜 N 한국
④콜로라도주 교육부, 학업성취도 분석
중고 대학 학생들의 소득, 복지, 인력 데이터 수집
정형 R 미국
의료 ・
보건
⑤세톤헬스케어 패밀리병원,
환자 임상정보 분석재입원과 병원 방문횟수 감소 정형 R 미국
⑥ 국립보건원 게놈프로젝트 난치병치료, 신약개발 정형 G 미・영・중⑦ 단백질 데이터 은행 매달 140개국 21만명 방문 정형 G 미・영・일
이만재(2011). “빅데이터와 공공데이터 활용”. Internet and Information Security. 제2권2호.
이응용(2012). “빅데이터 시대, 새로운 가능성과 해결과제”. 인터넷 & 시큐리티 이슈: 한국인터
넷진흥원, 2012년 2월호: 4∼26.
일본 총무성(2012). ‘知識情報社會の實現に向けた情報通信政策の在り方: Active Japan ICT 戰
지방자치단체의 빅데이터 도입을 위한 제언
41
略’, 자료39-3-2, 2012.7.12 재구성.
정용찬(2012), “빅데이터 혁명과 미디어 정책 이슈”, KISDI Premium Report, p.10.
조문래(2012). “美・日의 Big Data R&D 전략과 우리나라의 대응과제“. IT R&D 정책동향: 정보통
신산업진흥윈.
Colin Upstill, Matthew Addis, Freddy Choi, Steve Taylor, and Rowland Watkins(2010). Infectious
Diseases: Preparing for the Future, Office of Science and Innovation, University of
Southampton IT Innovation Centre.
Lim, Irvin(2007), “Comprehensive Maritime Domain Awareness”, Journal of The Singapore Armed
Forces, Vol.33 No.3.
President's Council of Advisors on Science and Technology(2010). Design a Digital Future: Federally
Funded Research and Development in Networking and Information Technology. White House:
Executive Office of the President.
Steinberg, Alan & Christopher Bowman(2004). "Rethinking the JDL Data Fusion Levels". National
Symposium on Sensor and Data Fusion.
42)
김신곤: 제1저자, 연세대학교 경영학과를 졸업하고 서울대학교 대학원 경영학과에서 경영학 석사 (재무관
리), Georgia State University 에서 CIS (Computer Information Systems) 석사와 경영정보학 박사를 취득하
였다. 코리아로터리서비스 (KLS)에서 즉석복권을 개발하였고 현재 광운대학교 경영학부 교수로 재직 중이
다. 주요관심분야는 경영정보시스템, 시스템다이나믹스, 비즈니스 인텔리전스, CRM, 빅데이터 등이다
([email protected]). 조재희: 제2저자/교신저자, 연세대학교 경영학과를 졸업하고 Miami University(Ohio)에서 경영학 석사, University of Nebraska-Lincoln에서 경영정보학 박사를 취득하였다. 펜타시스템테크놀로지와 LG CNS에서
컨설턴트로 근무하였고, 현재 광운대학교 경영학부 교수로 재직 중이다. 주요 관심분야는 데이터자산의 전략
적 활용, 다차원 모델링, 데이터웨어하우스, 비즈니스 인텔리전스, CRM, 빅데이터 등이다([email protected]).