Top Banner
데데데 데데데데데 데데 데데데 데 데데데 데데데데데 데데 데데데 데 데데데데 데데데데 2004. 11. 19 2004. 11. 19 데데데데데 데데데 데데데데데 데데데
22

데이터 품질관리를 위한 방법론 및 활용방안

Jan 13, 2016

Download

Documents

aya

데이터 품질관리를 위한 방법론 및 활용방안. 2004. 11. 19 경희대학교 박주석. 데이타베이스 연구. 데이터베이스 연구는 지난 30 년 동안 IT 분야에 이론적으로나 산업적으로 엄청난 변화를 일으켜 왔었다. Architecture. Management. Engineering. PLAN. DO. SEE. 1990 년대 ~ 통합된 정보시스템. 1970 ~ 1980 년대 자동화된 정보시스템. 2000 년대 ~ 효과적인 정보시스템. 데이터모델링 데이터아키텍쳐 !. 데이타웨어하우스 - PowerPoint PPT Presentation
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: 데이터 품질관리를 위한 방법론 및  활용방안

데이터 품질관리를 위한 방법론 및데이터 품질관리를 위한 방법론 및 활용방안 활용방안

2004. 11. 192004. 11. 19

경희대학교 박주석경희대학교 박주석

Page 2: 데이터 품질관리를 위한 방법론 및  활용방안

Architecture

Management Engineering

PLAN DO SEE

1970 ~ 1980 년대자동화된 정보시스템

1990 년대 ~

통합된 정보시스템2000 년대 ~

효과적인 정보시스템

파일관리시스템데이타베이스관리시스템 SQL & CASE

데이터모델링데이터아키텍쳐 !

데이타웨어하우스 데이터품질 !!!

데이타베이스 연구

• 데이터베이스 연구는 지난 30 년 동안 IT 분야에 이론적으로나 산업적으로 엄청난 변화를 일으켜 왔었다 .

Page 3: 데이터 품질관리를 위한 방법론 및  활용방안

• 지금까지는 품질 (Quality) 를 관리하는 전통적인 이론에 대해서 살펴봄으로써 , 품질 관리의 핵심은 고객 만족과 이를 지속적으로 개선시키고자 하는 전사적 활동이 필요하다는 것을 알 수가 있었다 . 그렇다면 데이터 현상적 요소 ( 데이터 값 ) 나 구조적 요소 ( 데이터 모델 및 메타 데이터 ) 의 품질은 무엇이고 , 전통적 품질 관리 방법과 어떻게 연관 지을 수 있는 지에 대한 궁금증이 유발될 것이다 .

• 전통적 품질 관리 기법에서 말하는 품질의 대상은 바로 제품 (Product, 제품과 서비스를 포함하는 개념 ) 이다 . 그리고 고객이 만족하는 수준을 충족시키는 상태가 제품의 품질을 의미한다 . 따라서 데이터 품질 관리에서 이야기하는 품질의 대상은 데이터 (Data) 이며 , 데이터를 사용하는 사용자의 만족도를 충족시키는 수준을 만드는 과정이 데이터 품질 관리라고 할 수가 있다 .

데이터 품질의 정의• 데이터 (Data) – 조직의 전략 및 목적을 달성하기 위해서 , 전략 , 구현 , 운영 등의 정보 시스템 사이클

과정을 통하여 생성된 산출물을 의미한다 . 즉 , 여기서 의미하는 데이터란 데이터베이스 내에 저장되어 있는 데이터 값 뿐만 아니라 , 데이터 모델 및 메타 데이터 등의 데이터 구조적 요인까지 포함하고 있는 개념이다 .

• 데이터 품질 – 제조업의 제품이나 서비스 업의 서비스와 마찬가지로 , 조직의 목적을 위하여 생성된 데이터의 소기의 목적을 달성하기 위해서 이용하고자 하는 조직 구성원들의 만족도를 충족하는 수준 .

• 데이터 품질 관리 – 데이터 품질을 유지 및 개선시키기 위하여 , 데이터 자체에 대한 품질 유지 활동을 지속적으로 유지하고 관리하는 활동을 의미한다 .

데이터품질 정의

Page 4: 데이터 품질관리를 위한 방법론 및  활용방안

• Larry P. English 는 데이터 및 정보 (Information) 를 고객 니즈 (Needs) 에 따라 데이터 사용자를 다음과 같이 분류하였다 .

데이터 사용자 (Data Customer)

• 최종 사용자 (End Customer) – 조직의 제품 및 서비스를 구매하여 실질적으로 매출이 발생하게 하는 사용자들이다 . 가령 , 한 조직이 생산한 전자부품을 팔기 위해서는 그들의 구매자들에게 자사 부품에 관련된 데이터 및 정보를 알려주어야 한다 . 이 때 , 전자 부품에 대한 자세한 데이터에 대해서 고객들이 충분히 만족하는 지에 대한 여부가 데이터 품질에 해당된다 .

• 내부 구성원 (Internal Knowledge worker) – 조직 내의 업무 필요에 따라서 , 해당 데이터를 이용하여 업무를 수행하는 조직 내 구성원들을 의미한다 . 예를 들면 , 백화점 내 매장 관리를 하기 위한 영업 사원에서 부터 조직 전체적인 매출관리를 담당하는 영업 관리자 , 영업 전략 및 마케팅 전략을 수립하는 전략 기획 임원 및 대표까지의 모두에 대한 만족을 이끌어 내는 것이 데이터 품질이라고 할 수가 있다 .

• 조직 이해관계자 (External stakeholders) – 투자 , 감사 및 감시 등의 이유로 조직의 정보를 필요로 하는 사용자를 의미한다 . 예를 들면 , 한 기업에 투자하기 위한 투자자나 이미 투자하고 있는 사람들은 조직의 재무 정보 및 기타 기업 정보에 대해서 정확하고 신속하게 알고 싶어한다 . 다른 예로는 공공 기관의 감사 업무 수행 시 , 외부 감사자들은 해당 기관의 정책 실적 및 예산 집행 등에 관한 정보를 알고 싶어한다 . 이들에 대한 데이터 및 정보의 만족도를 재고하는 일이 데이터 품질이라고 할 수가 있다 .

Page 5: 데이터 품질관리를 위한 방법론 및  활용방안

• 국내 공공 기관 DB 관리 허술 – 공공기관의 데이터베이스 관리체계가 허술한 것으로 나타났다 . 이는 최근 전자정부 프로젝트의 일환으로 , 공공기관 간 데이터 공동 활용이나 통합을 위한 시스템 구축사업에도 상당한 걸림돌로 작용할 것으로 전망돼 대책마련이 시급한 것으로 지적됐다 . 한국데이터베이스진흥센터가 지난 6∼9 월까지 46 개 공공기관을 대상으로 실시한 ‘ 2004 데이터베이스 품질진단결과’ 데이터와 이에 대한 관리 수준은 100 점 만점에서 58.7 점으로 나타났다 . 부문별로는 데이터 영역의 품질 수준은 평균 60.6 점으로 상당수 공공기관의 데이터베이스에 엉뚱한 데이터가 들어 있거나 당연히 있어야 할 데이터가 없거나 , 동일한 내용에 대해 내부 시스템 별로 서로 다른 데이터를 갖고 있는 것으로 나타났다 .

또 관리 프로세스 영역은 평균 56.1 점으로 대다수 공공기관이 아직 데이터 표준이나 데이터 모델을 체계적으로 관리하기 위한 프로세스를 갖추지 못한 것으로 조사됐다 . 이 밖에 데이터베이스 관련 시스템 분야는 평균 59.4 점으로 나타났다 . 김선영 선임연구원은 “일반적으로 민간기업의 잘못된 데이터로 인해 발생되는 손실은 해당 기업이 떠안겠지만 공공기관의 데이터 품질로 인한 피해는 고스란히 행정서비스의 수혜자인 국민에게 돌아가 그 심각성이 크다”고 말했다 . 실제로 최근 호적정보시스템에서 10 명 중 1명꼴로 데이터 오류가 발견되고 금융사의 금융계좌 100 개 가운데 1 개꼴로 잘못된 주민등록번호가 사용되는 사례는 데이터베이스 관리의 허점을 적나라하게 보여준 대표적인 사례라고 진흥센터 측은 설명했다 . 또 이 같은 국내 상황은 미국은 연방정부가 제공하는 정보의 품질을 보장하기 위해 ‘데이터 품질 법 (Data Quality Act)’ 을 제정하고 예산관리국이 실행 가이드라인을 만들어 제공하는 것과 대조적이라고 진흥센터는 덧붙였다 . ( 전자신문 2004 년 10 월 12 일 기사 )

저 품질 데이터 사례

Page 6: 데이터 품질관리를 위한 방법론 및  활용방안

• 개인 정보 관리 소홀로 인한 법적 공방 – 대규모 고객 개인 정보를 보유한 이동통신사업자 및 포털 사이트 · 쇼핑몰 등의 온라인 상의 개인 정보 유출 문제가 심심찮게 지적되는 가운데 이용자들이 기존의 소극적 묵인에서 탈피해 사법 처리 등 적극적인 대응을 꾀하고 나섰다 . 이에 따라 그 동안 개인 정보보호에 소홀해왔던 기업들이 긴급 조치에 나섰으나 관계사 등을 통한 개인 정보 유출에 보다 지속적인 관심이 필요하다는 지적이 높아지고 있다 . 최근 이와 같이 공개적인 사이트에 자신의 실명과 직장명까지 밝히며 개인 정보 도용 내역을 상세히 설명하고 실제로 개인정보분쟁조정위원회 등 관련기관에 신고하거나 해당 기업에 직접 시정 조치를 요구하는 사례가 늘고 있다 . 이 같은 양태는 기존에 ‘늘 있는 일’로 치부하는 정도에서 벗어나 게시판에 이를 등록해 공개적으로 문제 삼거나 아예 시민 단체 등과 연계해 조언을 받고 법적 피해 보상 가능성을 검토하는 등 적극적인 대응으로 변모했다는 점에서 눈길을 끌고 있다 . 사용자들이 이처럼 적극적인 행보를 보이자 기업들도 대응 방안 마련에 분주한 모습이다 . ( 전자신문 2004 년 09 월 09 일 기사 일부 )

• 8 년 동안 2,300 만 달러를 더 지불한 미국 시민 – 미국 연금 계산 오류로 인하여 Nashvill 시민 일부는 8 년 동안 2,300 만 달러를 초과하여 지불하였으며 , 반면에 다른 사람들은 같은 기간 동안에 2,600 만 달러를 적게 낸 것으로 밝혀졌다 . (The Tennessean, 1998 년 03 월 21 일 기사 일부 )

• 세금 고지서 수취인 불분명으로 반환 - 1992 년 , 미국 국세청은 96,000 장의 세금 고지서가 수취인이 거주하지 않는 다는 이유로 반송되었다고 밝혔다 . 이는 거주지 데이터의 오류로 인한 문제로 데이터 회계 감사에서 밝혀졌다 .

저 품질 데이터 사례

Page 7: 데이터 품질관리를 위한 방법론 및  활용방안

현상 개선 중심 모델 구조적 분석 중심 모델 지속적 개선을 위한 통합 모델

Doll & Tokzaden(1983)

Herther CD-ROM 평가 (1988)

Large 의 DB 품질평가 (1989)

SCOUG 평가법 (1990)

Granick 의 DB 평가기준 (1991)Greg R. Notes 의 DB 평가기준 (2000)

MIT 의 TDQM (2000)

• 전체 6 단계의 프로세스로 구성 .• P1~P3: 데이터 평가 프로세스• P4: 데이터 유지보수와 ECTL 통제• P5: 프로세스 개선을 위한 프로세스• P6: 조직문화의 데이터 품질문화 전환

• MIT 대학 , 정부기관 , 기업 등의 협동 프로젝트• 데이터품질 정의 , 데이터품질이 기업에 미치는 영향 , 데이터 품질 개선 등의 3

가지 주제에 대한 연구 . Brodie 의 데이터 품질평가 (1980)

Larry P. English 의 TIQM (2002)

현상적 데이터품질요인 발견에 집중

구조적 데이터품질요인 발견에 집중

총체적 데이터품질요인 발견과 품질개선을 위한 절차에 집중

데이터모델 리소스북 (1997)

데이터모델 패턴 (1995)

데이터모델 핸드북 (1994)

• 초기의 데이터베이스 품질 평가 모델들은 현상 분석 중심에서 점차적으로 구조적 분석 중심 모델로 바뀌었으며 , 최근에는 TDQM, TIQM 등과 같이 지속적 개선을 위한 통합모델로 연구가 진행되고 있습니다 .

3

데이터품질 연구 (1/2)

자료원 : DPC 2003, 개정 : 경희대 박주석 2004

Page 8: 데이터 품질관리를 위한 방법론 및  활용방안

현상 개선 중심 모델 구조적 분석 중심 모델 지속적 개선을 위한 통합 모델

DPC 의 데이터베이스표준 연구 (1996)

박준식의 색인평가기준에 관한 분석(1996)

이제환의 분산체계로 구축된DB 품질검증 (1997)

안계성의 DB 품질평가항목 (2000)

한국 웹사이트평가개발원의DB 품질평가모델 (2002)

정보시스템 유형별 품질측정모형개발(1999)

분산환경을 위한 중복데이터구조연구(1994)

DPC 의 DB 품질관리 확장모델 (2003)

현상적 데이터품질요인 발견에 집중

구조적 데이터품질요인 발견에 집중

박주석 / 김찬수의 데이터성숙도모델 (2003)

국방데이터표준화 연구 (2002)

• 국내에서는 90 년대 말부터 데이터품질의 중요성이 부각되면서 이에 대한 연구가 진행되어 왔습니다 . 특히 많은 국내 기업들이 데이터웨어하우스를 구축하고 CRM 을 구현하면서 국내에서도 지속적인 개선을 위한 데이터품질에 관한 연구가 활발한 것으로 예상됩니다 .

4

데이터품질 연구 (2/2)

총체적 데이터품질요인 발견과 품질개선을 위한 절차에 집중

Page 9: 데이터 품질관리를 위한 방법론 및  활용방안

데이터베이스진흥센터 연구동향

DB 품질평가 모델개발

중장기 정책 및 세부시행계획 수립

DB 품질평가 안정적 운영 기반

DB 품질평가 중요성 마인드확산

DB 품질 관리지침 개발 / 보급

공공부문 DB 품질평가 우선 적용및 민간부문 자발적 참여 촉진

공공부문 DB 품질관리 의무화 DB 품질평가 민간부문 확대

2002 년 준비기 2004 년 확산기2003 년 도입기 2005~2006 정착기

현상 개선 중심 모델 구조적 분석 중심 모델 지속적 개선을 위한 통합 모델

• 데이터베이스 진흥센터는 데이터품질관리 개선과 관리를 위한 체계적인 계획을 수립하였습니다 . 2003 년의 데이터베이스 품질관리 확장모델 개발 후 2004 년에는 해당실무에서 실제로 적용할 수 있는 데이터베이스 품질관리 지침과 해설서를 제시함으로써 지속적인 개선을 통한 품질관리를 지향하고 있습니다 .

5

Page 10: 데이터 품질관리를 위한 방법론 및  활용방안

■ ■ 기 간 기 간 : 2004.5.24 ~ 10.23 (5: 2004.5.24 ~ 10.23 (5 개월개월 ))

■ ■ 연구주제 연구주제 : : 공공 부문을 위한 데이터 품질관리 지침 및 해설서 개발공공 부문을 위한 데이터 품질관리 지침 및 해설서 개발

■ ■ 연구 목적연구 목적

- - 공공기관이 보유하고 있는 데이터베이스의 체계적인 관리 및 품질개선을 공공기관이 보유하고 있는 데이터베이스의 체계적인 관리 및 품질개선을

지원하기 위해 데이터 품질관리 지침을 개발하여 보급함지원하기 위해 데이터 품질관리 지침을 개발하여 보급함 ..

■ ■ 연구 내용연구 내용

- - 데이터 품질관리 프레임워크 개발데이터 품질관리 프레임워크 개발 ..

- - 데이터 품질관리 단계 및 단계별 세부 작업을 도출하고 작업 별 세부활동 데이터 품질관리 단계 및 단계별 세부 작업을 도출하고 작업 별 세부활동

내역 및 방법내역 및 방법 , , 산출물 등을 정의산출물 등을 정의 ..

- - 지침 및 해설서 제시지침 및 해설서 제시 ..

데이터품질관리 지침개발 프로젝트

Page 11: 데이터 품질관리를 위한 방법론 및  활용방안

PLAN – DO – CHECK – ACT 사이클 방법론을 이용한 데이터 품질관리 지침 및 해설서 제시하고자 함 .

내용내용

-PLAN : PLAN : 데이터 품질관리 정의 및 중요성 제시데이터 품질관리 정의 및 중요성 제시 ..

-DO : DO : 데이터 품질관리 프레임워크 제시 및 품질관리 요소에 대한 지침 제시데이터 품질관리 프레임워크 제시 및 품질관리 요소에 대한 지침 제시 ..

-CHECK : CHECK : 품질관리 요소 평가에 관한 지침 제시품질관리 요소 평가에 관한 지침 제시 ..

-ACT : ACT : 품질관리 개선활동 관련 내용품질관리 개선활동 관련 내용 ..

핵심 연구 영역핵심 연구 영역

본 프로젝트의 범위

Page 12: 데이터 품질관리를 위한 방법론 및  활용방안

독립적인 관점 전사적인 연계성 관점

Data Service Quality

Data Quality Factors

Data Value Quality

• 포괄성• 정확성• 완전성• 최신성• 활용성• …

• 검색성

• 지원성

• 편의성

• 시스템성능

• …

• 단일성

• 일치성

• 재사용성

• …

Database Hierarchy Quality

기반개념의 품질원인개념의 품질

• 메타데이터의 품질 ( 표준데이터 , 데이터모델 , 데이터아키텍쳐 등 )

Data M

an

agem

ent P

roce

ss Qu

ality

데이터품질 구성영역의 확장

Page 13: 데이터 품질관리를 위한 방법론 및  활용방안

1. 초기 레벨

2. 반복 레벨

3. 정의 레벨

4. 관리 레벨

5. 최적화 레벨

규칙적인프로세스

표준 /일관된프로세스

예측 가능한프로세스

지속적으로개선되는프로세스

• 정보시스템을 개발 및 유지 관리하는 데에 안정적인 기반이 조성되지 않은 단계 .

• 프로젝트 관리 정책과 정책을 구현하기 위한 절차가 수립되어 있는 단계

• 정보 시스템을 개발 및 유지 관리하기 위한표준 프로세스가 조직 전반에 걸쳐 정의되고문서화 되어있는 단계

• 모든 프로세스에 대한 정량적인 측정이가능한 측정 지표들이 마련되어 있는 단계

• 모든 프로세스에 대한 지속적인 개선이 이루어지고 있는 단계

• 성숙도 모델의 특성은 각 단계로서 정의하기 때문에 현 수준을 쉽게 이해할 수 있고 쉽게 측정할 수 있고 다음 발전 단계를 쉽게 보여준다는 점에서 현실적이나 성숙도 모델 그 자체를 도출하기가 어려움

자료원 ’ Capability Maturity Model for Software’, SEI 1994

실행계획실행계획…..

Practices

성숙도 모델의 의미 : CMM

Page 14: 데이터 품질관리를 위한 방법론 및  활용방안

활용도 ( 시스템 , 업무 ) 관점

데이터베이스설계 관점

정보자원관리 관점

데이터베이스진흥센터의DB 품질관리 확장모델

+

데이터품질관리 수정모델 데이터품질관리 성숙도 모델

경희대 MIS 의 데이터품질관리 성숙도 모델

거시적 데이터품질관리 성숙단계에 대한 관점

미시적 데이터품질 요소에 대한 관점

• 미시적인 관점에서의 데이터 품질 관리 및 평가를 위해서 데이터베이스 진흥센터 (2003 년 ) 의 ‘데이터베이스 품질관리 확장모델’을 본 연구팀이 2003 년 사기업을 대상으로 파일럿 테스트를 하여 얻은 개선점을 추가하여 데이터 품질 관리에 이용하도록 하겠습니다 .

• 거시적인 관점에서 데이터 품질관리는 2003 년 DB 그랜드 컨퍼런스에 발표된 박주석 /김찬수의 ‘데이터베이스 성숙도 모델’을 이용하여 미시적 관점의 평가와 병행하여 성숙도 레벨의 관점을 포함하도록 하겠습니다 .

통합 데이터품질관리 모형

7

비용 /효과 / 위험 분석 관점

통합 데이터품질관리 모형

Page 15: 데이터 품질관리를 위한 방법론 및  활용방안

본 연구의 Data Quality Management Framework 는 관리 대상요소인 데이터 , 프로세스 , 조직과 품질 관리 활동인 전략 , 구현 , 운영과의 효율적인 맵핑을 통해 세부 데이터 품질관리 요소를 도출 할 수 있다 .

통합 데이터품질관리 Framework

Page 16: 데이터 품질관리를 위한 방법론 및  활용방안

• 데이터 (Data): 데이터 관리 및 품질 관리에 관한 주요 연구를 살펴 보면 , 데이터 현상적 요소에 대한 관리에 관한 연구 , 데이터 구조적 분석에 관한 연구 등으로 구분되어 진행되어 왔다 . 최근에는 이러한 두 가지 요소에 대한 통합적 관점을 가지고 데이터 품질관리의 지속적인 개선을 위한 연구가 선진국 등에서 수행되고 있다 . 본 프레임워크에서는 데이터 품질관리 활동은 데이터 현상적 요인과 구조적 요인 등 통합적 관점에서 수행하는 것이 바람직하다고 말하고 있다 . 따라서 데이터를 크게 데이터 값 ( 데이터 현상 ), 데이터 모델 및 메타 데이터 ( 데이터 구조 ) 등으로 구분하여 , 각 요소 별로 주요 품질 관리 사항에 대해서 살펴보고 있다 .

• 정책 및 규정 : 본 프레임워크의 정책 및 규정은 데이터 품질관리 활동을 수행하는 데에 있어서 데이터 자체에 대한 품질을 위한 정책 및 규정과 데이터 품질을 유지하고 개선하기 위한 관리 정책 및 규정에 대한 성격으로 구분할 수가 있다 . 즉 , 데이터 및 모델 관리 정책 및 규정 , 데이터 백업 및 복구 정책 및 규정 , 시스템 보안 및 사용자 접근 권한 정책 및 규정 등의 데이터 품질에 대한 정책 및 규정과 조직 정책 , 품질관리 교육 정책 및 규정 , 사용자 요구사항 정책 및 규정 , 문서 관리 정책 및 규정 등 데이터 품질을 유지 및 개선하기 위한 지원 활동에 대한 정책 및 규정으로 구분할 수가 있다 .

• 조직 (Organization): 데이터 품질 관리활동을 수행하기 위하여 조직은 크게 전략 조직 , 구현 조직 , 운영 조직 등 3 가지로 구분된다 . 여기서는 조직의 역할 및 책임 등 상세한 내용보다는 각 조직을 구성하는 필요 직책 별로 담당 업무 영역에 대해서 거론하고자 한다 . 즉 , 각 조직 별 담당 업무 영역에 대한 구분을 이해하여 , 조직 구조 및 책임 역할을 규정짓는 세부적인 활동은 수립하는 데에 도움을 주고자 한다 .

통합 데이터품질관리 Framework

Page 17: 데이터 품질관리를 위한 방법론 및  활용방안

레벨 레벨 11

DBMSDBMS 에 의한 데이터 에 의한 데이터 관리관리

레벨 레벨 22

데이터 모델에 의한 데이터 모델에 의한 데이터 관리데이터 관리

레벨 레벨 33

전사적 표준에 의한 전사적 표준에 의한 데이터 관리데이터 관리

레벨 레벨 44

전사적 데이터 전사적 데이터 아키텍처에 의한 데이터 아키텍처에 의한 데이터 관리관리

특징- 특정 DBMS 를 사용하여 업무 효율성을 위주로 하여 데이터 적재와 보고 기능을 위하여 데이터를 관리하는 단계를 의미한다 .

- 데이터 모델에 관한 절차나 정의에 관한 문서화 수준이 부족하며 , DBMS 내의 툴을 사용하여 데이터 관리가 이루어지고 있다 .

- 업무 필요에 따라서 가변적으로 테이블 , 컬럼을 만드는 경우가 많기 때문에 논리모델 관점보다는 물리적 관점이 더 요구되어진다 .

특징- 단위별 혹은 기능별로 분화된 논리 모델을 통하여 데이터 관리의 체계성을 가지고 있다 .

- 업무 필요에 의한 테이블컬럼 생성 , 삭제와 관련되어 체계적인 프로세스를 가지고 있다 .

- 도메인 정의 , 테이블 정의 , 속성 (컬럼 ) 정의 , 코드 정의 , 엔티티 정의에 관하여 문서화 되어 있으며 , 이를 통하여 교육이 정기적으로 이루어지고 있다 .

- 단위별 혹은 기능별로 분화된 데이터 통합에 어려움을 겪고 있다

특징- 데이터 관리의 중앙집중식 통제가 이루어지는 단계이다 .

- 단위별 혹은 기능별로 분화된 데이터 요소를 메타 데이터 수준에서 표준화가 이루어지며 , 이를 바탕으로 표준화된 데이터 요소의 재사용과 공유가 가능하고 , 단위 시스템에서 사용되는 데이터 표준에 대한 정의가 이루어지고 있다 .

- 데이터 요소 표준에 관하여 전사 차원의 관리 정책이 수립되어 있다 .

특징

- 가장 최적화된 이상적인 단계로써 , 표준화된 전사 차원의 데이터 아키텍처가 정의되어 있다 .

- 정의된 표준 데이터 아키텍처를 바탕으로 데이터 요소 , 데이터 , 데이터 모델 등이 관리되어진다 .

- 전사 수준에서 데이터 품질 관리에 대한 인식이 자리매김한 단계이다 .

- 전사 차원의 데이터 품질 관리 조직 체계가 갖추어져 있다 .

정의데이터베이스시스템을 통한 데이터의 구조적 품질을 관리하는 단계

정의논리데이터모델과 물리데이터모델을 통한 데이터의 구조적 품질 관리

정의전사적인 연계와 통합의 관점에서 데이터 표준화를 통한 데이터 품질 관리

정의전사데이터아키텍처 관리를 통한 구조적 요소를 유기적으로 관리하는 단계

통합 데이터품질관리 성숙도 단계

Page 18: 데이터 품질관리를 위한 방법론 및  활용방안

레벨 레벨 11

DBMSDBMS 에 의한 에 의한 데이터 관리데이터 관리

레벨 레벨 22

모델링에 의한 데이터 모델링에 의한 데이터 관리관리

레벨 레벨 33

전사적 표준에 의한 전사적 표준에 의한 데이터 관리데이터 관리

레벨 레벨 44

데이터 아키텍처에 데이터 아키텍처에 의한 데이터 관리의한 데이터 관리

레벨 레벨 00

애플리케이션에 애플리케이션에 의한데이터 관리의한데이터 관리

정의 : 데이터베이스시스템을 통하여 데이타베이스 품질을 관리하는 단계

정의 : 데이터베이스 구축 방법론을 사용하여 논리적인 데이터모델과 물리적인 데이터모델을 관리하는 단계

정의 : 통합의 관점에서 데이터 표준화를 통한 전사적인 데이터 품질을 관리하는 단계

정의 : 전사적인 데이터 아키텍처 관리를 통한 각 데이터 계층을 유기적으로 관리하는 단계

정의 : 애플리케이션 프로그램에 의해 파일을 정의하고 관리하는 단계

데이터품질관리 성숙도 모델 II

• 성숙도 모델은 레벨 0 부터 레벨 4 로 수정되었고 , 데이터품질관리 확장모델 II 의 각 요소와 맵핑이 되어야 함 . 즉 레벨 1 은 데이터값 부분이 중요하게 되고 단계가 성숙화됨에 따라 프로세스와 조직의 관점이 점점 중요하게 됨 .

관리 도구관리 도구 (Tool)(Tool)

조직 조직 (Organization)(Organization)

프로세스 프로세스 (Process)(Process)

데이터 값데이터 값

데이터 데이터 모델모델

Model)Model)

메타 메타 데이터데이터 ))

데이데이터 터

(Dat(Data)a)

운영운영구현구현전략전략

관리 도구관리 도구 (Tool)(Tool)

조직 조직 (Organization)(Organization)

프로세스 프로세스 (Process)(Process)

데이터 값데이터 값

데이터 데이터 모델모델

Model)Model)

메타 메타 데이데이터터 ))

데이데이터 터

(Dat(Data)a)

운영운영구현구현전략전략

관리 도구관리 도구 (Tool)(Tool)

조직 조직 (Organization)(Organization)

프로세스 프로세스 (Process)(Process)

데이터 값데이터 값

데이터 데이터 모델모델

Model)Model)

메타 메타 데이터데이터 ))

데이데이터 터

(Dat(Data)a)

운영운영구현구현전략전략

관리 도구관리 도구 (Tool)(Tool)

조직 조직 (Organization)(Organization)

프로세스 프로세스 (Process)(Process)

데이터 값데이터 값

데이터 데이터 모델모델

Model)Model)

메타 메타 데이터데이터 ))

데이데이터 터

(Dat(Data)a)

운영운영구현구현전략전략

Page 19: 데이터 품질관리를 위한 방법론 및  활용방안

• 관리 대상 : 데이터 품질관리 프레임워크에서 제시된 관리 대상을 의미한다 .• 세부 요소 : 관리 대상을 관리하기 위한 활동 (Activity) 관점에서 세부적으로 구분하였다 . 이는 관리

대상에 대한 세부적인 관리 활동을 살펴보는 것이 주 목적이다 .• 주요 관리 기준 / 대상 / 내용 / 역할 : 세부 요소 별로 주요하게 관리 및 주의 하여야 하는 요소를 나타내고 있다 .

특히 , 이 부분은 관리 대상 별의 특성에 따라서 기준 , 대상 , 내용 , 역할 등으로 구성된다 . 이는 데이터 현상 , 데이터 구조 , 프로세스 , 조직 등의 Factor 들이 가지는 고유한 특성들을 동일한 틀에 맞추기 보다는 각 특성에 맞는 기준을 제시하여 , 통합적인 관점에서 데이터 품질관리를 조명하기 위함이다 .

• 아래 그림에서 보는 바와 같이 , 본 프레임워크에서는 데이터 , 규정 및 정책 , 조직 등의 3 가지 영역에서 데이터 품질관리 활동을 살펴 보고자 한다 . 이 3 가지 영역은 각각 고유한 관점을 가지고 있기 때문에 , 이들에 대한 고유한 관점에서 세부적인 관리 활동을 수행하기 위한 지침 해설서를 작성하였다 .

규정 및 정책규정 및 정책조직조직

데이터데이터

• 데이터 품질관리를 위한 규정 및 정책• 데이터 품질관리 지원활동을 위한 규정 및 정책

• 데이터 현상적 요인 ( 데이터 값 )

• 데이터 구조적 요인 ( 데이터 모델 , 메타 데이터 )

• 데이터 품질 전략 수립 지원 조직• 데이터 구현 지원 조직• 데이터 운영 지원 조직

통합 데이터품질관리 지침서 형식

Page 20: 데이터 품질관리를 위한 방법론 및  활용방안

◈ ◈ 개요개요- 관리 대상에 대한 간략한 소개

◈ ◈ 관리 목표관리 목표- 대상을 관리함으로써 기대되는 목표

▷ ▷ 정의정의- 관리 대상 별 세부 관리 요소에 대한 정의 및 소개

▷ ▷ 주요 관리 대상주요 관리 대상

- 세부관리요소별 주요 관리 대상

논리 모델 (Logical model) 논리 모델 설계 【 품질관리 제안 내용】【 품질관리 제안 내용】

1. 설명 (Description)

- 주요 관리 대상에 대한 소개 및 설명 .

2. 절차 (Procedure) 및 예시(Example)

`- 주요 관리 대상의 관리 절차를 설명하거나 해당 절차가 없는 경우 적절한 예시를 보여줌 .

3. 기대 효과 (Expected value)

- 주요 관리 대상을 관리함으로써 얻을 수 있는 기대 성과 및 효익 .

4. 참고사항 - 특히 본 관리 대상에서 타 관리 대상과 구별되거나 , 관리 활동 시에 주의해야 하는 점들에 대해서 설명 .

관리 대상 세부 요소

통합 데이터품질관리 지침서 형식

Page 21: 데이터 품질관리를 위한 방법론 및  활용방안

업무의 이해 도구의 활용

데이터품질관리

데이터품질관리

POSCO ch

anged C&

C invest

ment

process

Conducted best practices gap analyses

SM assessment & analysis also has some opportunity

practices gap analyses

POSCO ch

anged C&

C inv

estm

ysis also has some

& analysis also has some opportunity

실행계획실행계획…..

실행계획실행계획…..

영업적 측면

회계적 측면

Page 22: 데이터 품질관리를 위한 방법론 및  활용방안

감사합니다 .