Symposium 3: How to use open database from general population 225 Table 1. NHIRD를 이용한 대만의 천식 연구 동향 연구자 (연도) 주요 연구 결과 Wang et al. (2012) 어린이 천식발생 비용 추정연구 Hwang et al. (2012) 아토피 피부염, 알레르기 비염과 천식 유병률 조사 연구 아토피 피부염과 알레르기 비염을 진단받은 환자에서 천식의 위험이 높음 (OR=9.4) Sun et al. (2012) 황달이었던 집단에서 높은 천시 발병률을 보였고 (OR=1.64), 여아집단에서 더 높은 경향을 보임 건강보험심사평가원 보건의료 빅데이터를 활용한 천식 연구 울산의대 알레르기내과 김 태 범 서론 건강보험심사평가원 (심평원)은 2012년도부터 점진적인 연구용 청구데이터 개방을 시작하였다. 2013 년 “빅 데이터 활용”이 화두가 되면서 빅 데이터가 가진 잠재적인 가치를 구현하기 위하여 공공기관 보유정보의 개방과 청구데이터 공개가 더욱 가속화 되었다. 이후로 현재까지 청구데이터를 이용한 연 구들이 활발하게 진행되어 연구 결과들이 학술지 게재 및 보건의료서비스정책 결정과 수립을 위한 과 학적인 근거로 활용되고 있다. 청구데이터는 전 국민의 의료서비스 내용을 대표하는 자료로써 대표성 과 포괄성의 특성을 갖는다 1) . 청구데이터는 엄격한 통제하에 수집된 일차자료와는 달리, 실 사회 (real world)를 반영한다. 그렇기 때문에 연구자들은 제한적이고 실험적 환경이 아닌 실제 의료보건 환경을 반영한 현황 및 추세에 대한 관찰을 바탕을 한 연구가 가능하다는 특성이 있다. 또한 가장 큰 장점은 이미 수집되고 구축된 데이터라는 점에서 비용측면에서 효율적이며, 데이터 수집에 소요되는 시간을 단축할 수 있다. 국민건강관리공단에서 제공하는 2차 자료는 우리나라의 전 국민건강보험 시스템 하 에서 생성되는 청구내역을 바탕으로 생성되는 자료로, 우리나라와 가장 비슷한 의료 보험 시스템을 구축하는 대만에서도 동일 생성되는 자료를 이용한 연구가 다양한 주제로 시행되고 있다. 전 국민 건 강보험 자료를 이용하여 구축한 대만의 국가건강보험 데이터베이스 (National Health Insurance Research Database, NHIRD)를 활용하여 천식질환에 대한 비용과 효용을 추정한 연구와 천식의 위험요인을 확인 2016 KAAACI Annual Spring Congress: New Paradigms in Allergic Diseases
14
Embed
건강보험심사평가원 보건의료 빅데이터를 활용한 천식 연구 · 2016. 5. 4. · 김태범:건강보험심사평가원 보건의료 빅데이터를 활용한
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Symposium 3: How to use open database from general population
225
Table 1. NHIRD를 이용한 만의 천식 연구 동향
연구자 (연도) 주요 연구 결과
Wang et al. (2012) 어린이 천식발생 비용 추정연구
Hwang et al. (2012) 아토피 피부염, 알 르기 비염과 천식 유병률 조사 연구
아토피 피부염과 알 르기 비염을 진단받은 환자에서 천식의 험이 높음
(OR=9.4)
Sun et al. (2012) 황달이었던 집단에서 높은 천시 발병률을 보 고 (OR=1.64), 여아집단에서 더
높은 경향을 보임
건강보험심사평가원 보건의료 빅데이터를 활용한 천식 연구
울산의 알 르기내과
김 태 범
서론
건강보험심사평가원 (심평원)은 2012년도부터 진 인 연구용 청구데이터 개방을 시작하 다. 2013
년 “빅 데이터 활용”이 화두가 되면서 빅 데이터가 가진 잠재 인 가치를 구 하기 하여 공공기
보유정보의 개방과 청구데이터 공개가 더욱 가속화 되었다. 이후로 재까지 청구데이터를 이용한 연
구들이 활발하게 진행되어 연구 결과들이 학술지 게재 보건의료서비스정책 결정과 수립을 한 과
학 인 근거로 활용되고 있다. 청구데이터는 국민의 의료서비스 내용을 표하는 자료로써 표성
과 포 성의 특성을 갖는다1). 청구데이터는 엄격한 통제하에 수집된 일차자료와는 달리, 실 사회 (real
world)를 반 한다. 그 기 때문에 연구자들은 제한 이고 실험 환경이 아닌 실제 의료보건 환경을
반 한 황 추세에 한 찰을 바탕을 한 연구가 가능하다는 특성이 있다. 한 가장 큰 장 은
이미 수집되고 구축된 데이터라는 에서 비용측면에서 효율 이며, 데이터 수집에 소요되는 시간을
단축할 수 있다. 국민건강 리공단에서 제공하는 2차 자료는 우리나라의 국민건강보험 시스템 하
에서 생성되는 청구내역을 바탕으로 생성되는 자료로, 우리나라와 가장 비슷한 의료 보험 시스템을
구축하는 만에서도 동일 생성되는 자료를 이용한 연구가 다양한 주제로 시행되고 있다. 국민 건
강보험 자료를 이용하여 구축한 만의 국가건강보험 데이터베이스 (National Health Insurance Research
Database, NHIRD)를 활용하여 천식질환에 한 비용과 효용을 추정한 연구와 천식의 험요인을 확인
2016 KAAACI Annual Spring Congress: New Paradigms in Allergic Diseases
2016 KAAACI Annual Spring Congress: New Paradigms in Allergic Diseases
226
Table 2. 심평원 자료를 활용한 국내 천식 연구 동향
연구자 (연도) 주요 연구 결과
S Kim and TB Kim et al. (2015) 임신 천식치료 의료이용 실태 조사 주산기 험인자 분석
S Kim and TB Kim et al. (2013) 천식환자 의료이용 실태와 처방내역 분석
CY Kim and SH Cho et al. (2011) 천식의 체 발생률과 천식환자의 의료비용 분석
YS Park et al. (2016) Asian dust 가 천식에 미치는 향, 사회 경제학 상태에 따른 차이 비교
T Lee and TB Kim et al. (2014) 천식 코호트 COREA cohort와 심평원 자료를 연계하여 험인자를 분석
하는 등의 연구가 활발하게 진행되었다2-4)
(Table 1). 국내에서도 다양한 주제의 연구가 진행되고 있으
며5,6)
, 본 연구자도 2013년 천식환자의 의료이용 실태 처방 내역분석7)
, 2014년 심평원 자료와 천식
코호트인 COREA를 연계하여 천식 의료이용 행태와 험인자를 분석한 바 있고8)
, 최근에는 임산부
천식에 해 심평원 자료를 활용한 연구를 진행하여 학술지 게재한 바 있다9)
(Table 2). 그러므로 본
연구자가 수행한 청구데이터를 이용한 천식 연구를 바탕으로 심이 있는 의료 연구진들에게 도움이
될 수 있는 내용을 소개하고자 한다.
건강보험청구데이터 소개 및 구성, 이용방법
건강보험 청구 데이터는 요양기 이 의료서비스를 제공한 후 환자의 진료비용 국민건강보험이
부담하는 부분에 해 지 의뢰를 하기 해 건강보험심사평가원에 보험 여 청구를 하면서 발생하는
데이터이다. 2011년을 기 으로, 우리나라의 1년 간 건강보험 청구 환자수는 주민등록인구의 90%에
해당하는 약 4천 6백만 명으로 국의 8만 여 개 요양기 으로부터의 방 한 청구 건수가 포함되어
있다. 이러한 청구데이터를 이용하는 방법은 총 세가지로 첫 번째는 심평원 내 치한 자료처리실을
이용하는 방법이다. 연구자들이 연구주제에 맞게 맞춤형으로 데이터가 세 된 컴퓨터를 할당 받아 이
용하게 되는데, 주로 용량의 자료 혹은 타기 자료와 연계가 필요한 경우 이용하게 된다. 외부보유
자료 연계는 환자의 포 사 동의 획득이나 심평원 데이터와의 연계에 한 동의 획득 시 연계가
가능하다. 두번째 방법은 원격 속서비스를 통한 데이터 활용인데, 이는 연구자들의 컴퓨터를 이용하
여 심평원의 서버로 속하여 서버에 장되어 있는 데이터를 속하고 사용하는 방법이다. 자료처리
실 이용 는 원격 속을 통한 데이터 사용은 심의 차를 거쳐야 한다. 마지막 세번째 방법은 무작
층화로 추출된 1년 단 의 표본데이터를 이용하는 방법이다. 표본자료 종류는 체환자표본 (NPS), 입
원환자표본(NIS), 노인환자표본(APS), 소아청소년환자표본(PPS)으로 나 어 제공되고 있다. 이러한 표
본데이터는 별다른 심의과정 없이 데이터 사용 수수료를 지불한 후 연구자들이 직 구입하여 사용할
수 있다.
연구용으로 제공되는 청구데이터는 네 개의 테이블로 나 어져 있다. 첫번째는 명세서일반내역으로
인구학 특성 변수, 수진자 주민번호 체키, 주상병 부상병, 요양기 체 키, 입원 외래 구분
변수 (서식코드), 의료 여종별코드가 포함되어 있다. 이러한 변수들은 안내변수 (instruction variables)라
고 하며, 연구 상을 추출하는 데 있어 활용도가 높다. 두번째 테이블은 환자들이 입원하여 발생하는
김태범:건강보험심사평가원 보건의료 빅데이터를 활용한 천식 연구
227
Table 3. 국민건강보험공단 표본코호트 DB 구성
구분 세부 특성
자격 DB 상: 건강보험가입자 의료 여 수 권자
변수: 성별, 연령, 지역, 가입자 구분, 소득분 , 사망정보 (사망년월, 사망원인) 등
진료 DB 내용: 상자가 요양기 에 방문하여 진료 등을 받은 내역에 해 요양기 으로부터
요양 여가 청구된 자료
- 명세서 (20T): 개인일련번호, 명세서 키코드 등
- 진료내역 (30T): 원내행 내역 (진료, 의약품, 치료재료 등)+ 액 등
- 상병내역 (40T): 상병내역
- 처방 교부상세내역(60T): 원외처방내역
건강검진 DB 내용: 건강검진 주요 결과 문진에 의한 생활습 행태 련 자료
- 의료 여 수 자의 일반건강 검진자료는 미포함 (2012년부터 탁수행)
- 2008년부터 생애 환기 건강진단자료 포함
요양기 DB 내용: 요양기 의 종별, 설립구분별, 지역별 황 설비, 장비, 인력 련자료
모든 의료서비스 정보로 환자들에게 제공된 진료 행 , 약제 등에 한 자세한 정보를 담은 진료내역
정보이다 (검사, 처치, 시술, 약제 등). 세번째 테이블은 주상병, 부상병을 포함한 모든 동반증상정보로
서 임신과 같이 질병이 아닌 경우가 상병코드로 붙는 경우 이러한 동반질병내역을 확인하여 연구를
진행할 수 있다. 마지막으로 원외처방내역인데, 환자가 외래처방으로 받은 약제에 한 모든 정보를
포함하고 있다.
국민건강보험공단 표본 코호트
표본 코호트 데이터베이스는 자료규모의 방 함과 개인정보보호의 문제 등으로 연구자의 근과
활용이 제한 이었던 을 획기 으로 개선하고자 2002년을 기 으로 국민의 2%인 약 100만명을
표본추출하여 2013년 까지 동일한 상자에 해 사회·경제 변수 (거주지, 사망년월, 사망사유, 소득
수 등)가 포함된 자격자료, 진료내역 건강검진자료를 12년간 연결한 코호트 자료로 장기간의
찰이 가능하고 시간 선후 계나 인과 계 분석이 가능한 자료이다. 표본 코호트 데이터베이스는
2002년 기 으로 총 1,025,340명의 건강보험가입자 의료 여수 권자 (외국인 제외)를 상으로
2002년부터 2013 년까지 12개년간 성별, 연령 , 지역, 가입자 구분, 소득분 등 사회경제 자격변수
(장애 사망포함), 의료 이용 (진료 건강검진) 황, 요양기 황의 내용을 포함하고 있다. 표
본 코호트 데이터베이스의 구축 형태는 2002년을 기 으로 구축된 표본을 2010년 까지 유지하면서 사
망 는 이민 등의 이유로 자격상실로 인한 자연 감소를 매년 신생아 자료를 추가하여 유지하 다.
자세한 데이터 베이스의 구성은 Table 3에 나타나 있으며 Figure 1에 표본코호트 데이터베이스 통합과
이용에 련한 내용이 정리되어 있다. 이러한 표본코호트 데이터베이스를 활용하는 경우 천식환자의
조작 인 정의가 필요한데, 를 들어 2002년 1월 1일부터 2012년 12월 31일 까지 각 연도별로 의료
기 을 방문하여 주 진단명 는 부 진단명 천식 상병코드 (J45-46)가 1회 이상 있으면서 천식 약
물을 1개 이상 처방 받거나 지정된 천식 련 검사를 1회 이상 시행한 경우와 같이 지정할 수 있다.
2016 KAAACI Annual Spring Congress: New Paradigms in Allergic Diseases