통계연구(2016), 특별호, 112-128 온라인 커뮤니티에서 나타난 건강정보 전파 분석에 관한 연구: 공적/사적 의료 지식에 미치는 커뮤니티 내 연결망 효과 중심으로 곽진아 1) ․ 이원재 2) 요약 본 연구는 한국 온라인 커뮤니티 내에서 발생하는 보건/의료 이슈를 탐지하고, 커뮤니티 내 여 론 형성에 영향을 미치는 요인을 찾고자 한다. 특히 공적/사적 의료 지식에 대해 네트워크 내의 전파가 다른지 확인하고자 한다. 이를 위해 보건/의료 관련 이슈에 대한 토론이 많고, 의료기관 에 언급량이 많은 커뮤니티를 선정하여, 커뮤니티 개설 초기 (2007년 3월)부터 93개월 동안의 게시글을 수집하고, 글/댓글 네트워크를 구성하였다. 자연언어처리 기법을 통해 해당 커뮤니티에서 보건/의료 관련 메시지를 주제별로 범주화 하고, 언급량을 분석하였다. 네트워크 분석을 통해 개인의 커뮤니티 내 영향력이라 할 수 있는 구조적 위치를 측정하였다. 또한 주요 보건/의료 키워드에 대해 네트워크 환경 (커뮤니티 내 친구의 언 급)으로 인해 개인의 언급이 발생하는 지 여부를 측정하기 위해 ‘드문 사건 로지스틱 모델 (rare events logistic regression)'을 사용하였다. 분석 결과, 커뮤니티 내에서 개인이 보건/의료 관련 이슈를 언급할 때, 외부효과로 볼 수 있는 언론 보도 수는 유의미한 영향을 미치지 않았으며, 커뮤니티 내 다른 사용자의 언급이 영향이 미치는 것을 발견하였다. 특히 보건 의료 관련 주제별로 차이가 나타났는데, 일반적이고 공적인 이슈인 ‘백신, 독감, 감기, 항생제’ 와 달리 상대적으로 사적인 이슈라고 볼 수 있는 ‘모유수유’ 이 슈에서 특히 커뮤니티 내의 사회적 위세가 높은 경우 언급량이 많은 것으로 나타났다. 주요용어 : 온라인 커뮤니티, 연결망 분석, 보건 의료 1. 서론 보건/의료 이슈는 일상생활에 매우 밀접하며, 그만큼 시민들의 끊임없는 관심을 받 고 있다. 시민들이 관심을 보이는 보건/의료 이슈의 종류와 이유, 그리고 여론 확산에 영향을 끼치는 요인들을 파악할 수 있다면, 특정 질병과 관련한 의료 정책 수립에 도 움을 줄 수 있을 것이다. 보건/의료에 대한 빅데이터 연구는 주로 공공데이터 활용 방안이나 언론 보도 분 석에 국한 되어왔다. 보도 프레임을 분석하거나 (주영기 외 2011), 언론 보도 시 등장 하는 취재원 실태를 분석함으로써 질병의 프레임 형성을 지적하는 연구 (노수진 외 1) 대전광역시 유성구 대학로 291 한국과학기술원 문화기술대학원, 박사과정. E-mail: jinah.kwak @kaist.ac.kr 2) 교신저자. 대전광역시 유성구 대학로 291 한국과학기술원 문화기술대학원, 교수. E-mail: wjlee @kaist.ac.kr
17
Embed
온라인 커뮤니티에서 나타난 건강정보 전파 분석에 …kostat.go.kr/file_total/ex-1-07.pdf온라인 커뮤니티에서 나타난 건강정보 전파 분석에 관한
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
통계연구(2016), 특별호, 112-128
온라인 커뮤니티에서 나타난 건강정보 전파 분석에 관한
연구: 공적/사적 의료 지식에 미치는 커뮤니티 내 연결망
효과 중심으로
곽진아1) ․ 이원재2)
요약
본 연구는 한국 온라인 커뮤니티 내에서 발생하는 보건/의료 이슈를 탐지하고, 커뮤니티 내 여
론 형성에 영향을 미치는 요인을 찾고자 한다. 특히 공적/사적 의료 지식에 대해 네트워크 내의
전파가 다른지 확인하고자 한다. 이를 위해 보건/의료 관련 이슈에 대한 토론이 많고, 의료기관
에 언급량이 많은 커뮤니티를 선정하여, 커뮤니티 개설 초기 (2007년 3월)부터 93개월 동안의
게시글을 수집하고, 글/댓글 네트워크를 구성하였다.
자연언어처리 기법을 통해 해당 커뮤니티에서 보건/의료 관련 메시지를 주제별로 범주화 하고,
언급량을 분석하였다. 네트워크 분석을 통해 개인의 커뮤니티 내 영향력이라 할 수 있는 구조적
위치를 측정하였다. 또한 주요 보건/의료 키워드에 대해 네트워크 환경 (커뮤니티 내 친구의 언
급)으로 인해 개인의 언급이 발생하는 지 여부를 측정하기 위해 ‘드문 사건 로지스틱 모델 (rare
events logistic regression)'을 사용하였다.
분석 결과, 커뮤니티 내에서 개인이 보건/의료 관련 이슈를 언급할 때, 외부효과로 볼 수 있는
언론 보도 수는 유의미한 영향을 미치지 않았으며, 커뮤니티 내 다른 사용자의 언급이 영향이
미치는 것을 발견하였다. 특히 보건 의료 관련 주제별로 차이가 나타났는데, 일반적이고 공적인
이슈인 ‘백신, 독감, 감기, 항생제’ 와 달리 상대적으로 사적인 이슈라고 볼 수 있는 ‘모유수유’ 이
슈에서 특히 커뮤니티 내의 사회적 위세가 높은 경우 언급량이 많은 것으로 나타났다.
주요용어 : 온라인 커뮤니티, 연결망 분석, 보건 의료
1. 서론
보건/의료 이슈는 일상생활에 매우 밀접하며, 그만큼 시민들의 끊임없는 관심을 받
고 있다. 시민들이 관심을 보이는 보건/의료 이슈의 종류와 이유, 그리고 여론 확산에
영향을 끼치는 요인들을 파악할 수 있다면, 특정 질병과 관련한 의료 정책 수립에 도
움을 줄 수 있을 것이다.
보건/의료에 대한 빅데이터 연구는 주로 공공데이터 활용 방안이나 언론 보도 분
석에 국한 되어왔다. 보도 프레임을 분석하거나 (주영기 외 2011), 언론 보도 시 등장
Observations 16,031 15,485 15,713 16,445 16,358 16,358 16,358괄호안은 로버스트 표준오차;; *** p<0.001, ** p<0.01, * p<0.05시간 고정 효과 결과는 생략하였음
<표 5.5> 건강 이슈에 대한 게시판 글 올릴 확률 (t+1)을 예측하는 드문 사건 로지스틱 모델
시간고정효과를 통제한 상태에서 해당 이슈의 온라인 키워드 검색수 (이하 네이버
검색수)와 언론 보도수를 함께 모델에 포함시켜보았다. 커뮤니티 외부 효과로 볼 수
있는 네이버 검색수와 언론 보도수는 예상한대로 유의미하지 않았다.
백신, 독감, 감기, 항생제, 모유수유 각 이슈별로 드문 사건 로지스틱 모델을 따로
검증하였다. 예를 들어 첫 번째 모델의 경우 종속변수는 다음 날 (t+1) 에서 ‘백신’ 언
급 유무이다 (1 또는 0). 독립변수 ‘백신’의 경우 내가 백신에 대해 쓴 글의 조회수가
1 단위 늘어날 때마다 내가 t+1 에서 백신을 언급할 확률(odds)은 86.8% (exp(0.625)
=1.868) 증가한다. 마찬가지로 내가 백신에 대해 쓴 글의 수가 1개 증가할수록 내가
t+1에서 백신을 언급할 확률은 437% (exp(1.682=5.376) 증가하고, 내가 백신에 대해
쓴 댓글의 수가 1개 증가할수록 내가 t+1에서 백신을 언급할 확률은 28% (exp(0.249)
=1.282) 로 증가한다.
즉 30일 동안의 시간창 (time window) 안에서, 해당 이슈에 대한 자기 글이 얼마
나 조회되었는가가 다음 날 (t+1) 같은 이슈에 대한 게시글을 쓸 확률은 '백신'에서만
124 곽진아 ‧ 이원재
유의미하게 나타났다. 반면 백신, 독감(flue), 감기(cold), 항생제(antibiotic)에서는 공통
적으로, 이슈에 상관없이 내가 쓴 게시글 수, 내가 쓴 댓글 수가 유의미한 효과를 나
타냈다. 해당 주제에 대한 내가 쓴 게시글 수와 댓글 수는 결국 그 주제에 대한 개인
의 독립적 관심이 이후 행동에 주는 영향력을 나타낸다. 이는 온라인상에서 청중의
관심과 상관없이 일어나는 개인주의적 현상이며, 정보 전달자로서의 자기 역할에 충
실한 개인의 상을 보여준다.
이런 면에서 모유수유는 매우 특이한 양태를 보인다. 모유수유를 주제로 한 게시
판 활동을 분석해보면 위와 같은 개인 수준의 요인들이 무의미하게 나온 반면, 네트
워크 효과만 유의미하게 나타난다. 위세중심성이 1 단위 증가할 때 내가 t+1 에서 모
유수유를 언급할 확률은 214% (exp(1.145) = 3.142) 증가하고, 관계중심성이 1 단위
증가할수록 내가 t+1 에서 모유수유에 대해 언급할 확률이 3% (exp(0.029)=1.029) 증
가한다. [표 6]의 모유수유 분석 결과 각각의 열은 네트워크를 포함하지 않고 다른 모
델들과 비교한 경우와, 네트워크를 포함한 경우를 의미한다.
자료의 제약으로 인해 충분히 분석가능한 시계열 연결망들을 구성할 수 없어서 전
체 시간 범위를 포괄한 연결망을 사용하였으므로 1) 시계열 분석을 통한 인과성 추론
의 기준을 충족하지 못하고, 2) 시계열적 자기상관 (autoregressive)의 문제를 가지고
있다는 한계를 전제하고 다음과 같은 해석이 가능하다. 위세(status) 중심성은 댓글
연결망을 통해 측정하여, 나에게 댓글을 달아준 친구들의 위세가 높을수록 내 위세가
높아지는 메커니즘을 반영한다 (Bonacich 1987). 관계수 중심성은 내가 쓴 댓글과 내
가 받은 댓글의 수를 합친 것이다. 두 변수 모두 유의미한 양의 계수를 가지는데, 특
히 후자는 통제변수들과의 자기상관성에도 불구하고 여전히 유의성을 잃지 않는 것이
흥미롭다.
모유수유는 다른 건강 이슈와 달리 개인의 사적 경험과 결부된 지식이라고 할 수
있다. 앞의 네 가지 건강 이슈가 주로 대외적으로 뚜렷이 발화되는 공적 지식에 가깝
다면, 모유수유는 개인의 경험 안에서 만들어지며 암묵적이거나 개인적인 언어로 유
통되는 지식에 가깝다. 일찍이 이 두 가지 지식의 유통이 각기 다른 연결망 구조와
친화성을 가진다는 연구는 매우 잘 받아들여져 왔으나 (Uzzi and Lancaster 2003), 경
험 맥락과 접근 방법에 따라 증거가 경험적 신뢰성이 떨어진다는 비판에도 종종 직면
해왔다 (Marouf 2007). 이 같은 맥락 속에서 우리의 분석 결과는 사적 지식과 연결망
사이의 관계를 지지하는 또 다른 증거를 제시하고 있다. 사적이지만 언어로 명기된
지식(private codified knowledge)인 모유수유에 관한 게시판 포스팅은 연결망 내에서
의 친밀성 (관계수 중심성)과 위세와 유의미하게 상호 연관되어 있다.
6. 결론 및 논의
모유수유에 대한 의견 표현이 개인의 사회적 위세나 사회성이 클수록 더 활발히
개진된다는 점은 '모유 수유'가 가지고 있는 지극히 사적인 측면과 이것이 공적으로
논의되는 것 사이의 모순적 접합의 현상을 환기시킨다. 특히 모유수유의 경우, 다른
온라인 커뮤니티에서 나타난 건강정보 전파 분석에 관한 연구 125
키워드와는 달리 시간(환절기, 겨울 등)이나 사회적 이슈(신종 플루, 항생제의 부작용)
의 영향을 받지 않는 지극히 개인적인 주제로써, 해당 기간에 다른 사람의 언급으로
인해 관심이 유발되어 모유수유에 대해 언급하는 것이 아니라, 커뮤니티 내의 사휘적
위세가 높은 경우 당당하게 자신의 경험담을 공유하고 의견을 나누는 것으로 볼 수
있다. 이는 일반적인 질병이나 약에 대한 지식과, 모유수유의 문제를 사람들이 다른
방식으로 이해하고 있다는 점을 뜻한다.
김혜숙 (1995) 은 어머니의 욕구, 신념과 태도를 모유수유를 성공적으로 실천하는
데 영향을 주는 주요 요인으로 분석했다. 또한 성공적인 모유수유를 위해 산후 2주일
동안이 가장 중요한 시기로써, 이 시기의 사소한 좌절이나 실수가 모유수유 정착에
장애가 되는데, 모유수유의 어려움에 부딪혔을 때 효율적으로 도와줄 수 있는 전문가
가 없어 모유수유를 쉽게 포기하게 된다고 지적한다. 박옥희 (1992) 는 모유수유 상황
의 경험에 따라 성공이 좌우되기 때문에, 첫 수유에서 전문인의 개별적 지지와 도움
의 중요성을 강조하였다. 백경선 외 (2010) 역시 성공적인 모유수유를 위해서는 그 주
체인 어머니의 육체적, 심리사회적 및 환경적인 영향이 중요하다고 강조한다. 또한 모
유수유모가 모유수유의 주관적인 경험들을 민감하게 인지한다고 지적하고 있다.
모유수유에 대해 언급한 텍스트와 독감과 백신에 대해 언급한 텍스트에서 사용된
어휘를 비교하고자 최빈출 연관어 분석방법인 TFIDF6)를 실시한 결과, 모유수유는
‘분유, 모유, 시기, 때, 마사지’ 등의 명사와 ‘끊다, 힘들다, 빠지다, 울다, 빼다, 괜찮다’
와 같이 모유수유 경험과 방법에 대한 내용이 상위 언급 단어로 사용되었으며, 독감
의 경우 ‘접종, 인플루엔자, 감기, 백신, 확진, 바이러스’ 등의 질병 관련 명사와 ‘취소
하다’ 의 동사가 상위 언급 단어로 사용되었다.
선행연구 및 최빈출 연관어 분석 결과로 볼 때 개인의 활동성이 영향을 미치는 일
반적인 건강 관련 이슈 (백신, 독감, 감기, 항생제) 와 모유수유 이슈는 구별된다. 또
한 일반인에게 모유수유 이슈는 커뮤니티 내에서 개인의 사회적 위세가 높을수록 개
인의 모유수유 경험에 대해 조언 및 논의를 하는 등 일반적인 보건/건강 이슈와 다르
게 인식하는 것을 보여준다.
비록 본 연구는 자료의 제약 (scarcity)으로 인해 충분히 분석가능한 시계열 연결
망들을 구성할 수 없어 한 달의 데이터만을 사용하였으므로, 시계열 분석을 통한 인
과성 추론의 기준을 충족하지 못하고, 시계열적 자기상관 (autoregressive)의 문제를
가지고 있다는 한계가 있다. 하지만 온라인 커뮤니티에서 나타나는 지식의 공유를 분
석하고자 사적 지식에 해당하는 모유수유와, 기타 공적 이슈의 연결망 효과가 어떻게
다르게 나타나는지를 보고자 하였고, 그 의미를 밝혀냈다는 데 의의가 있다.
6) 문서에서 핵심 단어를 추출하는 방법인 TFIDF(Term Frequency-inverse Document Frequency) 를 활용하여 연관어를 비교 분석 하였다. TFIDF는 특정 단어가 한 개의 문서 내에 나타난 빈도를 전체 문서수 중에서 특정 단어를 포함하는 문서의 빈도로 나누어 준 것을 말한다. 즉 특정 문서에는 많이 등장하나, 일반적인 문서에서는 적게 등장하는 키워드일수록 TFIDF값이 커지기 때문에, 두 개 이상의 문서에서 핵심이 되는 키워드를 추출하는 데 유용하다. TFIDF는 특히 하나의 문서에 두 개의 단어가 같은 빈도수로 출현했다고 하더라도, TFIDF 값이 클수록 해당 단어에 대한 전문성 (여러 문서에 흔하게 등장하는 것이 아니라, 소수의 문서에만 등장하는지) 여부를 분석할 수 있는 방법이다.
126 곽진아 ‧ 이원재
참고문헌
권선영, 주서현 (2013). 네트워크 분석을 통한 온라인 임신 Q&A 게시판의 내용적 특
성에 관한 연구. 제 20 회 한국정보관리학회 학술대회 논문집, 31-36.
김수정 (2012). 소셜 미디어 환경에서 대학생들의 건강정보 요구와 추구행태에 관한
탐험적 연구. 한국비블리아학회지, 23(4), 239-260.
김용학 (2007). 사회연결망이론: 개정판. 博英社.
김혜숙 (1995). 모유수유 전화상담 내용의 분석. 대한간호학회 17-29.
노수진, 윤영민 (2013). 우울증에 관한 언론 보도 분석. 한국언론정보학보, 5-27.
박옥희 (1992). 임신중 유방간호가 산모의 모유수유 실천에 미치는 영향, 한국간호과
학회
배순한, 서재교, & 백승의 (2010). 온라인 커뮤니티의 중심성 변화에 대한 탐색적 연
구: 사회연결망 분석을 이용하여. 지식경영연구, 11(2), 17-35.
백경선, 이수연 (2010). 모유수유모의 수유경험에 대한 연구. 질적연구, 11(2), 69-79.
송태민 (2014). 소셜빅데이터를활용한보건복지정책동향분석. 보건복지포럼, (213),
101-113.
이세진, 이정교 (2012). 온라인 여성 커뮤니티에서의 이용자 간 상호작용과 사회연결
망에 관한 연구. 사회과학연구, 38(2), 47-71.
이진용 외 (2009). 온라인 커뮤니티 활동과 사적 관계구축이 구전 및 구매행동에 미치
는 영향에 관한 연구 한국유통학회
이헌아, 류석진 (2013). 온라인 커뮤니티의 사회적 자본과 제도. 정보와사회, (27),
25-55.
이현숙 (2013). 내· 외부고객의 병원선택요인이 병원이미지에 미치는 영향. 보건행정학
회지, 23(3), 281-288.
전영아, 강정한 (2010). 사이버 커뮤니티에서 유형별 사회자본이 정치적 의견표명과
호응에 미치는 효과. 사이버커뮤니케이션 학보, 27(3), 177-226.
주영기, 유명순 (2011). 한국 언론의 신종플루 보도 연구. 한국언론학보, 55(5), 30-54.
최순화, 이상민, 박기우 (2000). 사이버 커뮤니티의 가치평가. 디지털 심포지엄, 삼성경
제연구소.
홍석민 (2008). 사회연결망을 통한 광고홍보학 연구자의 공식적 네트워크와 비공식적
네트워크의 비교분석 연구. 2008 봄철정기학술대회 소통과 융합, 그리고 축
제, 221-221.
Bonacich, P. (2007). Some unique properties of eigenvector centrality. Social Networks,
29(4), 555-564.
Freeman, L. C. (1979). Centrality in social networks conceptual clarification. Social
networks, 1(3), 215-239.
King, G., & Zeng, L. (2001). Logistic regression in rare events data. Political
analysis, 9(2), 137-163.
Naif Marouf, L. (2007). Social networks and knowledge sharing in organizations: a
온라인 커뮤니티에서 나타난 건강정보 전파 분석에 관한 연구 127
case study. Journal of Knowledge Management, 11(6), 110-125.
Scott, J. (2012). Social network analysis. Sage.
Uzzi, B., & Lancaster, R. (2003). The role of relationships in interfirm knowledge
transfer and learning: The case of corporate debt markets. Management
Science, 49(4), 383-399.
128 곽진아 ‧ 이원재
The research about diffusion of health issues on online
community: focused on the effect of social network on
public and private issues
Jin-Ah Kwak1) · Won-Jae Lee2)
Abstract
This paper find out factors which affect to public opinion about health issues on online
community in Korea. Also looking at the different diffusion patterns on public and privates
issues. We select the most famous and lots of discussion community about health issues,
then collect 93 months of data to construct post-reply network. Through the natural language
processing, we analyze the message of post and categorize health issues. By social network
analysis, we calculate the structural position of each individual. Also, using rare events logistic
regression, we measure the influence of peer effect about health issues. The results show
that there is a peer effect about the individual talk about health issues. Especially, when the
individual who is higher structural position talks a lot on private issue like breast-feeding,
whereas the public issue such as vaccine, flu an antibiotics doesn't.
Key words : online community, social network, health
1) Graduate Student, Dept. of Culture Technology, KAIST, 291 Daehak-ro, Yuseong-gu ,Daejeon 34141, Korea. E-mail: [email protected]
2) (Corresponding author) Professor, Dept. of Culture Technology, KAIST, 291 Daehak-ro, Yuseong-gu ,Daejeon 34141, Korea. E-mail: [email protected]