DAD 블록체인 백서 초안1.0 기밀문서 1 DAD 블록체인 - 탈중앙화 광고 목차 목차 1 개요 3 온라인 디지털 광고 3 온라인 광고 시장 규모 및 전개 3 사기성 및 무효 트래픽 4 광고주와 광고 네트워크 간의 신뢰성 문제 5 어트리뷰션의 어려움 6 광고 경제에서 제외된 사용자 6 사용자 개인 정보 유출 및 열악한 사용자 환경 7 광고 검토 및 검열 8 데이터 및 타기팅 정확도 8 너무 많은 중개자 11 DAD 솔루션 12 고효율 광고 전송 알고리즘 12 강력한 사기 방지 메커니즘 12 분산 원장으로 투명성 향상 14 닫힌 데이터 열기 15 디지털 ID 및 인증 15 암호화폐 경제 및 인센티브 16 DAD 방법론 17 벡터 공간 모델 17 준뉴턴법(Quasi-Newton method) 17 신뢰영역법(Trust-Region method) 18 지수족 분포(Exponential family distributions) 19 혼합모델과 EM 알고리즘 19 베이즈 모델(Bayes Model) 21
50
Embed
DAD 블록체인 탈중앙화 광고 · dad 블록체인 백서 초안1.0 기밀문서 1 dad 블록체인 - 탈중앙화 광고 목차 목차 1 개요 3 온라인 디지털 광고
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
DAD 블록체인 백서 초안1.0
기밀문서 1
DAD 블록체인 - 탈중앙화 광고
목차
목차 1
개요 3
온라인 디지털 광고 3
온라인 광고 시장 규모 및 전개 3
사기성 및 무효 트래픽 4
광고주와 광고 네트워크 간의 신뢰성 문제 5
어트리뷰션의 어려움 6
광고 경제에서 제외된 사용자 6
사용자 개인 정보 유출 및 열악한 사용자 환경 7
광고 검토 및 검열 8
데이터 및 타기팅 정확도 8
너무 많은 중개자 11
DAD 솔루션 12
고효율 광고 전송 알고리즘 12
강력한 사기 방지 메커니즘 12
분산 원장으로 투명성 향상 14
닫힌 데이터 열기 15
디지털 ID 및 인증 15
암호화폐 경제 및 인센티브 16
DAD 방법론 17
벡터 공간 모델 17
준뉴턴법(Quasi-Newton method) 17
신뢰영역법(Trust-Region method) 18
지수족 분포(Exponential family distributions) 19
혼합모델과 EM 알고리즘 19
베이즈 모델(Bayes Model) 21
DAD 블록체인 백서 초안1.0
기밀문서 2
DAD 광고 시스템 아키텍처 22
DAD의 핵심 기술 24
DAD 시스템 프레임 워크 24
광고 검색 기술 25
오디언스 타기팅 기술 26
DAD 광고 경제 29
경제 모델 개요 29
광고주 관점 30
매체 관점 30
사용자 관점 30
블록생산자 31
DAD 광고 네트워크 성장 프로그램 31
이용자 권리 32
부적절한 콘텐츠 신고 33
개인 선호도 설정 33
콘텐츠 품질 평가 33
데이터 레이블링 34
콘텐츠 품질 개선을 돕는 토큰 경제 34
DAD 토큰 34
DAD 블록체인 36
온톨로지(Ontology) 맞춤형 공공 체인 36
컨센서스 알고리즘 37
광고 이벤트 추적 및 검증 38
토큰 분배 40
예산 할당 41
로드맵 43
핵심 팀 45
투자자 및 고문 47
파트너 49
요약 51
DAD 블록체인 백서 초안1.0
기밀문서 3
개요
온라인 디지털 광고는 수년간의 급격한 성장에 따라 엄청난 시장 규모에 도달했지만 근본적
문제들로 인해 어려움을 겪고 있다. 광고주들은 막대한 예산을 무효 트래픽에 투자한 결과 광고
네트워크에 대한 신뢰가 부족한 상황이다. 궁극적 가치 창조자인 사용자는 어떠한 보상도 받지
않으며 의사결정권도 없다.
DAD 블록체인은 차세대 공공 블록체인 및 분산 신뢰 협업 플랫폼인 온톨로지(Ontology)에
구축될 예정이다. DAD는 스마트 계약 및 토큰 경제를 통해 데이터 개방성, 거래 투명성 및 사용자
수익 배분을 이룩하며, 광고 품질 및 전달 효율성을 향상시키고, 새로운 세대의 블록체인 광고
시스템을 구축하고, 우리가 알고 있는 오늘날의 광고 산업을 재편성한다.
온라인 디지털 광고
온라인 광고 시장 규모 및 전개
2017년 전세계 온라인 광고 매출은 2,000억 달러로, 2016년 대비 11% 성장했다. 2017년 중국
온라인 광고 매출의 연간 증가율은 29%이다.
DAD 블록체인 백서 초안1.0
기밀문서 4
세계 광고 시장은 이미 거대하고 여전히 빠른 속도로 성장하고 있다. 페이스북은 단독으로 299억
달러, 전체 수익의 거의 20%를 차지하고 있다. 업계의 거인들이 시장 점유율의 대부분을
차지하고 있다.
사기성 및 무효 트래픽
WPP가 의뢰하고 비즈니스 인사이더가 인용한 최근 연구에 따르면 사기 트래픽과 봇(bot)에 의해
자동으로 생성되는 클릭에 낭비되는 전세계 광고 지출은 2017년, 164억 달러였다. 브랜드 마케팅
담당자의 78%는 부정 광고와 봇 트래픽에 관심이 있다. 세계광고주연맹에 따르면 향후 10년
동안 전세계 부정 광고 비용은 500억 달러에 달할 것으로 예상된다.
광고 에이전시와 매체들은 더 많은 수익을 창출하기 위해 과장된 트래픽과 클릭 수를 보고한
혐의를 받고 있다. 가짜 트래픽과 광고 노출을 만들어 내는 봇 네트워크가 성행하고 있다. 일부
매체는 이러한 요청이 봇을 통한 것이라는 것을 알면서도 이해관계에 따라 제한하지 않는다.
멀웨어, 좀비네트워크, 다크넷 조작자들은 조직적인 가짜 트래픽 시스템을 구축했다.
중국의 온라인 광고 수익 29% 성장
중국의 온라인 광고 수익
연간
성장
중국
의 온
라인
광고
(백만
달러
)
온라인 광고 연도별 성장율
DAD 블록체인 백서 초안1.0
기밀문서 5
광고 부정행위는 글로벌 문제 광고 부정행위의 늪에서 자유로운 곳은 이 세상에 단 한 곳도 없다. 픽셀레이트(Pixalate)는
2017년 1분기 보고서에서 전 세계적으로 전년 대비 4% 증가한, 24% 이상의 트래픽이
부정적으로 발생했다고 지적했다. 일본은 80%의 부정 트래픽으로 1위를 차지하고 있고, 브라질,
미국, 독일도 35%를 웃돌고 있다.
트래픽 사기꾼들은 그들의 흔적을 감추기 위해 긴 시간 동안 우회하여 철저하고 정확한 방식으로
데이터를 분석하는 것은 거의 불가능하다. 따라서 위에 나타낸 통계 데이터는 실제 디지털 광고
사기의 일부로만 간주되어야 한다. 그럼에도 불구하고 해당 데이터는 우리에게 디지털 광고
사기의 규모, 영향, 손실이 얼마나 클지에 대한 대강의 정보를 보여준다.
광고주와 광고 네트워크 간의 신뢰성 문제
CNN 및 다른 기사에 따르면 유니레버(Unilever)는 디지털 광고의 투명성이 부족하며 넘쳐나는
가짜 뉴스와 잘못된 정보들로 인해 구글과 페이스북 같은 디지털 플랫폼에서 그들의 광고를
내리겠다고 위협했으며, 사기를 막기 위해 IBM의 블록체인 기술을 사용하게 될 수도 있다고
전했다.
광고 에이전시의 데이터 고립으로 인해, 광고주들은 검증을 위한 원본 데이터를 얻을 방법이
Q1 국가별 데스크톱 광고 사기 인상률
일본 브라질 미국 독일 영국 프랑스 스페인
대략
적인
광고
사기
비율
DAD 블록체인 백서 초안1.0
기밀문서 6
없다. 광고 공급망은 DSP, SSP 또는 DMP 등과 같은 많은 중개 에이전시를 포함할 수 있다.
참여자 수와 유익한 연결은 트래픽 통계와 결과 어트리뷰션을 추적 할 수 없게 한다. 산업
데이터에 따르면 서로 다른 당사자 간의 불일치는 최대 20%에 이를 수 있다. 이 모든 것은 광고주,
플랫폼 그리고 매체들이 서로를 신뢰하는 것을 어렵게 만든다.
어트리뷰션의 어려움 광고에서 예산의 상당 부분은 사기 트래픽에 낭비되고, 일부는 효과가 없는 배치 불량으로 인해
낭비된다. 광고주가 낮은 ROI를 인지하면, 데이터 부족으로 인해 플랫폼은 집계된 통계 보고서만
제공할 수 있으며 어트리뷰션 분석이 어렵다. "내가 광고하는 데 쓰는 돈의 절반은 낭비인데,
문제는 내가 어느 절반을 썼는지 모른다는 것이다." 이것은 존 워너메이커(John Wanamaker)의
유명한 질문이다.
2017년 발간된 애드마스터(AdMaster)의 부정행위 방지 백서(Anti-Fraud White Paper)에 따르면,
2017년 상반기 29.6% 이상의 트래픽이 무효로 나타났다. 또한, IAB는 무효 트래픽으로 인해
2015년 디지털 광고 산업에서 46억 달러의 손실을 입었는데, 이 중 1억 6천 9백만 달러가 무효
또는 사기 트래픽에 의한 것으로 추정했다. "솔직히, 우리는 가시성의 부족, 투명하지 않은 계약,
공급의 불투명한 측정, 사기 그리고 심지어 당신의 광고가 안전하지 않은 장소에 게재되는 등
미디어 공급망에 적어도 20-30%의 폐기물이 있다고 믿는다."라고 P&G의 마크 프리차드(Marc
Pritchard)가 말했다.
광고 경제에서 제외된 사용자
사용자들은 광고에 시간과 관심을 기울이고 전환을 만들어 낸다. 그들은 또한 광고에 의해
소비되는 추가 네트워크 트래픽과 처리 능력에 대한 대가를 치른다. 하지만 그들은 어떤 수익도
공유 받지 않는다. 사용자들이 낮은 품질의 광고로 겪는 불편함과 불쾌함을 표현할 곳이 없다.
DAD 블록체인 백서 초안1.0
기밀문서 7
사용자들은 매우 소극적인 지위로 어떤 의사결정권도 없다. 이러한 노골적인 불공평 상태는
필연적으로 사용자들의 거부감을 초래하고, 이는 광고 차단 소프트웨어가 인기를 끄는 이유다.
사용자 개인 정보 유출 및 열악한 사용자 환경
인터넷 트래픽의 10%는 광고 및 광고 관련 데이터를 전송하는 데 사용된다. 통계 자료에 따르면,
모바일 사용자들은 매달 광고 트래픽에 20달러를 지출한다. 휴대폰의 배터리 수명도 광고 추가
처리과정 때문에 크게 단축된다. 빅데이터 기반 추적은 사용자의 개인 정보 보호를 무의미하게
한다. 수백만 명의 사용자들이 좌절과 불안으로 광고 차단 소프트웨어를 채택했다.
연구 단체 이마케터(eMarketer)에 따르면, 미국에서는 데스크톱 28%, 모바일 인터넷 사용자
11.8%가 광고 차단 소프트웨어를 사용하고 있다.
다수 사용자 기반의 일부 모바일 펌웨어 시스템은 사용자의 승인을 얻기 위해 판매된 배포판에
광고 차단기를 통합하기도 한다.
미국의 기기별 광고 차단 침투율, 2014-2018 스마트폰 사용자와 데스크톱/노트북 인터넷 사용자 비율
데스크톱/노트북 스마트폰
참고: 연령에 관계 없이 광고 차단기를 활성화하여 스마트폰 또는 데스크톱/노트북으로
최소 월별 1회 인터넷에 접속하는 사용자
DAD 블록체인 백서 초안1.0
기밀문서 8
문제는, 만약 모든 사람들이 광고 차단 소프트웨어를 사용한다면, 광고 산업은 존재하지 않을
것이라는 것이다. 광고주와 매체는 사용자의 우려를 더욱 깊이 이해하고 문제를 근본적으로
해결해야 한다.
광고 검토 및 검열 플랫폼이나 매체가 자신의 광고를 제대로 검토하지 못하면 사용자는 불법 또는 부적합한
콘텐츠에 노출될 것이다. 예를 들어, 중국의 한 유명 검색 엔진 회사는 사기성 의료 광고를
게재했다는 이유로 공공의 비난을 받고 있다. 이런 종류의 문제성 광고는 사용자 경험을 해칠
뿐만 아니라 이용자에게 금전적 또는 심지어 물리적 피해를 줄 수 있다. 의도치 않게 이런 광고를
내보낸 매체도 평판에 손상을 입을 것이다. 광고주, 플랫폼, 매체는 모두 자신의 광고를 정확히
검토하고 검열할 의무가 있다.
데이터 및 타기팅 정확도
2017년에는 전 세계 광고 예산의 25%가 구글과 페이스북에 지출되었다. 디지털 온라인
미디어만을 고려하면 이 수치는 무려 61%에 이를 수 있다.
전 세계 광고의 25%가 구글과 페이스북에 사용 구글 및 페이스북이 벌어들인 전 세계 광고 수입 추정 비율
전 세계 온라인 광고 수익 비율
전체 미디어 광고 수익 비율
DAD 블록체인 백서 초안1.0
기밀문서
10
두 거대 기업이 시장을 독점하고 있는 반면, 그들의 트래픽은 전 세계 광고 트래픽의 1/5만을
차지하는데, 이는 페이스북과 구글이 단지 20%의 트래픽으로 수익의 60%를 벌었다는 것을
의미한다. 나머지 트래픽 80%가 차지하는 40%의 매출에 비교해 보면, 페이스북과 구글의 평균
eCPM이 다른 기업들보다 6배나 높다.'
구글과 페이스북은 브랜드 신뢰성 외에도, 그들의 고유한 데이터 이점이 광고주들로 하여금
기꺼이 그들 예산의 대부분을 값비싼 트래픽에 지불하도록 만든다.
세계에서 가장 큰 검색 엔진인 구글은 현재 사용자들의 실제 수요를 나타내는 연관 검색
데이터를 가장 많이 가지고 있다. 데이터의 가치는 광고 슬롯, 창의성 및 기타 주변 요인의 가치를
훨씬 능가했다. 예를 들어, OTA 광고는 "A에서 B로 비행"을 검색하는 사용자에게 표시되며, "…의
주식 가격"을 검색하는 사용자에게는 금융 광고가, "...의 분쟁 해결 방법"의 검색자에게는 법률
회사 광고가 제공된다.
세계 최대의 소셜 미디어인 페이스북은 가장 포괄적이고 가장 큰 인구 자료, 사용자 소셜 활동
데이터, 사용자 선호 데이터 등을 보유하고 있다. 여성용 립스틱 광고, 젊은 남성용 전기면도기,
코카콜라 팔로워를 위한 펩시 광고. 이러한 광고의 효율성은 불규칙한 사용자 행동 데이터를
기반으로 맹목적으로 최적화된 미디어 전달보다 의심의 여지없이 높다.
스마트사이트(Smartinsights)의 보고서에 따르면
• 모든 광고 형식 및 배치에서 광고 CTR은 0.05%에 불과
• 리치미디어 광고 CTR 0.1%
이와 같은 기간에 페이스북이 나스닥에 발표한 평균 CTR는 2.98%로 세계 평균의 30배에 이른다.
따라서 페이스북과 구글은 트래픽에 대해 다른 미디어보다 몇 배나 더 많은 요금을 부과하지만,
이들의 타기팅 정확도는 평균보다 훨씬 높은 CTR과 CVR을 유도해 ROI의 이점을 효과적으로
보장한다.
하지만, 사용자들로부터 나온 데이터가 구글과 페이스북에 엄청난 이익을 가져다 준다 해도,
사용자들은 그들이 마땅히 받아야 할 보상을 받지 못했다. 다시 말해, 사용자들이 개인정보
보호와 보안을 전제로 다른 매체에서 자신들의 데이터를 활용할 수 있도록 허가하여 수익을
크게 증가시키면, 수익 증가의 일부를 그들에게 다시 할당할 수 있다. 이것은 결국 더 낮은 비용과
DAD 블록체인 백서 초안1.0
기밀문서
11
더 나은 사용자 경험을 제공하는 더 나은 인터넷 환경으로 이어질 것이다.
너무 많은 중개자
아래의 영향 분포 그래프는 승자독식의 다른 인터넷 분야와 달리 광고 산업은 고유한 공급망의
업스트림과 다운스트림 관계의 특성에 따라 차별화된 다수의 산업 역할을 형성하고 있음을
보여준다. 각각의 역할에는 적어도 수십 개의 혹은 수백 개의 회사가 참여하고 있다.
과도한 중개인들은 복잡한 관계를 형성한다. 그것은 광고 품질 관리에 심각한 문제를 야기할 뿐만
아니라, 리브로킹으로 인해 예산의 층이 나뉘게 되고 광고의 품질과 효과를 떨어뜨린다.
루마스케이프(LUMAscape)
마 케 터
매 체
소 비 자
DAD 블록체인 백서 초안1.0
기밀문서
12
DAD 솔루션 DAD 블록체인은 블록체인과 스마트 계약 기술을 10년 이상 축적한 광고 산업 및 파트너의
경험을 결합하여 오늘날의 광고 산업에서 발견되는 단점과 문제점을 해결하는 솔루션을
제안한다.
고효율 광고 전송 알고리즘
블록체인 기술은 기존의 온라인 광고에 사용되는 빅데이터 알고리즘 외에도 분배 효율 최적화에
새로운 영역을 제공한다. 토큰 경제로 인센티브를 받는 사용자는 개인 행동 및 선호 데이터를
공유하여 데이터 품질을 더욱 개선할 수 있다. 프라이버시가 보호된다는 전제 하에서, 데이터
공유는 광고 전달의 정확성을 향상시키는데 도움이 된다. 빅데이터 시스템과 AI 알고리즘은
SDK에서 수집한 데이터, 사용자가 공유한 데이터 및 블록체인에서 공유하는 데이터를 결합하여
최고의 ROI와 최상의 사용자 경험을 갖춘 최적 전송 계획을 산출한다.
강력한 사기 방지 메커니즘
DAD 블록체인은 실전에서 검증된 데이터 정화 및 부정 행위 탐지 알고리즘 외에도 블록체인에서
광고 전송 및 노출 프로세스를 추적한다. 데이터 투명성은 수익 계산과 할당에서 일관성을
보장하여 부정행위를 일으키기 쉬운 광고 공급망의 링크를 제거한다.
DAD 광고 시스템은 데이터 정화 및 부정 행위 감지를 위한 성숙한 알고리즘과 최적의
매개변수로 훈련된 모델을 제공한다. 교차 검증을 위해 사용자 측 데이터(지갑 및 브라우저
확장프로그램으로 수집), 매체 데이터 및 플랫폼 수집 데이터를 결합한다.
사기성 광고 트래픽과 악성 노드를 더 잘 식별하기 위해, 우리는 장단기메모리(LSTM, Long
short-term memory)를 사용하고 이 모델을 악의적 행동 데이터로 훈련시킬 것이다. 1단계에서는
오프라인 모델 훈련에 텐서플로우(TensorFlow)를 사용하고 REST 스타일 API를 통해 부정 방지
서비스를 제공할 예정이다. 기술이 발전함에 따라 실시간 훈련과 서비스 이용이 가능해 질
것이다.
DAD 블록체인 백서 초안1.0
기밀문서
13
순환신경망(RNN, Recurrent Neural Network)은 단기 입력에 상당히 민감하다. 그러나 광고
산업에서 과거 부정 행위 데이터는 동일한 어드바이저리 값을 갖는다. LSTM 네트워크는 RNN
상단에 상태 장치를 추가하고 더 긴 시간 시퀀스 데이터 활용을 보완한다. LSTM은 신경 장치에
입력 게이트, 출력 게이트와 삭제 게이트의 3개 게이트를 추가한다. 입력값은 "메모리"에
기록되기 위해 입력 게이트를 통과해야 한다. 출력 게이트는 "메모리"의 값을 읽을 수 있는지
여부를 결정한다. 삭제 게이트는 기억된 값이 보존될지를 결정한다.
아래 도표는 LSTM의 훈련 모델을 보여준다. 사용자 행동 데이터는 모델에 대한 입력값으로
사용된다. 그것은 시간의 연속성을 가지고 있다. 1일 슬라이딩 윈도우를 사용하여 훈련 세트를
준비한다. 모든 입력 데이터는 우선 동시 신경망(CNN, concurrent neural network)에 의해
처리된다. LSTM 네트는 숨겨진 레이어를 구성한다. 소프트맥스(softmax) 분류기 이후 최종
출력값은 0과 1 사이의 숫자가 된다. 1에 가까울수록 좋은 사용자가 될 확률이 높고 0에
가까울수록 낮아진다.
DAD 블록체인 백서 초안1.0
기밀문서
14
분산 원장으로 투명성 향상 "월드 가든(walled garden)" 모델을 채택하면, 구글이나 페이스북과 같은 거대 기업체들은 모두
데이터 접근을 제한한다. 에이전트와 다른 매개 당사자들은 복잡한 이해 관계를 형성하고
복잡성은 광고주들로 하여금 다른 당사자들에 대한 신뢰를 잃게 만든다. 불신을 해소하는 열쇠는
매개 링크를 줄이고 투명성을 높이는 것이다.
DAD 블록체인에서는 매체가 블록체인에 ID를 등록하고 판매 가능한 광고 포지션을 게시할 수
있다. 광고주들은 포지션과 전송 계획을 선택하고 스마트 계약을 이용하여 구매 계약을 체결한다.
가격 입찰 규칙과 전체 프로세스는 분산된 원장에 의해 기록된다. 블록체인의 탈중앙적 성격으로
유일 당사자를 신뢰할 필요가 없어진다. 거래는 일단 기록되면 절대 변경될 수 없다.
거래 과정의 투명성은 전통적 광고 구매에서 발견되는 불신을 제거하여 효율적 광고 경제를
위한 기반을 제공한다.
중립 선의의 사용자 악의의 사용자
소프트맥스 분류기
평균 풀링
콘볼루션 신경망 기반 검출기
DAD 블록체인 백서 초안1.0
기밀문서
15
닫힌 데이터 열기 데이터는 효율적으로 운영되는 광고 시스템의 핵심 요소다. 오디언스 분석, 타기팅 정확도, 결과
평가 및 부정 방지 알고리즘 모두 데이터를 필요로 한다. 독점적 경쟁 시스템에서는 광고
플랫폼과 출판 플랫폼이 데이터를 공유하지 않는다. 데이터 이점은 업계 대기업의 핵심 경쟁력이
되어 그들은 경쟁 업체와 어떤 것도 공유하고 싶어하지 않는다. 일부 소규모 매체들은 그들의
교섭력과 경쟁력을 높이기 위해 데이터 동맹을 결성했다. 고립된 데이터 섬들이 많이 형성되어
있지만 사용자 개인정보와 회사 이익 문제 때문에 없애기 힘든 상황이다.
DAD 블록체인은 사용자가 개인정보 보호를 받는 동시에 공유 데이터의 사용을 허가할 수 있도록
한다. 여러 데이터 소스를 통합하여 데이터를 공유하면 여러 당사자가 윈-윈할 수 있다.
디지털 ID 및 인증
DAD 블록체인은 사용자 개인정보를 보호하는 동시에 사용자 ID를 확인하고 정보 사용을
허가하는 방법을 제공한다. 전통적 인터넷 빅데이터 산업에서, 데이터 소비자들은 다양한
채널에서 데이터를 구입하고, 허가되지 않았거나, 부적합한 데이터 사용은 증언하거나 제거하기
어려워 사실상 산업적 관행이 되었다. 빅데이터 회사들은 사용자 데이터로 큰 돈을 벌지만 거의
사용자들과 어떤 것도 공유하지 않는다.
디지털 ID와 데이터 인증 메커니즘은 새로운 가능성을 제시한다. 사용자는 광고 품질을 개선하기
위해 데이터를 자발적으로 게시하고 신뢰할 수 있는 당사자에게 사용을 허가할 수 있다. 광고
수익의 일부는 데이터 제공자들에게 할당되어 더 많은 공유와 업데이트를 장려할 것이다.
사용자에게 토큰으로 보상하는 것은 그들로 하여금 기꺼이 데이터를 공유하도록 한다.
인센티브는 공유 동기를 유발한다. 그러나 데이터 보안과 개인정보에 대한 우려가 실제로
해결되지 않는 한 사용자 저항을 완화하기는 어렵다.
DAD 블록체인은 거래 당사자들이 실제 세계의 ID를 공개하지 않고도 익명으로 안전하게
데이터를 공유할 수 있도록 한다. 암호 알고리즘에 의해 뒷받침되는 보안 메커니즘은 이전보다
사용자 데이터 유출 가능성을 낮추고 사용자들로 하여금 데이터를 공유하도록 장려한다.
DAD 블록체인 백서 초안1.0
기밀문서
16
암호화폐 경제 및 인센티브
DAD 블록체인 전체 경제체제는 암호화폐를 중심으로 구성된다. 궁극적으로 광고 경제에서
가치를 창출하는 광고 독자들은 항상 수동적으로 광고를 받아왔고 수익을 공유할 수도 없었고,
의사 결정력도 없었다. DAD 블록체인은 최종 사용자에게 광고 예산의 일부를 할당하고 이를
경제 시스템에서 중요한 역할을 하도록 한다. 사용자 소득은 마우스의 커서를 움직이고 클릭하는
것과 같은 검색 동작과 실행에 따라 계산된다. 매체의 소득도 같은 지표에 기초할 것이다. 그래서
사용자들은 광고주와 매체와 동등한 중요성을 지닌 경제 참여자가 되고, 광고의 수익을 공유할
뿐만 아니라 더 많은 권리를 갖게 된다.
그러한 메커니즘은 고품질의 광고와 적합하게 타기팅된 광고를 장려하고, 사용자들이 광고들을
습관적으로 무시하거나 심지어 적극적으로 차단하는 대신 광고에 더 많은 주의를 기울이도록
장려한다. 토큰 경제의 설계는 당사자들이 공정하고 투명한 방법으로 수익을 공유할 수 있도록
하고 광고 품질과 정확성을 향상시켜 전체 경제 시스템의 가치를 크게 증가시킨다.
매체와 광고주들은 DAD 블록체인 계정을 확인할 수 있었다. 계정의 신뢰도 점수는 블록체인에
의해 유지되고 저장되며, 트래픽 품질, 광고 품질 및 콘텐츠 전송 속도에 의해 결정된다. 예를
들어, 매체의 서버가 잦은 오작동으로 인해 효과적으로 광고를 전송할 수 없을 경우, 그 신뢰도
점수가 차감될 것이다.
광고주들은 그들이 발행하는 광고가 사기성을 내포하거나, 해당 지역의 법을 위반하거나,
사용자들의 불편함을 야기한다면 점수를 잃게 될 것이다.
DAD 블록체인의 분산된 민주적 투표 시스템은 광범위한 오디언스를 업계의 감독자로 바꾼다.
사용자는 광고 콘텐츠의 품질을 판단하고 부적합한 광고를 신고할 수 있다. 블록체인 시스템
계약은 공정한 투표 메커니즘을 제공한다. 유권자들은 그들의 행정 참여에 대한 토큰을 받을
것이다.
블록체인 자체와 시스템 계약의 매개변수도 투표에 따라 업그레이드할 수 있다.
DAD 블록체인 백서 초안1.0
기밀문서
17
DAD 방법론
DAD는 엄청난 수의 사용자와 광고주를 대상으로 하며, 데이터 처리, 광고 검색 및 사용자 프로필
등과 같은 실제 세계의 문제를 처리하기 위해 정보 검색, 최적화, 기계 학습 및 관련 기술을
필요로 한다.
벡터 공간 모델 벡터 공간 모델은 정보 검색에서 가장 중요한 문서 유사성 모델 중 하나이다. 이 모델은 용어
가중치의 벡터를 사용하여 텍스트 문서를 나타낸다.
는 용어 의 i 번째 용어의 TF-IDF를 나타내며 , 여기서 TF는 용어 주파수, 즉 용어의 발생
횟수를 의미하고 IDF는 역 문서 빈도, 즉 모든 문서에서의 용어 빈도의 역수를 의미한다. TF와
IDF는 다음과 같이 표현 될 수 있다.
위의 설명에 따라 두 문서 간 유사성을 벡터 간의 코사인 거리로 정의한다.
DAD 시스템에서 벡터 공간 모델은 광고 유사성 검색 및 대규모 데이터 마이닝 등에 사용된다.
준뉴턴법(Quasi-Newton method)
DAD의 응용 시나리오에는, 해결해야 할 제약이 있는 최적화 문제가 있다. 이에 대한 일반적
접근방식은 (로컬) 최적 솔루션을 찾기 위해 경사하강법(gradient descendent)을 사용하는
것이다. 실제로 경사하강법은 오래 걸리는 경우가 많고, 준뉴턴법이 더 잘 작동할 수 있다.
DAD 블록체인 백서 초안1.0
기밀문서
18
의 2차 편미분(second-order partial derivatives )의 행렬은
헤시안 행렬(Hessian matrix )이다. 경사 및 2 차 편미분의 최적화를 동시에 사용하여
현 위치에서 2 차 테일러 전개(second-order Taylor expansion )를 적용하고 2차 곡면(quadric
surface)의 최소값을 구할 수 있다.
일 때, 뉴턴 방법의 각 반복은 2차 곡면의 최소값을 구한다. 최소값은 헤시안 행렬이 양의
정부호(positive definite)일 경우에만 존재한다. 실제 최적화 문제에서는 헤시안 행렬의 모든
지점이 양의 정부호인지 확인하기 어렵다. 해결책은 변수 업데이트를 위해 실제 헤시안 행렬을
대체하는 데 사용되는 헤시안 근사 행렬을 구성하는 것이다. 다른 헤시안 근사 행렬 업데이트
공식은 다른 준뉴턴 방법을 만드는 것이다. BFGS는 광범위한 준뉴턴 방식이며, 이 중 업데이트
공식은
이며
는 두 반복 간의 그래디언트 차이이다.
는 독립변수의 차이이다.
신뢰영역법(Trust-Region method)
준뉴턴법은 먼저 기울기 하강을 결정하고 해당 방향에 따라 1차원 검색을 수행하는 것이다.
신뢰영역법은 각 반복 동안 신뢰 영역의 검색을 제한하고 다음 반복의 방향과 단계를 동시에
결정한다. 현재 지역에서 실행 가능한 해결책을 찾을 수 없는 경우 신뢰 영역은 더 작게
업데이트된다. 각 반복에서, 함수 의 독립 변수 차이 는 근점 지점 의
테일러 전개를 원래의 기능과 가깝게 하기 위해
DAD 블록체인 백서 초안1.0
기밀문서
19
를 만족시켜야 한다.
각 반복의 하위문제는 이전 반복에서 발견된 에 근거하여
s.t. 형태를 가지며, 현재 반복의 방향과 단계를 동시에 얻을 수 있다. 이 방법은 대개 목적 함수의 첫
번째와 두 번째 미분에 근접하지 않고 기울기 하강을 더 잘 추측함으로 인해 때때로 더 빠르게
수렴한다.
실제로, 준뉴턴법과 신뢰영역법 간의 선택은 특정 최적화 문제에 근거하여 이루어져야 한다.
지수족 분포(Exponential family distributions)
수학적 편리함 때문에 지수족 분포는 머신 러닝에서 중요한 역할을 한다. 가우스 분포, 분포,
분포, 다항 분포와 같은 공통 분포는 모두 지수족에 속한다. 지수족 분포의 정규화된 형태는
다음과 같이 표현된다.
여기서 는 집계 특성 함수의 벡터 형태, 는 지수분포 매개 변수, 는 정규화
용어이다. 의 최대가능도는 다음에 의해 구할 수 있으며
지수군 분포는 혼합모델과 EM 알고리즘의 기초가 된다.
혼합모델과 EM 알고리즘
혼합 모델은 복잡한 분포에 적합하도록 엔지니어링에서 다중 지수 분포의 혼합물을 사용하는
데이터 모델링 방법을 말한다. DAD 광고 시스템에서 클릭율과 환산율을 추정하는 데 사용한다.