Top Banner
【マクロミル】 カラム型データベースで 分析システムを40倍高速化 2012/11/15 17:00~17:45 マクロミル 正浩、瀧澤 インサイトテクロノジー 石川 雅也
36

C37 【マクロミル】カラム型データベースで分析システムを40倍高速化 by Masahiro Hayashi, Shin Takizawa, Masaya Ishikawa

Jul 02, 2015

Download

Technology

Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: C37 【マクロミル】カラム型データベースで分析システムを40倍高速化 by Masahiro Hayashi, Shin Takizawa, Masaya Ishikawa

【マクロミル】カラム型データベースで

分析システムを40倍高速化

2012/11/15 17:00~17:45

マクロミル 林 正浩、瀧澤 伸インサイトテクロノジー 石川 雅也

Page 2: C37 【マクロミル】カラム型データベースで分析システムを40倍高速化 by Masahiro Hayashi, Shin Takizawa, Masaya Ishikawa

2

親友に心の底から奨められるモノありますか?

最近のリサーチの定番ロイヤリティ指標:NPS (Net Promoter Score)「このサービスを同僚や友人に薦められますか」

Page 3: C37 【マクロミル】カラム型データベースで分析システムを40倍高速化 by Masahiro Hayashi, Shin Takizawa, Masaya Ishikawa

3

親友に心の底から奨められるモノありますか?あなたが友人や家族に

心の底から奨められるモノは何ですか?

Page 4: C37 【マクロミル】カラム型データベースで分析システムを40倍高速化 by Masahiro Hayashi, Shin Takizawa, Masaya Ishikawa

4

はじめに

親友に心の底から奨められるモノありますか?

Page 5: C37 【マクロミル】カラム型データベースで分析システムを40倍高速化 by Masahiro Hayashi, Shin Takizawa, Masaya Ishikawa

5

はじめに

多数の友人にも奨め、自身でも大人買いしています。

Page 6: C37 【マクロミル】カラム型データベースで分析システムを40倍高速化 by Masahiro Hayashi, Shin Takizawa, Masaya Ishikawa

6

はじめに

Vectorwiseも今では無くてはならないもの多くの方に自信をもって薦められるテクノロジー

しかし、我々も出会ったのはつい1年前無知から今日までのいきさつを赤裸々に共有します

Page 7: C37 【マクロミル】カラム型データベースで分析システムを40倍高速化 by Masahiro Hayashi, Shin Takizawa, Masaya Ishikawa

7

どんな現場だったのか:弊社紹介

ネットリサーチのリーディングカンパニー 東証1部上場 従業員数:836名 (連結) 連結売上:171億円、経常利益:40億円

(2013年6月期決算) 売上前年比:120% 過去最高の収益を実現 非連続的成長を目指し

新規事業への積極的投資行っております

大企業的なFactベースの決裁プロセスが必須

Page 8: C37 【マクロミル】カラム型データベースで分析システムを40倍高速化 by Masahiro Hayashi, Shin Takizawa, Masaya Ishikawa

8

どんな現場だったのか: 弊社DNA

「早い」 「安い」 「旨い」 を実現したい

リサーチ“牛どん化”計画、ネットリサーチの分野では成功

より広範囲なクライアントのマーケティングニーズに応えたい

新規事業として食品・日用品メーカーの意志決定の起点であるPOSデータの提供をしたい

Page 9: C37 【マクロミル】カラム型データベースで分析システムを40倍高速化 by Masahiro Hayashi, Shin Takizawa, Masaya Ishikawa

9

どんな現場だったのか: POSシステムの概要

数百億件の集計を10秒以内で処理する必要ありかつ 格安で実装したい

データ提供元弊社

POSシステムクライアント様

ドラッグチェーン

スーパーチェーン

その他

食品メーカー日用品メーカー

データ件数:数百億データ容量:数TB

①POSデータ管理システム

③集計システム(クロス集計とグラフ描画)

②Web上での集計指示、結果確認、各種処理(UI)

④運用管理(マスタ管理、クライアント管理)

集計条件を自由に変えられる

結果を画面での確認できる

集計処理レポート作成処理

Excelでのレポート出力可能グラフがオブジェクトである

数千店以上

Page 10: C37 【マクロミル】カラム型データベースで分析システムを40倍高速化 by Masahiro Hayashi, Shin Takizawa, Masaya Ishikawa

10

プロジェクトで実現したいこと

POS市場にも 「早い」 「安い」 「旨い」

データ処理スピード(クライアント要望、競合比較)開発期間を極力短納期で。

開発プロジェクトを無事着地させる開発者のモチベーションが全開になるプロジェクト

新規事業→システム投資押さえたいメンテナンス費用も抑えたい

早い

安い

旨い

Page 11: C37 【マクロミル】カラム型データベースで分析システムを40倍高速化 by Masahiro Hayashi, Shin Takizawa, Masaya Ishikawa

11

Hadoop+Oracle

インメモリBIツール

DWH(バック) BI(フロント)

MySQL

Web(グラフ描画)

レポート主力(Excel Export)

スクラッチ

ハードDB

ミドルウェア

オンプレミス

オンプレミス

オンプレミス

クラウド

PostgreSQL

10社へRFP→様々な提案が出てきたが・・・

開発ベンダーからの提案内容

A社

B社

D社

BIツール

スクラッチ

C社

Page 12: C37 【マクロミル】カラム型データベースで分析システムを40倍高速化 by Masahiro Hayashi, Shin Takizawa, Masaya Ishikawa

12

レスポンスとコストの双方を満たせるものがない

開発ベンダーからの提案内容

Page 13: C37 【マクロミル】カラム型データベースで分析システムを40倍高速化 by Masahiro Hayashi, Shin Takizawa, Masaya Ishikawa

13

DWH(バック) BI(フロント)

Web(グラフ描画)

レポート主力(Excel Export)

ハードDB

ミドルウェア

InsightQube Vectorwise

途方に暮れていたところにVectorwiseと出会う想定コスト、要求処理速度の両方を満たせそう

出会い

■インサイトテクノロジー社からの提案

スクラッチ

Page 14: C37 【マクロミル】カラム型データベースで分析システムを40倍高速化 by Masahiro Hayashi, Shin Takizawa, Masaya Ishikawa

14

TPC-Hベンチマークの結果はOracleなどと比較し、1/2のハードで,2倍以上の性能,1/5~1/10のコスト→40倍のパフォーマンスが得られる事になる

出会い

Price/PerformanceUS$/QphH@1TB

0

100,000

300,000

Performance(QphH@1TB)

TPC-H ベンチマークのトップ 8 (Non-Clustered 1TB ) 2012/1現在

Source: www.tpc.org / Jan 10, 2012

400,000

200,000 Sybase IQ15 Dec 2010

164,747

$1.37 US$6.85 US

Vectorwise3 May 2011

$0.88 US

436,788173,962

Microsoft5 Apr 2011

80 cores2TB RAM

32 cores1 TB RAM

$9.53 US $1.86 US

Microsoft30 Aug 2011

Oracle3 Jun 2011

64 cores0.5TB RAM

209,534

Oracle26 Sep 2011

201,487

$4.60 US

80 cores2TB RAM

219,888

$12.15 US

Oracle26 Apr 2010

64 cores0.5TB RAM

140,181

40 cores1TB RAM

Microsoft7 Dec 2011

134,117

$1.30 US

32 cores0.5TB RAM

32 cores0.5TB RAM

TPC-Hのベンチマーク・スコア:QphH:時間毎のトランザクション数(グラフ縦軸:トランザクション数)Price/QphH:トランザクションにいくらの費用(HW、Software、保守*ベンダ指標)がかかったかを示す

Page 15: C37 【マクロミル】カラム型データベースで分析システムを40倍高速化 by Masahiro Hayashi, Shin Takizawa, Masaya Ishikawa

15

決定に到った経緯

情報が皆無の状況から検証に取りかかった

国内にはほぼ実績がない 弊社内:「Vectorwise、カラムナーDBノウハウ無し」 開発ベンダー10数社:「Vectorwise全く知らない」 国内ファーストユーザーになる!? (なってしまう?!)

「至急、検証して確固たる裏を取れ!」・・・ 1.処理スピードは本当に速いのか? 2.検証は短期間に実施可能か? 3.実装上で問題が出た場合の体勢に不安はないか?

Page 16: C37 【マクロミル】カラム型データベースで分析システムを40倍高速化 by Masahiro Hayashi, Shin Takizawa, Masaya Ishikawa

16

親友に心の底から奨められるモノありますか?検証をどう乗り越えたか開発現場で何か起きたか

Page 17: C37 【マクロミル】カラム型データベースで分析システムを40倍高速化 by Masahiro Hayashi, Shin Takizawa, Masaya Ishikawa

検証、実証、開発現場のリアル像

パネルディスカッション

マクロミル 林 正浩、瀧澤 伸インサイトテクロノジー 石川 雅也

Page 18: C37 【マクロミル】カラム型データベースで分析システムを40倍高速化 by Masahiro Hayashi, Shin Takizawa, Masaya Ishikawa

18

親友に心の底から奨められるモノありますか?Q.Vectorwise って本当に速いの?

Page 19: C37 【マクロミル】カラム型データベースで分析システムを40倍高速化 by Masahiro Hayashi, Shin Takizawa, Masaya Ishikawa

19

親友に心の底から奨められるモノありますか?Q.そもそも検証のは

簡単?

Page 20: C37 【マクロミル】カラム型データベースで分析システムを40倍高速化 by Masahiro Hayashi, Shin Takizawa, Masaya Ishikawa

20

親友に心の底から奨められるモノありますか?

A.簡単に試せました

ユーザーズガイド等も日本語化されており、トライしやすかった。

AWSインスタンスでもデータロードスピードの速さにびっくり。処理スピードはすぐに実感できた。

社内の検証用ハイスペックPCはWindows版であったがLinux版とほとんど違いなく動き、独自で検証するハードルが低かった。

採用決定する前段階からインサイトテクノロジー社の多大なるサポートを受けることができた。

Page 21: C37 【マクロミル】カラム型データベースで分析システムを40倍高速化 by Masahiro Hayashi, Shin Takizawa, Masaya Ishikawa

21

親友に心の底から奨められるモノありますか?

A.そして本当に速かった

重要マイルストーンである「ローデータ数億件から数千万レコードのGroupByを3秒以内」の目標がすぐに確認できた。

件数を増やしても処理スピード増加率はマイルドであった。

Page 22: C37 【マクロミル】カラム型データベースで分析システムを40倍高速化 by Masahiro Hayashi, Shin Takizawa, Masaya Ishikawa

22

親友に心の底から奨められるモノありますか?

Vectorwiseのパフォーマンスを実感したできごと

(動画)

Page 23: C37 【マクロミル】カラム型データベースで分析システムを40倍高速化 by Masahiro Hayashi, Shin Takizawa, Masaya Ishikawa

23

親友に心の底から奨められるモノありますか?

Q.Viewを使いたいUnion All View って

使える?

Page 24: C37 【マクロミル】カラム型データベースで分析システムを40倍高速化 by Masahiro Hayashi, Shin Takizawa, Masaya Ishikawa

24

親友に心の底から奨められるモノありますか?A.検証して見ましょう!

Page 25: C37 【マクロミル】カラム型データベースで分析システムを40倍高速化 by Masahiro Hayashi, Shin Takizawa, Masaya Ishikawa

25

検証結果詳細

詳細検証結果は非公開

→個別検証はインサイトテクノロジー社へご相談ください。

Page 26: C37 【マクロミル】カラム型データベースで分析システムを40倍高速化 by Masahiro Hayashi, Shin Takizawa, Masaya Ishikawa

26

親友に心の底から奨められるモノありますか?

Q.カラムナーDBに更新処理を

させても良い?!

Page 27: C37 【マクロミル】カラム型データベースで分析システムを40倍高速化 by Masahiro Hayashi, Shin Takizawa, Masaya Ishikawa

27

更新処理 INSERT

Page 28: C37 【マクロミル】カラム型データベースで分析システムを40倍高速化 by Masahiro Hayashi, Shin Takizawa, Masaya Ishikawa

28

更新処理 UPDATE

Page 29: C37 【マクロミル】カラム型データベースで分析システムを40倍高速化 by Masahiro Hayashi, Shin Takizawa, Masaya Ishikawa

29

更新処理 DELETE

Page 30: C37 【マクロミル】カラム型データベースで分析システムを40倍高速化 by Masahiro Hayashi, Shin Takizawa, Masaya Ishikawa

30

親友に心の底から奨められるモノありますか?Q.オンプレとクラウド

どっちがいい?

Page 31: C37 【マクロミル】カラム型データベースで分析システムを40倍高速化 by Masahiro Hayashi, Shin Takizawa, Masaya Ishikawa

31

親友に心の底から奨められるモノありますか?Q.他に良かった

ところは?

Page 32: C37 【マクロミル】カラム型データベースで分析システムを40倍高速化 by Masahiro Hayashi, Shin Takizawa, Masaya Ishikawa

32

親友に心の底から奨められるモノありますか?

Q.じゃあ悪かったところは?

Page 33: C37 【マクロミル】カラム型データベースで分析システムを40倍高速化 by Masahiro Hayashi, Shin Takizawa, Masaya Ishikawa

33

親友に心の底から奨められるモノありますか?

お願い1.難しいSQLだと

オプティマイザが…

Page 34: C37 【マクロミル】カラム型データベースで分析システムを40倍高速化 by Masahiro Hayashi, Shin Takizawa, Masaya Ishikawa

34

親友に心の底から奨められるモノありますか?

お願い2.可用性を高める機能が欲しい

Page 35: C37 【マクロミル】カラム型データベースで分析システムを40倍高速化 by Masahiro Hayashi, Shin Takizawa, Masaya Ishikawa

35

親友に心の底から奨められるモノありますか?

お願い3.あとは値段が安くなると

最高なのだが…

Page 36: C37 【マクロミル】カラム型データベースで分析システムを40倍高速化 by Masahiro Hayashi, Shin Takizawa, Masaya Ishikawa

36

親友に心の底から奨められるモノありますか?質疑応答