Top Banner
Copyright ©2014 Treasure Data. All Rights Reserved. Tableau が魅せる Data Visualization の世界 2014/09 Takahiro Inoue (Chief Data Scientist) [email protected]
69

Tableauが魅せる Data Visualization の世界

Dec 05, 2014

Download

Technology

Takahiro Inoue

 
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

Tableau が魅せるData Visualization の世界

201409Takahiro Inoue (Chief Data Scientist)

takatreasure-‐‑‒datacom

Copyright copy2014 Treasure Data All Rights Reserved

自己紹介

bull  井上emsp 敬浩 (Twitter doryokujin )

bull  チーフデータサイエンティスト

bull  慶應大学院数学科統計専攻

bull  トレジャーデータ公式ブログオーサー

bull  MongoDBマスター

213

httptreasure-‐‑‒datahateblojp

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

313

参考文献(Tableau公式)httpwwwtableausoftwarecomlearnwhitepapersdownload 参考文献(Class Method)httpdevclassmethodjp

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server

5  Tableau times Treasure Data

6  Tableau テクニック集

413

この 10 項目のトレンドに将来性がある

これらのトレンドは顧客が現在何をしていて将来のためにどこに投資しているかについて顧客と話すことで見えてきます良い知らせは先手を打って失敗した挫折感ではなくさらに確実な先手を打つ意欲によって推進されている投資が最も多いことですおそらく過去数年間の新しいテクノロジーと投資がついに成果を上げ始めているのです2013 年にはビジネス インテリジェンスの大きな変化を必ず期待できます

wwwtableausoftwarecomdesktop

Tableau Software はお客様がデータを見て理解するのをお手伝いします世界中の 10000 を超える組織で使用されている Tableau は迅速な分析視覚化および超高速処理ビジネスインテリジェンスを提供しています

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒1 誰もがデータサイエンスを武器にできる時代に

513

bull  データサイエンスは専門家だけでなく一般のビジネスマンが扱うものになりつつありますbull  データ分析に関する知識識は肩書きに「アナリスト」が付くような専門家だけではなく一般のビ ジネスマンにも必要な知識識になり

始めていますデータに基づいて決定を行行う企業が競争力力を高めデータを活用しない企業が競争力力を弱めています詳細はThe Economist の「Fostering a Data-Driven Culture (データ主導型の文化を育成)」 をご覧ください

データサイエンティストの消滅 データサイエンスは専門家だけでなく一般のビジネスマンが扱うものになりつつありますデータ分析に関する知識は肩書きに「アナリスト」が付くような専門家だけではなく一般のビジネスマンにも必要な知識になり始めていますデータに基づいて決定を行う企業が競争力を高めデータを活用しない企業が競争力を弱めています

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒2 ビッグデータBI は共にクラウドへ

613

bull  データ分析の導入を速めたい企業はクラウドベースのビジネスインテリジェンスの採用を推進していますbull  顧客との連携やモバイルアクセスなどの新たなシナリオもクラウドビジネスインテリジェンスの導入を加速しています

bull  Treasure Data のクラウド データ ウェアハウスにより数カ月かかるデータウェアハウスの構築を数日で実現することができます

bull  これによりラピッド プロトタイピングが可能になり以前とは比較にならない柔軟性をもたらします

詳細はホワイトペーパー「Business Analytics in the Cloud (クラウドのビジネス分析)」をご覧ください

クラウド ビジネス インテリジェンスが主流になる データ分析の導入を速めたい企業はクラウド ベースのビジネス インテリジェンスの採用を推進しています顧客との連携やファイアウォール外のモバイル アクセスなどの新たなシナリオもクラウド ビジネス インテリジェンスの導入を加速していますまたクラウド サービスが成熟することで IT 部門によるビジネス インテリジェンスのクラウド化への懸念が弱まっています

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒3 ストーリーテリングの重要性

713

bull  人々はコンテクストのないダッシュボードが増えても役立立たないことを理理解してきましたbull  ストーリーテリングではデータを利利用してアイデアや洞洞察を効果的に伝えることができます

bull  また大容量量の異異種データが持つ意味を汲み取ることもできます詳細はホワイトペーパー「5 Best Practices for Telling Great Stories (優れたストリーを伝える 5 つのベスト プラクティス)」をご覧ください

ストリーテリングの重要性 人々はコンテクストのないダッシュボードが増えても役立たないことを理解してきましたストリーテリングではデータを利用してアイデアや洞察を効果的に伝えることができますまた大容量の異種データが持つ意味を汲み取ることもできます

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒4 モバイルBIが主流流に

813

bull  最先端の企業にとってモバイル ビジネスインテリジェンス は主流流となり 特別な場合のみに使用するものではなくなっていますbull  ビジネス ユーザーはオフィスだけではなく日常業務の流流れでどんな時でも情報にアクセスする必要性に 迫られています

最先端の企業にとってモバイル ビジネス インテリジェンスは主流となり 特別なときに使用するものではなくなっていますビジネス ユーザーはオフィスだけではなく日常業務の流れでどんな時でも情報にアクセスする必要性に迫られています

事例についてはホワイトペーパー「How Mobile Business Intelligence Drives Efficiency and Transformation for Supervalue (モバイル ビジネス インテリジェンスが Supervalue の効率と変革を促進)」をご覧ください

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒5 データストアの急増

913

bull  その昔組織には様々ななタイプのデータがありましたbull  CRMデータ販売時点データ電子メールなど組織の経営

陣は多大な努力力を払いすべてのデータを1つの自社の高速なデータウェアハウスに保存していました

bull  2014年年にはこれがおとぎ話となりますすべてのデータはFluentd ベースの Treasure Agent を通じて一元的に収集管理理できまたトレジャーストレージはあらゆるデータの共存を容易易に実現しています

bull  トレジャーを初めとするデータや作業負荷に適したデータストアは解決すべき問題ではなく優れた IT 組織の特徴の 1 つとなります データ ストアの急増その昔組織にはさまざまなタイプのデータがありましたCRM データ販売時点データ電子メールなど組織の経営陣は多大な努力を払いすべてのデータを 1 つの高速なデータ ウェアハウスに保存していました

2013 年にはこれがおとぎ話となりますすべてのデータを 1 か所に保管する組織はもはや存在しませんさらに1 か所に保管する理由もなくなります大量のデータは Teradata や Hadoop などの場所に保管できます取引データは Oracle や SQL Server に保管できますデータや作業負荷に適したデータ ストアは解決すべき問題ではなく優れた IT 組織の特徴の 1 つとなります

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒6 自立性が新しいセルフサービスに

1013

bull  セルフ サービス BI はビジネス ユーザーがより優れた決定を行行うために必要なデータを分析できるようにするという考え方です

bull  自立立性はこの概念念の時代の到来ですこれはndash  ビジネス ユーザーが適切切なデータにアクセスできること

ndash  そのデータが 使用可能な形式と場所にあること

ndash  またビジネス ユーザーにセルフサービス分析が可能なソリューションがあること

を意味します

bull  これらすべてが実現できればビジネス ユーザーはビジネス上の問題に自分で対応できIT は安全なデータとそれにア クセスするためのソリューションの提供に集中することができます

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒7 コラボレーションは機能でなく現実に

1113

bull  ビジネスインテリジェンスソリューションではよくコラボレーション機能が盛んに宣伝されてきましたが2014年年にはそれだけでは十分でなくなります

bull  コラボレーションはビジネス インテリジェンスの導入の本質でなければなりません

bull  ビジネ スに関する質問のやり取りといった共有体験なくしてビジネスインテリジェンスは存在し得ないためです

bull  2014 年年には企業は問題の理理解と解決に向けた共同作業に組織全体の人を関与させるための方法を追求するようになります

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

1213

a  Tableau Desktopb  Tableau Readerc  Tableau Serverd  Tableau Public

Copyright copy2014 Treasure Data All Rights Reserved

2 ビジネスが抱える課題

1  上層部から分析を要求されているndash  幹部チームからもっとデータ主導型企業になるよう要求されているけれども具体的な施策が見つからない

2  大量量のレポートの要求を受け続けているndash  終わらないまま毎日増え続けるリストにうんざりしお手上げ状態である

ndash  優秀な分析チームも最善を尽くし少なくともリクエストに優先順位を付けて作業することは可能ですがその場合は優先度度の高いものだけが処理理されその他のものは手つかずに終わる可能性があります

3  レポートを提出することでさらに必要なレポートが増えていくndash  レポートの作成前に必要な内容をすべて確認したにもかかわらずフォローアップの質問は途切切れることがありません

ndash  あなたのレポート内容に人々が惹きつけられたということでもありますがその後の度度重なる質問に回答するため再度度チーム内に聞いて回っていては 非効率率率的です

4  データが古いことにフラストレーションを感じているndash  レポートを要求しレポートを待ちそのレポートに 関する質問を投げかけるというサイクルで避けられない問題の 1

つにデータが最新でなくなるという点があります

ndash  ビジネスにおいてもプライベートにおいても現代の世界では「すぐに満足感を得たい」という風潮がありますこのように待ち時間が多くてはその期待には応えられません

1313

Copyright copy2014 Treasure Data All Rights Reserved

2 ビジネスが抱える課題5  マッシュアップしたデータを要求される

ndash  実際に「マッシュアップ」という単語が使われていないかもしれませんが「サードパーティのデータも追加してくれないか」 「Excel ファイルに大量量のデータがあるがそれがこれとどう関係しているのかが見見たい」など要求されていませんか

ndash  複数のデータソースを組み合わせることの有用性は分かっていても一元管理理された BI チームでこのような調整を行行うのは容易易ではありません

6  視覚的分析を求めているndash  人間は行行や列列表を見見 る よりも分かりやすい視覚的な形でデータを見見た方が多くの情報を認識識できます

ndash  まだ視覚的データを要求されてい なくても近いうちに要求されるようになるはずです

ndash  それ がセルフサービスBIとどう関係するのかデータを様々な形で見見ることができれば疑問に対する新たな視点を求められることがなくなります

7  すでに一部で使用しているndash  全てに当てはまるわけではありませんが多くの企業がすでにセルフサービスBIを独自に採用しています

ndash  才覚のあるビジネスリーダーはチームの処理理能力力の限界を把握し彼らが非常に優秀で優れたプロジェクトを運営できることを認識識しています

ndash  その結果独自のセルフサービスBIを採用するケースが多く見見られます

ndash  ITリーダーにとって希望の兆しとなるのはその導入によってすばらしい結果が生み出されることでセルフサービス BI の取り組みをサポートする支援者を 得られるという点です

1413

Copyright copy2014 Treasure Data All Rights Reserved

2 回避したい7つの間違い1  複雑すぎるスタート

ndash  野心的になりすぎてすべてのビジネス課題を網羅羅する詳細すぎるリアルタイムのダッシュボードを作成しユーザーにたくさんの詳細オプションを提供することは簡単です

ndash  「完璧」なダッシュボードを作成するために何週間も何ヶ月も時間を費やさないでくださいその代わり試作品とテスト調整の短いサイクルで作業します

2  誰も理理解できない指標を使用するndash  あなたにとってつじつまが合う指標の表示方法やラベル付け方法は他の人にとってもそうでしょうか

ndash  あなたは指標を熟知しているので別のものと検証するステップはいらないかもしれません

ndash  指標がダッシュボードの目標をサポートするだけ でなく閲覧者が理理解できるようにする必要があります

3  重要でないグラフィックや分かりにくいウィジェットで乱雑なダッシュボードにするndash  ゲージのようなグラフィックやウィジェットでダッシュボードを派手にデザインしすぎないようにします

ndash  こうしたものは見見た目は良良いですが迅速かつ簡単に閲覧者に知らせるというダッシュボードの目的が妨げられる場合がありますダッシュボードは見見た目をシンプルに抑えてください

4  複雑なテクノロジーや大きなビジネス インテリジェンス展開プロジェクトを待つndash  従来のビジネス インテリジェンス (BI) の実装は最初の予測よりも長くかかる場合があります従来の BI プロジェクト

が実現するまで待つと何ヶ月も何年年も遅れる場合がありますすぐにダッシュボードを構築して配布できるアプリケーションを使用してください

1513

Copyright copy2014 Treasure Data All Rights Reserved

2 回避したい7つの間違い

5  ダッシュボードの作成と維持のための時間とリソースを過小評価するndash  ダッシュボードの展開は1回で終わる作業ではありません

ndash  指標に関連性がありデータが最新であるかを閲覧者と確認 することを怠ると誰も使用しなくなります定期的にダッシュボードの実用性を確認してください

6  指標と目標が一致しないndash  ダッシュボードは大きな目標に接続するとより強力力になります部署内の主な指標が組織全体としての成功に反映しない

ダッシュボードを作成してしまうことのないようにします

7  効果的でないデザインの悪いグラフやチャートを使うndash  グラフやチャートをデザインする際は気をつける必要があります

ndash  たとえば3D チャートで閲覧者の理理解が増すことはありません派手な色が解釈の邪魔になることもあります円グラフは値が6つ以上ある場合は特に効果的とは言えません

ndash  優れたビジュアライゼーションのデザインは「6 Tableau Best Practice」を参照してください

1613

Copyright copy2014 Treasure Data All Rights Reserved

2 Tableauの特徴

1713

p4

ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI 二分に満たしていたためです 4700 人以上の従業員用に

同院では Tableau の超高速処理ビジネス インテリジェンス ソリューションを組織全体 (病院研究施設財団法人) に導入しました

特定の人が適切な時間管理のために病院内にいる必要はありません誰もが時間管理を改善したいと考えていますビジネス ユーザーにも IT 部門にも時間節約のニーズがあります超高速処理 BI を導入すれば大規模な BI プロジェクトでも長引くことはなくなりますビジネス ユーザーが実際に使用できる成果物を得られるまで数か月場合によっては数年かかるような事態に陥ることはなくなりますまたExcel でのレポート作成と共有という不便な環境を強いられることもなくなります

次のいずれかの質問に当てはまる場合既存の BI システムは想定された速度で機能していない bull ビジネス インテリジェンス ソリューションの導入または変更に数週間から数か月かかりますか

bull レポートやダッシュボードの作成または変更に IT 部門への依頼が必要でありIT 部門による対応待ちや未処理の状態になったりしますか

bull BI ソリューションでは新しいユーザーが初めてダッシュボードまたはレポートを作成してパブリッシュできるようになるまでトレーニングに数日または数週間かかりますか

bull BI ソリューションは綿密なスケジュールやシステムの

パフォーマンス低下の場合の回避策に依存していますか

bull 企業のデータ ウェアハウスや高速データベースに多額の投資を行っていてもBI ソリューションによりデータの複製が必要になりますか

bull BI ソリューションでは統合前の特殊な作業を行わないとデータにアクセスできませんか

bull リレーショナル データベース以外に保存されている生データや非構造化データを含め複数のソースからのデータをブレンドできることに制約はありませんか

これまでのビジネス インテリジェンス ソフトウェアは導入に時間がかかります購入に数か月実装に数か月以上かかりますユーザーのトレーニングには数週間かかり高いコストもかかります開発者はビジネス ユーザーに要望を聞きその結果を持ち帰ってレポートを作成します変更の反映には何度かの確認とやり直しを経て数週間かかります2 つのデータ ソースを組み合わせるためにITはそれらの両方を収容する新しいデータ リポジトリを構築する必要がありますその後開発者は再びレポート作成のプログラミングに取り組みますこれでは導入プロセス全体が大幅に停滞しているように感じられます

超高速処理ビジネス インテリジェンスの場合と比べてみましょうこの場合まずトライアル版ソフトウェアをダウンロードしてインストールしますスプレッドシートやリレーショナル データベースからキューブHadoop などに至るまであらゆる種類のデータにアクセスしますこの操作はワンクリックで可能です高速データ ストアにライブ接続するか抽出データを高速データ エンジンにインポートするかを選

図 1 データ ワークフローのあらゆる段階で高速化

これまでのビジネス インテリジェンスと比べて超高速処理分析ではソフトウェアのインストールからデータへのアクセス複雑な情報の

分析インタラクティブなダッシュボードのパブリッシュ組織全体での共有に至るまでワークフローのあらゆる段階でその処理速度は

10 ~ 100 倍高速です

Install Access Analyze Publish Share

10 X 100 TIMES FASTER

p14

ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI

Tableau 超高速処理ビジネス インテリジェンスの背景テクノロジー超高速処理ビジネス インテリジェンスを文字どおり超高速にしている要因は何でしょうかそれは VizQLtrade ですTableau のこの特許取得済みのクエリ言語により簡単なドラッグ アンド ドロップ操作であらゆる規模トピック形式のデータを視覚化できますVizQL はユーザーによる操作をデータベース クエリに変換した後その応答をグラフィカルに表現しますその結果新しいデータベースおよびスプレッドシートのまったく新しい操作方法が生まれました視覚化計算がサポートされているためインタラクティブな質問と回答を通じてデータのさまざまなビューを繰り返し生成することができます

VizQL に続く超高速処理ビジネス インテリジェンスの次の画期的なテクノロジーはTableau のダイレクト接続 amp クエリ機能を使用して既存のデータベースに高速にアクセスして活用できるというものでしたビッグデータを含めほぼすべてのデータ ソースに対して最適化されたコネクタを使用することでTableau では専門知識を必要とせずにライブ データ ソースへのクエリと接続が可能です

ldquoTableau を使用して昨年度は収益が 2 増加しましたこれは 2 億米ドルに相当します航空または運送業界で収益を挙げたいと考えるならばTableau の使用をお勧めしますrdquo

China Eastern Airlines 社ネットワーキングおよび収益部門上級管理

者James Pu 氏

しかしTableau の進化はまだ続きますライブ データ ソースに接続できないときや接続したくないときのためにTableau にはビルトイン データ エンジンを使用して数百万行のデータのアド ホック分析を数秒で実行できる機能が用意されていますTableau のビルトイン データ エンジンは膨大なデータの高速処理が可能であるためビュー間を簡単に切り替えて意味のある傾向や外れ値を検出できますデータ エンジンは PC 上で動作する高性能のインメモリ分析データベースですデータ エンジンにより低速のデータ ソースを高速化できますさらにその速度を活か

して高速のデータ ストアに直接接続することもできますもちろんこれらの 2 つのデータ アクセス方式 (ライブ接続とインメモリ) の間には完全な互換性がありますアクセス方式がライブ接続かインメモリかにかかわらず複数のデータ ソースをブレンドし組み合わせることができます

Databases Cubes Spreadsheets Hadoop amp More

In-Memory Data Live Connection

PC Browser iPad AndroidDesktop

図 10 Tableau アーキテクチャTableau のアーキテクチャには膨大なデータ ソースに対応する

ためにインメモリとライブ接続という 2 つの方法が用意されて

います

最後に 結論企業や公共機関がビジネス インテリジェンスに求めるものには大きな変化が生じていますこれまでの BI の処理は低速で膨大なリソースが必要ですたとえばSeattle Childrenrsquos Hospital に家族が病気の子供を 連れて行くとしましょう家族は一刻も早く子供を診察してもらいたいと思うでしょう速度の重要性は病院に限られることではありません競争の激しい市場では企業は販売促進やコスト削減のために数か月も待つことはできませんたとえばM Financial Group 社は競合他社より勝るペースで北米で最も認知度と評価度の高い保険ブランドの 2000 万米ドルを超える有標製品を発売しましたTableau を使用して私は膨大なデータ セットをドリルダウンしすぐにリレーシ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

uarr 導入から分析共有までのサイクルが10〜~100倍速いです larrあらゆるデータソース(インプット)あらゆる端末(アウトプット)をTableauが繋ぎます darrTableau Desktop で作成したレポートをすぐにパブリックにできます

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒a Tableau Desktop

bull  考える速さで分析するndash  データに接続しコードを1行行も書かずにクエリを実行行できます

ndash  ドラッグアンドドロップを使用したビュー間の直感に沿った移動が可能ですndash  ペタバイト単位または何十億行行ものデータを測定するかどうかに関わらずTableau は可能な限り高速に動作するように構築さ

れています

ndash  Windows Macemsp 両対応(ver 82)

ndash  Tablesu Desktop のインプットソースとして無尽蔵の Treasure ストレージを選択可能ビッグデータをマウスでアドホックに扱えます

1813

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒b Tableau Reader

bull  Tableau Reader はTableau Desktopで作成したビジュアライゼーションを開いて表示できる無料料のデスクトップアプリケーションです

bull  Tableau Reader ではデータを含むTableau Desktopで作成したビジュアライゼーションを開いて操作可能です

bull  作成者の許可の範囲内であればデータをフィルタードリルダウン表示が可能です

bull  作成者によって組み込まれていない場合は操作を編集したり実行行したりすることは不不可能です

bull  Window Mac 両対応

1913

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒c Tableau Server

bull  作成したダッシュボードをWEBアプリ化する事でどこからでもどのデバイスでも分析出来るようになります

bull  データソースへの接続を Tableau Server に集約することによりデータの共有データマートとしての利利用が可能になります

2013

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒d Tableau Public

bull  導入利利用は無料料です

bull  接続出来るデータの種類に制限されます

bull  EXCELテキスト等接続データソースに制限です

bull  利利用出来る行行数データサイズに(100万行行1GB)制約があります

bull  一般公開を前提としたサービスです

2113

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

2213

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2313

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2413

ディメンションbull  定性的な情報やカテゴリ情報を含むフィール

ドを『ディメンション』として扱います

bull  テキストや日付の値を持つフィールドもこれらに含まれます

bull  行行または列列の棚にドラッグドロップをする事でヘッダを生成します

メジャーbull  行行または列列の棚にドラッグドロップを行行う

と『軸』を生成します

bull  デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2513

フィルタ

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2613

マーク gt カラー

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2713

マーク gt サイズ マーク gt ラベル

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  テキストテーブル(text tables)b  ヒートマップ(heat maps)c  ハイライトテーブル(highlight tables)d  記号マップ(symbol maps)e  色塗りマップ(filled maps)f  円グラフ(pie charts)g  水平棒グラフ(horizontal bars)h  積み上げ棒グラフ(stacked bars)i  並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j  ツリーマップ(tree maps)k  円ビュー(circle views)l  並列列円(side-‐‑‒by-‐‑‒side circles)

2813

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  線グラフ連続(lines continuous)b  線グラフ不不連続(lines discrete)c  二重線(dual lines)d  エリアチャート連続(area charts continuous)e  エリアチャート不不連続(area charts discrete)f  2つの組み合わせ(dual combination)g  散布図(scatter plots)h  ヒストグラム(histgram)i  箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j  ガントビュー(gantt view)k  ブレットグラフ(bullet graphs)l  パックバブル(packed bubbles)

2913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒1 Show Me gt 棒グラフ

bull  ひと目で最高値と最低値を見見ることができます

bull  棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます

bull  例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較

bull  応用例例ndash  1つのダッシュボードに複数の棒グラフを使用多数のス

プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります

ndash  棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます

ndash  積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です

ndash  棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます

ndash  バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります

3013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒2 Show Me gt 折れ線グラフ

bull  折れ線グラフは個々の数値データ ポイントを「線」で結びます

bull  それにより値の連続性をわかりやすく視覚化することが可能です

bull  主に一定期間にわたる傾向を表す際に使用します

bull  応用例例ndash  折れ線グラフと棒グラフを組み併せ特定の株価の1日あ

たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます

ndash  線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます

3113

7HFKHDGVampDSLWDO5DLVHGLQ

Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1

$0

$5000

$10000

$15000

$20000

$25000

$30000

$35000

Run

ning

Sum

of O

ffer A

mou

nt (i

n m

il)

7HFKQRORJ

(QHUJ

+HDOWKampDUH

ampRQVXPHU

XVLQHVV6HUYLFHV5HDO(VWDWH

6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV

ampOLFNKHUHWRFOHDUILOWHU

5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒3 Show Me gt 円グラフ

bull  円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです

bull  円グラフは最も誤用されやすいグラフです

bull  データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします

bull  円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように

bull  例例比率率率を表す

bull  応用例ndash  円の扇形を6つまでに制限します比率率率が6つ以上ある場

合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります

ndash  円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします

3213

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒4 Show Me gt マップ

bull  郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります

bull  例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域

bull  応用例例ndash  マップを他の種類のチャートグラフ表のフィルターと

して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます

ndash  マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます

3313

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒5 Show Me gt 散布図

bull  一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます

bull  例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料

bull  応用例 ndash  傾向線最良良適合線を追加します データの相関性に傾向

線を追加すると結果がより明瞭になります

ndash  フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます

ndash  情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります

3413

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒6 Show Me gt ガントチャート

bull  ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です

bull  プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます

bull  応用例ndash  色を追加するガント チャート内のバーの色を変えるこ

とで変数の重要側面をすばやく 伝えることができますndash  マップや他の種類のチャートをガントチャートと組み合わ

せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます

3513

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒7 Show Me gt バブルチャート

bull  バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください

bull  様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す

bull  例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率

bull  応用例ndash  散布図のデータを強調する 各データ ポイントのサイズ

や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます

ndash  マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります

3613

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒8 Show Me gt ヒストグラムbull  ヒストグラムはグループ間でのデータの分散を表示

する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです

bull  データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます

bull  データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます

bull  例例ndash  データのグループ化をテストする データに合ったグ

ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます

ndash  フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります

3713

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒9 Show Me gt ブレットグラフbull  目標がある場合その目標までの進行行状況を追跡するにはブレッ

トグラフが適しています

bull  本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです

bull  ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します

bull  ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)

bull  例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)

bull  応用例例ndash  色を使用して達成のしきい値を示すプライマリメジャーの背景に赤

黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます

ndash  概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます

3813

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒10 Show Me gt ヒートマップ

bull  ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます

bull  例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード

bull  応用例ndash  四角形のサイズを変えますヒート マップでは四角形

のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます

ndash  四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります

3913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒11 Show Me gt ハイライト表

bull  ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます

bull  例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口

bull  応用例例ndash  ハイライト表を他の種類のチャートと組み合わせる たと

えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります

4013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 2: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

自己紹介

bull  井上emsp 敬浩 (Twitter doryokujin )

bull  チーフデータサイエンティスト

bull  慶應大学院数学科統計専攻

bull  トレジャーデータ公式ブログオーサー

bull  MongoDBマスター

213

httptreasure-‐‑‒datahateblojp

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

313

参考文献(Tableau公式)httpwwwtableausoftwarecomlearnwhitepapersdownload 参考文献(Class Method)httpdevclassmethodjp

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server

5  Tableau times Treasure Data

6  Tableau テクニック集

413

この 10 項目のトレンドに将来性がある

これらのトレンドは顧客が現在何をしていて将来のためにどこに投資しているかについて顧客と話すことで見えてきます良い知らせは先手を打って失敗した挫折感ではなくさらに確実な先手を打つ意欲によって推進されている投資が最も多いことですおそらく過去数年間の新しいテクノロジーと投資がついに成果を上げ始めているのです2013 年にはビジネス インテリジェンスの大きな変化を必ず期待できます

wwwtableausoftwarecomdesktop

Tableau Software はお客様がデータを見て理解するのをお手伝いします世界中の 10000 を超える組織で使用されている Tableau は迅速な分析視覚化および超高速処理ビジネスインテリジェンスを提供しています

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒1 誰もがデータサイエンスを武器にできる時代に

513

bull  データサイエンスは専門家だけでなく一般のビジネスマンが扱うものになりつつありますbull  データ分析に関する知識識は肩書きに「アナリスト」が付くような専門家だけではなく一般のビ ジネスマンにも必要な知識識になり

始めていますデータに基づいて決定を行行う企業が競争力力を高めデータを活用しない企業が競争力力を弱めています詳細はThe Economist の「Fostering a Data-Driven Culture (データ主導型の文化を育成)」 をご覧ください

データサイエンティストの消滅 データサイエンスは専門家だけでなく一般のビジネスマンが扱うものになりつつありますデータ分析に関する知識は肩書きに「アナリスト」が付くような専門家だけではなく一般のビジネスマンにも必要な知識になり始めていますデータに基づいて決定を行う企業が競争力を高めデータを活用しない企業が競争力を弱めています

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒2 ビッグデータBI は共にクラウドへ

613

bull  データ分析の導入を速めたい企業はクラウドベースのビジネスインテリジェンスの採用を推進していますbull  顧客との連携やモバイルアクセスなどの新たなシナリオもクラウドビジネスインテリジェンスの導入を加速しています

bull  Treasure Data のクラウド データ ウェアハウスにより数カ月かかるデータウェアハウスの構築を数日で実現することができます

bull  これによりラピッド プロトタイピングが可能になり以前とは比較にならない柔軟性をもたらします

詳細はホワイトペーパー「Business Analytics in the Cloud (クラウドのビジネス分析)」をご覧ください

クラウド ビジネス インテリジェンスが主流になる データ分析の導入を速めたい企業はクラウド ベースのビジネス インテリジェンスの採用を推進しています顧客との連携やファイアウォール外のモバイル アクセスなどの新たなシナリオもクラウド ビジネス インテリジェンスの導入を加速していますまたクラウド サービスが成熟することで IT 部門によるビジネス インテリジェンスのクラウド化への懸念が弱まっています

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒3 ストーリーテリングの重要性

713

bull  人々はコンテクストのないダッシュボードが増えても役立立たないことを理理解してきましたbull  ストーリーテリングではデータを利利用してアイデアや洞洞察を効果的に伝えることができます

bull  また大容量量の異異種データが持つ意味を汲み取ることもできます詳細はホワイトペーパー「5 Best Practices for Telling Great Stories (優れたストリーを伝える 5 つのベスト プラクティス)」をご覧ください

ストリーテリングの重要性 人々はコンテクストのないダッシュボードが増えても役立たないことを理解してきましたストリーテリングではデータを利用してアイデアや洞察を効果的に伝えることができますまた大容量の異種データが持つ意味を汲み取ることもできます

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒4 モバイルBIが主流流に

813

bull  最先端の企業にとってモバイル ビジネスインテリジェンス は主流流となり 特別な場合のみに使用するものではなくなっていますbull  ビジネス ユーザーはオフィスだけではなく日常業務の流流れでどんな時でも情報にアクセスする必要性に 迫られています

最先端の企業にとってモバイル ビジネス インテリジェンスは主流となり 特別なときに使用するものではなくなっていますビジネス ユーザーはオフィスだけではなく日常業務の流れでどんな時でも情報にアクセスする必要性に迫られています

事例についてはホワイトペーパー「How Mobile Business Intelligence Drives Efficiency and Transformation for Supervalue (モバイル ビジネス インテリジェンスが Supervalue の効率と変革を促進)」をご覧ください

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒5 データストアの急増

913

bull  その昔組織には様々ななタイプのデータがありましたbull  CRMデータ販売時点データ電子メールなど組織の経営

陣は多大な努力力を払いすべてのデータを1つの自社の高速なデータウェアハウスに保存していました

bull  2014年年にはこれがおとぎ話となりますすべてのデータはFluentd ベースの Treasure Agent を通じて一元的に収集管理理できまたトレジャーストレージはあらゆるデータの共存を容易易に実現しています

bull  トレジャーを初めとするデータや作業負荷に適したデータストアは解決すべき問題ではなく優れた IT 組織の特徴の 1 つとなります データ ストアの急増その昔組織にはさまざまなタイプのデータがありましたCRM データ販売時点データ電子メールなど組織の経営陣は多大な努力を払いすべてのデータを 1 つの高速なデータ ウェアハウスに保存していました

2013 年にはこれがおとぎ話となりますすべてのデータを 1 か所に保管する組織はもはや存在しませんさらに1 か所に保管する理由もなくなります大量のデータは Teradata や Hadoop などの場所に保管できます取引データは Oracle や SQL Server に保管できますデータや作業負荷に適したデータ ストアは解決すべき問題ではなく優れた IT 組織の特徴の 1 つとなります

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒6 自立性が新しいセルフサービスに

1013

bull  セルフ サービス BI はビジネス ユーザーがより優れた決定を行行うために必要なデータを分析できるようにするという考え方です

bull  自立立性はこの概念念の時代の到来ですこれはndash  ビジネス ユーザーが適切切なデータにアクセスできること

ndash  そのデータが 使用可能な形式と場所にあること

ndash  またビジネス ユーザーにセルフサービス分析が可能なソリューションがあること

を意味します

bull  これらすべてが実現できればビジネス ユーザーはビジネス上の問題に自分で対応できIT は安全なデータとそれにア クセスするためのソリューションの提供に集中することができます

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒7 コラボレーションは機能でなく現実に

1113

bull  ビジネスインテリジェンスソリューションではよくコラボレーション機能が盛んに宣伝されてきましたが2014年年にはそれだけでは十分でなくなります

bull  コラボレーションはビジネス インテリジェンスの導入の本質でなければなりません

bull  ビジネ スに関する質問のやり取りといった共有体験なくしてビジネスインテリジェンスは存在し得ないためです

bull  2014 年年には企業は問題の理理解と解決に向けた共同作業に組織全体の人を関与させるための方法を追求するようになります

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

1213

a  Tableau Desktopb  Tableau Readerc  Tableau Serverd  Tableau Public

Copyright copy2014 Treasure Data All Rights Reserved

2 ビジネスが抱える課題

1  上層部から分析を要求されているndash  幹部チームからもっとデータ主導型企業になるよう要求されているけれども具体的な施策が見つからない

2  大量量のレポートの要求を受け続けているndash  終わらないまま毎日増え続けるリストにうんざりしお手上げ状態である

ndash  優秀な分析チームも最善を尽くし少なくともリクエストに優先順位を付けて作業することは可能ですがその場合は優先度度の高いものだけが処理理されその他のものは手つかずに終わる可能性があります

3  レポートを提出することでさらに必要なレポートが増えていくndash  レポートの作成前に必要な内容をすべて確認したにもかかわらずフォローアップの質問は途切切れることがありません

ndash  あなたのレポート内容に人々が惹きつけられたということでもありますがその後の度度重なる質問に回答するため再度度チーム内に聞いて回っていては 非効率率率的です

4  データが古いことにフラストレーションを感じているndash  レポートを要求しレポートを待ちそのレポートに 関する質問を投げかけるというサイクルで避けられない問題の 1

つにデータが最新でなくなるという点があります

ndash  ビジネスにおいてもプライベートにおいても現代の世界では「すぐに満足感を得たい」という風潮がありますこのように待ち時間が多くてはその期待には応えられません

1313

Copyright copy2014 Treasure Data All Rights Reserved

2 ビジネスが抱える課題5  マッシュアップしたデータを要求される

ndash  実際に「マッシュアップ」という単語が使われていないかもしれませんが「サードパーティのデータも追加してくれないか」 「Excel ファイルに大量量のデータがあるがそれがこれとどう関係しているのかが見見たい」など要求されていませんか

ndash  複数のデータソースを組み合わせることの有用性は分かっていても一元管理理された BI チームでこのような調整を行行うのは容易易ではありません

6  視覚的分析を求めているndash  人間は行行や列列表を見見 る よりも分かりやすい視覚的な形でデータを見見た方が多くの情報を認識識できます

ndash  まだ視覚的データを要求されてい なくても近いうちに要求されるようになるはずです

ndash  それ がセルフサービスBIとどう関係するのかデータを様々な形で見見ることができれば疑問に対する新たな視点を求められることがなくなります

7  すでに一部で使用しているndash  全てに当てはまるわけではありませんが多くの企業がすでにセルフサービスBIを独自に採用しています

ndash  才覚のあるビジネスリーダーはチームの処理理能力力の限界を把握し彼らが非常に優秀で優れたプロジェクトを運営できることを認識識しています

ndash  その結果独自のセルフサービスBIを採用するケースが多く見見られます

ndash  ITリーダーにとって希望の兆しとなるのはその導入によってすばらしい結果が生み出されることでセルフサービス BI の取り組みをサポートする支援者を 得られるという点です

1413

Copyright copy2014 Treasure Data All Rights Reserved

2 回避したい7つの間違い1  複雑すぎるスタート

ndash  野心的になりすぎてすべてのビジネス課題を網羅羅する詳細すぎるリアルタイムのダッシュボードを作成しユーザーにたくさんの詳細オプションを提供することは簡単です

ndash  「完璧」なダッシュボードを作成するために何週間も何ヶ月も時間を費やさないでくださいその代わり試作品とテスト調整の短いサイクルで作業します

2  誰も理理解できない指標を使用するndash  あなたにとってつじつまが合う指標の表示方法やラベル付け方法は他の人にとってもそうでしょうか

ndash  あなたは指標を熟知しているので別のものと検証するステップはいらないかもしれません

ndash  指標がダッシュボードの目標をサポートするだけ でなく閲覧者が理理解できるようにする必要があります

3  重要でないグラフィックや分かりにくいウィジェットで乱雑なダッシュボードにするndash  ゲージのようなグラフィックやウィジェットでダッシュボードを派手にデザインしすぎないようにします

ndash  こうしたものは見見た目は良良いですが迅速かつ簡単に閲覧者に知らせるというダッシュボードの目的が妨げられる場合がありますダッシュボードは見見た目をシンプルに抑えてください

4  複雑なテクノロジーや大きなビジネス インテリジェンス展開プロジェクトを待つndash  従来のビジネス インテリジェンス (BI) の実装は最初の予測よりも長くかかる場合があります従来の BI プロジェクト

が実現するまで待つと何ヶ月も何年年も遅れる場合がありますすぐにダッシュボードを構築して配布できるアプリケーションを使用してください

1513

Copyright copy2014 Treasure Data All Rights Reserved

2 回避したい7つの間違い

5  ダッシュボードの作成と維持のための時間とリソースを過小評価するndash  ダッシュボードの展開は1回で終わる作業ではありません

ndash  指標に関連性がありデータが最新であるかを閲覧者と確認 することを怠ると誰も使用しなくなります定期的にダッシュボードの実用性を確認してください

6  指標と目標が一致しないndash  ダッシュボードは大きな目標に接続するとより強力力になります部署内の主な指標が組織全体としての成功に反映しない

ダッシュボードを作成してしまうことのないようにします

7  効果的でないデザインの悪いグラフやチャートを使うndash  グラフやチャートをデザインする際は気をつける必要があります

ndash  たとえば3D チャートで閲覧者の理理解が増すことはありません派手な色が解釈の邪魔になることもあります円グラフは値が6つ以上ある場合は特に効果的とは言えません

ndash  優れたビジュアライゼーションのデザインは「6 Tableau Best Practice」を参照してください

1613

Copyright copy2014 Treasure Data All Rights Reserved

2 Tableauの特徴

1713

p4

ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI 二分に満たしていたためです 4700 人以上の従業員用に

同院では Tableau の超高速処理ビジネス インテリジェンス ソリューションを組織全体 (病院研究施設財団法人) に導入しました

特定の人が適切な時間管理のために病院内にいる必要はありません誰もが時間管理を改善したいと考えていますビジネス ユーザーにも IT 部門にも時間節約のニーズがあります超高速処理 BI を導入すれば大規模な BI プロジェクトでも長引くことはなくなりますビジネス ユーザーが実際に使用できる成果物を得られるまで数か月場合によっては数年かかるような事態に陥ることはなくなりますまたExcel でのレポート作成と共有という不便な環境を強いられることもなくなります

次のいずれかの質問に当てはまる場合既存の BI システムは想定された速度で機能していない bull ビジネス インテリジェンス ソリューションの導入または変更に数週間から数か月かかりますか

bull レポートやダッシュボードの作成または変更に IT 部門への依頼が必要でありIT 部門による対応待ちや未処理の状態になったりしますか

bull BI ソリューションでは新しいユーザーが初めてダッシュボードまたはレポートを作成してパブリッシュできるようになるまでトレーニングに数日または数週間かかりますか

bull BI ソリューションは綿密なスケジュールやシステムの

パフォーマンス低下の場合の回避策に依存していますか

bull 企業のデータ ウェアハウスや高速データベースに多額の投資を行っていてもBI ソリューションによりデータの複製が必要になりますか

bull BI ソリューションでは統合前の特殊な作業を行わないとデータにアクセスできませんか

bull リレーショナル データベース以外に保存されている生データや非構造化データを含め複数のソースからのデータをブレンドできることに制約はありませんか

これまでのビジネス インテリジェンス ソフトウェアは導入に時間がかかります購入に数か月実装に数か月以上かかりますユーザーのトレーニングには数週間かかり高いコストもかかります開発者はビジネス ユーザーに要望を聞きその結果を持ち帰ってレポートを作成します変更の反映には何度かの確認とやり直しを経て数週間かかります2 つのデータ ソースを組み合わせるためにITはそれらの両方を収容する新しいデータ リポジトリを構築する必要がありますその後開発者は再びレポート作成のプログラミングに取り組みますこれでは導入プロセス全体が大幅に停滞しているように感じられます

超高速処理ビジネス インテリジェンスの場合と比べてみましょうこの場合まずトライアル版ソフトウェアをダウンロードしてインストールしますスプレッドシートやリレーショナル データベースからキューブHadoop などに至るまであらゆる種類のデータにアクセスしますこの操作はワンクリックで可能です高速データ ストアにライブ接続するか抽出データを高速データ エンジンにインポートするかを選

図 1 データ ワークフローのあらゆる段階で高速化

これまでのビジネス インテリジェンスと比べて超高速処理分析ではソフトウェアのインストールからデータへのアクセス複雑な情報の

分析インタラクティブなダッシュボードのパブリッシュ組織全体での共有に至るまでワークフローのあらゆる段階でその処理速度は

10 ~ 100 倍高速です

Install Access Analyze Publish Share

10 X 100 TIMES FASTER

p14

ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI

Tableau 超高速処理ビジネス インテリジェンスの背景テクノロジー超高速処理ビジネス インテリジェンスを文字どおり超高速にしている要因は何でしょうかそれは VizQLtrade ですTableau のこの特許取得済みのクエリ言語により簡単なドラッグ アンド ドロップ操作であらゆる規模トピック形式のデータを視覚化できますVizQL はユーザーによる操作をデータベース クエリに変換した後その応答をグラフィカルに表現しますその結果新しいデータベースおよびスプレッドシートのまったく新しい操作方法が生まれました視覚化計算がサポートされているためインタラクティブな質問と回答を通じてデータのさまざまなビューを繰り返し生成することができます

VizQL に続く超高速処理ビジネス インテリジェンスの次の画期的なテクノロジーはTableau のダイレクト接続 amp クエリ機能を使用して既存のデータベースに高速にアクセスして活用できるというものでしたビッグデータを含めほぼすべてのデータ ソースに対して最適化されたコネクタを使用することでTableau では専門知識を必要とせずにライブ データ ソースへのクエリと接続が可能です

ldquoTableau を使用して昨年度は収益が 2 増加しましたこれは 2 億米ドルに相当します航空または運送業界で収益を挙げたいと考えるならばTableau の使用をお勧めしますrdquo

China Eastern Airlines 社ネットワーキングおよび収益部門上級管理

者James Pu 氏

しかしTableau の進化はまだ続きますライブ データ ソースに接続できないときや接続したくないときのためにTableau にはビルトイン データ エンジンを使用して数百万行のデータのアド ホック分析を数秒で実行できる機能が用意されていますTableau のビルトイン データ エンジンは膨大なデータの高速処理が可能であるためビュー間を簡単に切り替えて意味のある傾向や外れ値を検出できますデータ エンジンは PC 上で動作する高性能のインメモリ分析データベースですデータ エンジンにより低速のデータ ソースを高速化できますさらにその速度を活か

して高速のデータ ストアに直接接続することもできますもちろんこれらの 2 つのデータ アクセス方式 (ライブ接続とインメモリ) の間には完全な互換性がありますアクセス方式がライブ接続かインメモリかにかかわらず複数のデータ ソースをブレンドし組み合わせることができます

Databases Cubes Spreadsheets Hadoop amp More

In-Memory Data Live Connection

PC Browser iPad AndroidDesktop

図 10 Tableau アーキテクチャTableau のアーキテクチャには膨大なデータ ソースに対応する

ためにインメモリとライブ接続という 2 つの方法が用意されて

います

最後に 結論企業や公共機関がビジネス インテリジェンスに求めるものには大きな変化が生じていますこれまでの BI の処理は低速で膨大なリソースが必要ですたとえばSeattle Childrenrsquos Hospital に家族が病気の子供を 連れて行くとしましょう家族は一刻も早く子供を診察してもらいたいと思うでしょう速度の重要性は病院に限られることではありません競争の激しい市場では企業は販売促進やコスト削減のために数か月も待つことはできませんたとえばM Financial Group 社は競合他社より勝るペースで北米で最も認知度と評価度の高い保険ブランドの 2000 万米ドルを超える有標製品を発売しましたTableau を使用して私は膨大なデータ セットをドリルダウンしすぐにリレーシ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

uarr 導入から分析共有までのサイクルが10〜~100倍速いです larrあらゆるデータソース(インプット)あらゆる端末(アウトプット)をTableauが繋ぎます darrTableau Desktop で作成したレポートをすぐにパブリックにできます

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒a Tableau Desktop

bull  考える速さで分析するndash  データに接続しコードを1行行も書かずにクエリを実行行できます

ndash  ドラッグアンドドロップを使用したビュー間の直感に沿った移動が可能ですndash  ペタバイト単位または何十億行行ものデータを測定するかどうかに関わらずTableau は可能な限り高速に動作するように構築さ

れています

ndash  Windows Macemsp 両対応(ver 82)

ndash  Tablesu Desktop のインプットソースとして無尽蔵の Treasure ストレージを選択可能ビッグデータをマウスでアドホックに扱えます

1813

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒b Tableau Reader

bull  Tableau Reader はTableau Desktopで作成したビジュアライゼーションを開いて表示できる無料料のデスクトップアプリケーションです

bull  Tableau Reader ではデータを含むTableau Desktopで作成したビジュアライゼーションを開いて操作可能です

bull  作成者の許可の範囲内であればデータをフィルタードリルダウン表示が可能です

bull  作成者によって組み込まれていない場合は操作を編集したり実行行したりすることは不不可能です

bull  Window Mac 両対応

1913

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒c Tableau Server

bull  作成したダッシュボードをWEBアプリ化する事でどこからでもどのデバイスでも分析出来るようになります

bull  データソースへの接続を Tableau Server に集約することによりデータの共有データマートとしての利利用が可能になります

2013

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒d Tableau Public

bull  導入利利用は無料料です

bull  接続出来るデータの種類に制限されます

bull  EXCELテキスト等接続データソースに制限です

bull  利利用出来る行行数データサイズに(100万行行1GB)制約があります

bull  一般公開を前提としたサービスです

2113

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

2213

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2313

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2413

ディメンションbull  定性的な情報やカテゴリ情報を含むフィール

ドを『ディメンション』として扱います

bull  テキストや日付の値を持つフィールドもこれらに含まれます

bull  行行または列列の棚にドラッグドロップをする事でヘッダを生成します

メジャーbull  行行または列列の棚にドラッグドロップを行行う

と『軸』を生成します

bull  デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2513

フィルタ

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2613

マーク gt カラー

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2713

マーク gt サイズ マーク gt ラベル

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  テキストテーブル(text tables)b  ヒートマップ(heat maps)c  ハイライトテーブル(highlight tables)d  記号マップ(symbol maps)e  色塗りマップ(filled maps)f  円グラフ(pie charts)g  水平棒グラフ(horizontal bars)h  積み上げ棒グラフ(stacked bars)i  並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j  ツリーマップ(tree maps)k  円ビュー(circle views)l  並列列円(side-‐‑‒by-‐‑‒side circles)

2813

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  線グラフ連続(lines continuous)b  線グラフ不不連続(lines discrete)c  二重線(dual lines)d  エリアチャート連続(area charts continuous)e  エリアチャート不不連続(area charts discrete)f  2つの組み合わせ(dual combination)g  散布図(scatter plots)h  ヒストグラム(histgram)i  箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j  ガントビュー(gantt view)k  ブレットグラフ(bullet graphs)l  パックバブル(packed bubbles)

2913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒1 Show Me gt 棒グラフ

bull  ひと目で最高値と最低値を見見ることができます

bull  棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます

bull  例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較

bull  応用例例ndash  1つのダッシュボードに複数の棒グラフを使用多数のス

プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります

ndash  棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます

ndash  積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です

ndash  棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます

ndash  バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります

3013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒2 Show Me gt 折れ線グラフ

bull  折れ線グラフは個々の数値データ ポイントを「線」で結びます

bull  それにより値の連続性をわかりやすく視覚化することが可能です

bull  主に一定期間にわたる傾向を表す際に使用します

bull  応用例例ndash  折れ線グラフと棒グラフを組み併せ特定の株価の1日あ

たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます

ndash  線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます

3113

7HFKHDGVampDSLWDO5DLVHGLQ

Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1

$0

$5000

$10000

$15000

$20000

$25000

$30000

$35000

Run

ning

Sum

of O

ffer A

mou

nt (i

n m

il)

7HFKQRORJ

(QHUJ

+HDOWKampDUH

ampRQVXPHU

XVLQHVV6HUYLFHV5HDO(VWDWH

6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV

ampOLFNKHUHWRFOHDUILOWHU

5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒3 Show Me gt 円グラフ

bull  円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです

bull  円グラフは最も誤用されやすいグラフです

bull  データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします

bull  円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように

bull  例例比率率率を表す

bull  応用例ndash  円の扇形を6つまでに制限します比率率率が6つ以上ある場

合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります

ndash  円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします

3213

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒4 Show Me gt マップ

bull  郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります

bull  例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域

bull  応用例例ndash  マップを他の種類のチャートグラフ表のフィルターと

して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます

ndash  マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます

3313

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒5 Show Me gt 散布図

bull  一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます

bull  例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料

bull  応用例 ndash  傾向線最良良適合線を追加します データの相関性に傾向

線を追加すると結果がより明瞭になります

ndash  フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます

ndash  情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります

3413

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒6 Show Me gt ガントチャート

bull  ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です

bull  プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます

bull  応用例ndash  色を追加するガント チャート内のバーの色を変えるこ

とで変数の重要側面をすばやく 伝えることができますndash  マップや他の種類のチャートをガントチャートと組み合わ

せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます

3513

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒7 Show Me gt バブルチャート

bull  バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください

bull  様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す

bull  例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率

bull  応用例ndash  散布図のデータを強調する 各データ ポイントのサイズ

や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます

ndash  マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります

3613

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒8 Show Me gt ヒストグラムbull  ヒストグラムはグループ間でのデータの分散を表示

する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです

bull  データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます

bull  データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます

bull  例例ndash  データのグループ化をテストする データに合ったグ

ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます

ndash  フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります

3713

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒9 Show Me gt ブレットグラフbull  目標がある場合その目標までの進行行状況を追跡するにはブレッ

トグラフが適しています

bull  本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです

bull  ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します

bull  ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)

bull  例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)

bull  応用例例ndash  色を使用して達成のしきい値を示すプライマリメジャーの背景に赤

黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます

ndash  概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます

3813

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒10 Show Me gt ヒートマップ

bull  ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます

bull  例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード

bull  応用例ndash  四角形のサイズを変えますヒート マップでは四角形

のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます

ndash  四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります

3913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒11 Show Me gt ハイライト表

bull  ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます

bull  例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口

bull  応用例例ndash  ハイライト表を他の種類のチャートと組み合わせる たと

えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります

4013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 3: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

313

参考文献(Tableau公式)httpwwwtableausoftwarecomlearnwhitepapersdownload 参考文献(Class Method)httpdevclassmethodjp

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server

5  Tableau times Treasure Data

6  Tableau テクニック集

413

この 10 項目のトレンドに将来性がある

これらのトレンドは顧客が現在何をしていて将来のためにどこに投資しているかについて顧客と話すことで見えてきます良い知らせは先手を打って失敗した挫折感ではなくさらに確実な先手を打つ意欲によって推進されている投資が最も多いことですおそらく過去数年間の新しいテクノロジーと投資がついに成果を上げ始めているのです2013 年にはビジネス インテリジェンスの大きな変化を必ず期待できます

wwwtableausoftwarecomdesktop

Tableau Software はお客様がデータを見て理解するのをお手伝いします世界中の 10000 を超える組織で使用されている Tableau は迅速な分析視覚化および超高速処理ビジネスインテリジェンスを提供しています

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒1 誰もがデータサイエンスを武器にできる時代に

513

bull  データサイエンスは専門家だけでなく一般のビジネスマンが扱うものになりつつありますbull  データ分析に関する知識識は肩書きに「アナリスト」が付くような専門家だけではなく一般のビ ジネスマンにも必要な知識識になり

始めていますデータに基づいて決定を行行う企業が競争力力を高めデータを活用しない企業が競争力力を弱めています詳細はThe Economist の「Fostering a Data-Driven Culture (データ主導型の文化を育成)」 をご覧ください

データサイエンティストの消滅 データサイエンスは専門家だけでなく一般のビジネスマンが扱うものになりつつありますデータ分析に関する知識は肩書きに「アナリスト」が付くような専門家だけではなく一般のビジネスマンにも必要な知識になり始めていますデータに基づいて決定を行う企業が競争力を高めデータを活用しない企業が競争力を弱めています

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒2 ビッグデータBI は共にクラウドへ

613

bull  データ分析の導入を速めたい企業はクラウドベースのビジネスインテリジェンスの採用を推進していますbull  顧客との連携やモバイルアクセスなどの新たなシナリオもクラウドビジネスインテリジェンスの導入を加速しています

bull  Treasure Data のクラウド データ ウェアハウスにより数カ月かかるデータウェアハウスの構築を数日で実現することができます

bull  これによりラピッド プロトタイピングが可能になり以前とは比較にならない柔軟性をもたらします

詳細はホワイトペーパー「Business Analytics in the Cloud (クラウドのビジネス分析)」をご覧ください

クラウド ビジネス インテリジェンスが主流になる データ分析の導入を速めたい企業はクラウド ベースのビジネス インテリジェンスの採用を推進しています顧客との連携やファイアウォール外のモバイル アクセスなどの新たなシナリオもクラウド ビジネス インテリジェンスの導入を加速していますまたクラウド サービスが成熟することで IT 部門によるビジネス インテリジェンスのクラウド化への懸念が弱まっています

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒3 ストーリーテリングの重要性

713

bull  人々はコンテクストのないダッシュボードが増えても役立立たないことを理理解してきましたbull  ストーリーテリングではデータを利利用してアイデアや洞洞察を効果的に伝えることができます

bull  また大容量量の異異種データが持つ意味を汲み取ることもできます詳細はホワイトペーパー「5 Best Practices for Telling Great Stories (優れたストリーを伝える 5 つのベスト プラクティス)」をご覧ください

ストリーテリングの重要性 人々はコンテクストのないダッシュボードが増えても役立たないことを理解してきましたストリーテリングではデータを利用してアイデアや洞察を効果的に伝えることができますまた大容量の異種データが持つ意味を汲み取ることもできます

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒4 モバイルBIが主流流に

813

bull  最先端の企業にとってモバイル ビジネスインテリジェンス は主流流となり 特別な場合のみに使用するものではなくなっていますbull  ビジネス ユーザーはオフィスだけではなく日常業務の流流れでどんな時でも情報にアクセスする必要性に 迫られています

最先端の企業にとってモバイル ビジネス インテリジェンスは主流となり 特別なときに使用するものではなくなっていますビジネス ユーザーはオフィスだけではなく日常業務の流れでどんな時でも情報にアクセスする必要性に迫られています

事例についてはホワイトペーパー「How Mobile Business Intelligence Drives Efficiency and Transformation for Supervalue (モバイル ビジネス インテリジェンスが Supervalue の効率と変革を促進)」をご覧ください

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒5 データストアの急増

913

bull  その昔組織には様々ななタイプのデータがありましたbull  CRMデータ販売時点データ電子メールなど組織の経営

陣は多大な努力力を払いすべてのデータを1つの自社の高速なデータウェアハウスに保存していました

bull  2014年年にはこれがおとぎ話となりますすべてのデータはFluentd ベースの Treasure Agent を通じて一元的に収集管理理できまたトレジャーストレージはあらゆるデータの共存を容易易に実現しています

bull  トレジャーを初めとするデータや作業負荷に適したデータストアは解決すべき問題ではなく優れた IT 組織の特徴の 1 つとなります データ ストアの急増その昔組織にはさまざまなタイプのデータがありましたCRM データ販売時点データ電子メールなど組織の経営陣は多大な努力を払いすべてのデータを 1 つの高速なデータ ウェアハウスに保存していました

2013 年にはこれがおとぎ話となりますすべてのデータを 1 か所に保管する組織はもはや存在しませんさらに1 か所に保管する理由もなくなります大量のデータは Teradata や Hadoop などの場所に保管できます取引データは Oracle や SQL Server に保管できますデータや作業負荷に適したデータ ストアは解決すべき問題ではなく優れた IT 組織の特徴の 1 つとなります

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒6 自立性が新しいセルフサービスに

1013

bull  セルフ サービス BI はビジネス ユーザーがより優れた決定を行行うために必要なデータを分析できるようにするという考え方です

bull  自立立性はこの概念念の時代の到来ですこれはndash  ビジネス ユーザーが適切切なデータにアクセスできること

ndash  そのデータが 使用可能な形式と場所にあること

ndash  またビジネス ユーザーにセルフサービス分析が可能なソリューションがあること

を意味します

bull  これらすべてが実現できればビジネス ユーザーはビジネス上の問題に自分で対応できIT は安全なデータとそれにア クセスするためのソリューションの提供に集中することができます

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒7 コラボレーションは機能でなく現実に

1113

bull  ビジネスインテリジェンスソリューションではよくコラボレーション機能が盛んに宣伝されてきましたが2014年年にはそれだけでは十分でなくなります

bull  コラボレーションはビジネス インテリジェンスの導入の本質でなければなりません

bull  ビジネ スに関する質問のやり取りといった共有体験なくしてビジネスインテリジェンスは存在し得ないためです

bull  2014 年年には企業は問題の理理解と解決に向けた共同作業に組織全体の人を関与させるための方法を追求するようになります

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

1213

a  Tableau Desktopb  Tableau Readerc  Tableau Serverd  Tableau Public

Copyright copy2014 Treasure Data All Rights Reserved

2 ビジネスが抱える課題

1  上層部から分析を要求されているndash  幹部チームからもっとデータ主導型企業になるよう要求されているけれども具体的な施策が見つからない

2  大量量のレポートの要求を受け続けているndash  終わらないまま毎日増え続けるリストにうんざりしお手上げ状態である

ndash  優秀な分析チームも最善を尽くし少なくともリクエストに優先順位を付けて作業することは可能ですがその場合は優先度度の高いものだけが処理理されその他のものは手つかずに終わる可能性があります

3  レポートを提出することでさらに必要なレポートが増えていくndash  レポートの作成前に必要な内容をすべて確認したにもかかわらずフォローアップの質問は途切切れることがありません

ndash  あなたのレポート内容に人々が惹きつけられたということでもありますがその後の度度重なる質問に回答するため再度度チーム内に聞いて回っていては 非効率率率的です

4  データが古いことにフラストレーションを感じているndash  レポートを要求しレポートを待ちそのレポートに 関する質問を投げかけるというサイクルで避けられない問題の 1

つにデータが最新でなくなるという点があります

ndash  ビジネスにおいてもプライベートにおいても現代の世界では「すぐに満足感を得たい」という風潮がありますこのように待ち時間が多くてはその期待には応えられません

1313

Copyright copy2014 Treasure Data All Rights Reserved

2 ビジネスが抱える課題5  マッシュアップしたデータを要求される

ndash  実際に「マッシュアップ」という単語が使われていないかもしれませんが「サードパーティのデータも追加してくれないか」 「Excel ファイルに大量量のデータがあるがそれがこれとどう関係しているのかが見見たい」など要求されていませんか

ndash  複数のデータソースを組み合わせることの有用性は分かっていても一元管理理された BI チームでこのような調整を行行うのは容易易ではありません

6  視覚的分析を求めているndash  人間は行行や列列表を見見 る よりも分かりやすい視覚的な形でデータを見見た方が多くの情報を認識識できます

ndash  まだ視覚的データを要求されてい なくても近いうちに要求されるようになるはずです

ndash  それ がセルフサービスBIとどう関係するのかデータを様々な形で見見ることができれば疑問に対する新たな視点を求められることがなくなります

7  すでに一部で使用しているndash  全てに当てはまるわけではありませんが多くの企業がすでにセルフサービスBIを独自に採用しています

ndash  才覚のあるビジネスリーダーはチームの処理理能力力の限界を把握し彼らが非常に優秀で優れたプロジェクトを運営できることを認識識しています

ndash  その結果独自のセルフサービスBIを採用するケースが多く見見られます

ndash  ITリーダーにとって希望の兆しとなるのはその導入によってすばらしい結果が生み出されることでセルフサービス BI の取り組みをサポートする支援者を 得られるという点です

1413

Copyright copy2014 Treasure Data All Rights Reserved

2 回避したい7つの間違い1  複雑すぎるスタート

ndash  野心的になりすぎてすべてのビジネス課題を網羅羅する詳細すぎるリアルタイムのダッシュボードを作成しユーザーにたくさんの詳細オプションを提供することは簡単です

ndash  「完璧」なダッシュボードを作成するために何週間も何ヶ月も時間を費やさないでくださいその代わり試作品とテスト調整の短いサイクルで作業します

2  誰も理理解できない指標を使用するndash  あなたにとってつじつまが合う指標の表示方法やラベル付け方法は他の人にとってもそうでしょうか

ndash  あなたは指標を熟知しているので別のものと検証するステップはいらないかもしれません

ndash  指標がダッシュボードの目標をサポートするだけ でなく閲覧者が理理解できるようにする必要があります

3  重要でないグラフィックや分かりにくいウィジェットで乱雑なダッシュボードにするndash  ゲージのようなグラフィックやウィジェットでダッシュボードを派手にデザインしすぎないようにします

ndash  こうしたものは見見た目は良良いですが迅速かつ簡単に閲覧者に知らせるというダッシュボードの目的が妨げられる場合がありますダッシュボードは見見た目をシンプルに抑えてください

4  複雑なテクノロジーや大きなビジネス インテリジェンス展開プロジェクトを待つndash  従来のビジネス インテリジェンス (BI) の実装は最初の予測よりも長くかかる場合があります従来の BI プロジェクト

が実現するまで待つと何ヶ月も何年年も遅れる場合がありますすぐにダッシュボードを構築して配布できるアプリケーションを使用してください

1513

Copyright copy2014 Treasure Data All Rights Reserved

2 回避したい7つの間違い

5  ダッシュボードの作成と維持のための時間とリソースを過小評価するndash  ダッシュボードの展開は1回で終わる作業ではありません

ndash  指標に関連性がありデータが最新であるかを閲覧者と確認 することを怠ると誰も使用しなくなります定期的にダッシュボードの実用性を確認してください

6  指標と目標が一致しないndash  ダッシュボードは大きな目標に接続するとより強力力になります部署内の主な指標が組織全体としての成功に反映しない

ダッシュボードを作成してしまうことのないようにします

7  効果的でないデザインの悪いグラフやチャートを使うndash  グラフやチャートをデザインする際は気をつける必要があります

ndash  たとえば3D チャートで閲覧者の理理解が増すことはありません派手な色が解釈の邪魔になることもあります円グラフは値が6つ以上ある場合は特に効果的とは言えません

ndash  優れたビジュアライゼーションのデザインは「6 Tableau Best Practice」を参照してください

1613

Copyright copy2014 Treasure Data All Rights Reserved

2 Tableauの特徴

1713

p4

ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI 二分に満たしていたためです 4700 人以上の従業員用に

同院では Tableau の超高速処理ビジネス インテリジェンス ソリューションを組織全体 (病院研究施設財団法人) に導入しました

特定の人が適切な時間管理のために病院内にいる必要はありません誰もが時間管理を改善したいと考えていますビジネス ユーザーにも IT 部門にも時間節約のニーズがあります超高速処理 BI を導入すれば大規模な BI プロジェクトでも長引くことはなくなりますビジネス ユーザーが実際に使用できる成果物を得られるまで数か月場合によっては数年かかるような事態に陥ることはなくなりますまたExcel でのレポート作成と共有という不便な環境を強いられることもなくなります

次のいずれかの質問に当てはまる場合既存の BI システムは想定された速度で機能していない bull ビジネス インテリジェンス ソリューションの導入または変更に数週間から数か月かかりますか

bull レポートやダッシュボードの作成または変更に IT 部門への依頼が必要でありIT 部門による対応待ちや未処理の状態になったりしますか

bull BI ソリューションでは新しいユーザーが初めてダッシュボードまたはレポートを作成してパブリッシュできるようになるまでトレーニングに数日または数週間かかりますか

bull BI ソリューションは綿密なスケジュールやシステムの

パフォーマンス低下の場合の回避策に依存していますか

bull 企業のデータ ウェアハウスや高速データベースに多額の投資を行っていてもBI ソリューションによりデータの複製が必要になりますか

bull BI ソリューションでは統合前の特殊な作業を行わないとデータにアクセスできませんか

bull リレーショナル データベース以外に保存されている生データや非構造化データを含め複数のソースからのデータをブレンドできることに制約はありませんか

これまでのビジネス インテリジェンス ソフトウェアは導入に時間がかかります購入に数か月実装に数か月以上かかりますユーザーのトレーニングには数週間かかり高いコストもかかります開発者はビジネス ユーザーに要望を聞きその結果を持ち帰ってレポートを作成します変更の反映には何度かの確認とやり直しを経て数週間かかります2 つのデータ ソースを組み合わせるためにITはそれらの両方を収容する新しいデータ リポジトリを構築する必要がありますその後開発者は再びレポート作成のプログラミングに取り組みますこれでは導入プロセス全体が大幅に停滞しているように感じられます

超高速処理ビジネス インテリジェンスの場合と比べてみましょうこの場合まずトライアル版ソフトウェアをダウンロードしてインストールしますスプレッドシートやリレーショナル データベースからキューブHadoop などに至るまであらゆる種類のデータにアクセスしますこの操作はワンクリックで可能です高速データ ストアにライブ接続するか抽出データを高速データ エンジンにインポートするかを選

図 1 データ ワークフローのあらゆる段階で高速化

これまでのビジネス インテリジェンスと比べて超高速処理分析ではソフトウェアのインストールからデータへのアクセス複雑な情報の

分析インタラクティブなダッシュボードのパブリッシュ組織全体での共有に至るまでワークフローのあらゆる段階でその処理速度は

10 ~ 100 倍高速です

Install Access Analyze Publish Share

10 X 100 TIMES FASTER

p14

ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI

Tableau 超高速処理ビジネス インテリジェンスの背景テクノロジー超高速処理ビジネス インテリジェンスを文字どおり超高速にしている要因は何でしょうかそれは VizQLtrade ですTableau のこの特許取得済みのクエリ言語により簡単なドラッグ アンド ドロップ操作であらゆる規模トピック形式のデータを視覚化できますVizQL はユーザーによる操作をデータベース クエリに変換した後その応答をグラフィカルに表現しますその結果新しいデータベースおよびスプレッドシートのまったく新しい操作方法が生まれました視覚化計算がサポートされているためインタラクティブな質問と回答を通じてデータのさまざまなビューを繰り返し生成することができます

VizQL に続く超高速処理ビジネス インテリジェンスの次の画期的なテクノロジーはTableau のダイレクト接続 amp クエリ機能を使用して既存のデータベースに高速にアクセスして活用できるというものでしたビッグデータを含めほぼすべてのデータ ソースに対して最適化されたコネクタを使用することでTableau では専門知識を必要とせずにライブ データ ソースへのクエリと接続が可能です

ldquoTableau を使用して昨年度は収益が 2 増加しましたこれは 2 億米ドルに相当します航空または運送業界で収益を挙げたいと考えるならばTableau の使用をお勧めしますrdquo

China Eastern Airlines 社ネットワーキングおよび収益部門上級管理

者James Pu 氏

しかしTableau の進化はまだ続きますライブ データ ソースに接続できないときや接続したくないときのためにTableau にはビルトイン データ エンジンを使用して数百万行のデータのアド ホック分析を数秒で実行できる機能が用意されていますTableau のビルトイン データ エンジンは膨大なデータの高速処理が可能であるためビュー間を簡単に切り替えて意味のある傾向や外れ値を検出できますデータ エンジンは PC 上で動作する高性能のインメモリ分析データベースですデータ エンジンにより低速のデータ ソースを高速化できますさらにその速度を活か

して高速のデータ ストアに直接接続することもできますもちろんこれらの 2 つのデータ アクセス方式 (ライブ接続とインメモリ) の間には完全な互換性がありますアクセス方式がライブ接続かインメモリかにかかわらず複数のデータ ソースをブレンドし組み合わせることができます

Databases Cubes Spreadsheets Hadoop amp More

In-Memory Data Live Connection

PC Browser iPad AndroidDesktop

図 10 Tableau アーキテクチャTableau のアーキテクチャには膨大なデータ ソースに対応する

ためにインメモリとライブ接続という 2 つの方法が用意されて

います

最後に 結論企業や公共機関がビジネス インテリジェンスに求めるものには大きな変化が生じていますこれまでの BI の処理は低速で膨大なリソースが必要ですたとえばSeattle Childrenrsquos Hospital に家族が病気の子供を 連れて行くとしましょう家族は一刻も早く子供を診察してもらいたいと思うでしょう速度の重要性は病院に限られることではありません競争の激しい市場では企業は販売促進やコスト削減のために数か月も待つことはできませんたとえばM Financial Group 社は競合他社より勝るペースで北米で最も認知度と評価度の高い保険ブランドの 2000 万米ドルを超える有標製品を発売しましたTableau を使用して私は膨大なデータ セットをドリルダウンしすぐにリレーシ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

uarr 導入から分析共有までのサイクルが10〜~100倍速いです larrあらゆるデータソース(インプット)あらゆる端末(アウトプット)をTableauが繋ぎます darrTableau Desktop で作成したレポートをすぐにパブリックにできます

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒a Tableau Desktop

bull  考える速さで分析するndash  データに接続しコードを1行行も書かずにクエリを実行行できます

ndash  ドラッグアンドドロップを使用したビュー間の直感に沿った移動が可能ですndash  ペタバイト単位または何十億行行ものデータを測定するかどうかに関わらずTableau は可能な限り高速に動作するように構築さ

れています

ndash  Windows Macemsp 両対応(ver 82)

ndash  Tablesu Desktop のインプットソースとして無尽蔵の Treasure ストレージを選択可能ビッグデータをマウスでアドホックに扱えます

1813

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒b Tableau Reader

bull  Tableau Reader はTableau Desktopで作成したビジュアライゼーションを開いて表示できる無料料のデスクトップアプリケーションです

bull  Tableau Reader ではデータを含むTableau Desktopで作成したビジュアライゼーションを開いて操作可能です

bull  作成者の許可の範囲内であればデータをフィルタードリルダウン表示が可能です

bull  作成者によって組み込まれていない場合は操作を編集したり実行行したりすることは不不可能です

bull  Window Mac 両対応

1913

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒c Tableau Server

bull  作成したダッシュボードをWEBアプリ化する事でどこからでもどのデバイスでも分析出来るようになります

bull  データソースへの接続を Tableau Server に集約することによりデータの共有データマートとしての利利用が可能になります

2013

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒d Tableau Public

bull  導入利利用は無料料です

bull  接続出来るデータの種類に制限されます

bull  EXCELテキスト等接続データソースに制限です

bull  利利用出来る行行数データサイズに(100万行行1GB)制約があります

bull  一般公開を前提としたサービスです

2113

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

2213

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2313

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2413

ディメンションbull  定性的な情報やカテゴリ情報を含むフィール

ドを『ディメンション』として扱います

bull  テキストや日付の値を持つフィールドもこれらに含まれます

bull  行行または列列の棚にドラッグドロップをする事でヘッダを生成します

メジャーbull  行行または列列の棚にドラッグドロップを行行う

と『軸』を生成します

bull  デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2513

フィルタ

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2613

マーク gt カラー

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2713

マーク gt サイズ マーク gt ラベル

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  テキストテーブル(text tables)b  ヒートマップ(heat maps)c  ハイライトテーブル(highlight tables)d  記号マップ(symbol maps)e  色塗りマップ(filled maps)f  円グラフ(pie charts)g  水平棒グラフ(horizontal bars)h  積み上げ棒グラフ(stacked bars)i  並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j  ツリーマップ(tree maps)k  円ビュー(circle views)l  並列列円(side-‐‑‒by-‐‑‒side circles)

2813

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  線グラフ連続(lines continuous)b  線グラフ不不連続(lines discrete)c  二重線(dual lines)d  エリアチャート連続(area charts continuous)e  エリアチャート不不連続(area charts discrete)f  2つの組み合わせ(dual combination)g  散布図(scatter plots)h  ヒストグラム(histgram)i  箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j  ガントビュー(gantt view)k  ブレットグラフ(bullet graphs)l  パックバブル(packed bubbles)

2913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒1 Show Me gt 棒グラフ

bull  ひと目で最高値と最低値を見見ることができます

bull  棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます

bull  例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較

bull  応用例例ndash  1つのダッシュボードに複数の棒グラフを使用多数のス

プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります

ndash  棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます

ndash  積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です

ndash  棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます

ndash  バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります

3013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒2 Show Me gt 折れ線グラフ

bull  折れ線グラフは個々の数値データ ポイントを「線」で結びます

bull  それにより値の連続性をわかりやすく視覚化することが可能です

bull  主に一定期間にわたる傾向を表す際に使用します

bull  応用例例ndash  折れ線グラフと棒グラフを組み併せ特定の株価の1日あ

たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます

ndash  線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます

3113

7HFKHDGVampDSLWDO5DLVHGLQ

Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1

$0

$5000

$10000

$15000

$20000

$25000

$30000

$35000

Run

ning

Sum

of O

ffer A

mou

nt (i

n m

il)

7HFKQRORJ

(QHUJ

+HDOWKampDUH

ampRQVXPHU

XVLQHVV6HUYLFHV5HDO(VWDWH

6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV

ampOLFNKHUHWRFOHDUILOWHU

5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒3 Show Me gt 円グラフ

bull  円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです

bull  円グラフは最も誤用されやすいグラフです

bull  データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします

bull  円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように

bull  例例比率率率を表す

bull  応用例ndash  円の扇形を6つまでに制限します比率率率が6つ以上ある場

合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります

ndash  円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします

3213

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒4 Show Me gt マップ

bull  郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります

bull  例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域

bull  応用例例ndash  マップを他の種類のチャートグラフ表のフィルターと

して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます

ndash  マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます

3313

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒5 Show Me gt 散布図

bull  一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます

bull  例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料

bull  応用例 ndash  傾向線最良良適合線を追加します データの相関性に傾向

線を追加すると結果がより明瞭になります

ndash  フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます

ndash  情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります

3413

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒6 Show Me gt ガントチャート

bull  ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です

bull  プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます

bull  応用例ndash  色を追加するガント チャート内のバーの色を変えるこ

とで変数の重要側面をすばやく 伝えることができますndash  マップや他の種類のチャートをガントチャートと組み合わ

せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます

3513

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒7 Show Me gt バブルチャート

bull  バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください

bull  様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す

bull  例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率

bull  応用例ndash  散布図のデータを強調する 各データ ポイントのサイズ

や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます

ndash  マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります

3613

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒8 Show Me gt ヒストグラムbull  ヒストグラムはグループ間でのデータの分散を表示

する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです

bull  データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます

bull  データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます

bull  例例ndash  データのグループ化をテストする データに合ったグ

ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます

ndash  フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります

3713

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒9 Show Me gt ブレットグラフbull  目標がある場合その目標までの進行行状況を追跡するにはブレッ

トグラフが適しています

bull  本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです

bull  ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します

bull  ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)

bull  例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)

bull  応用例例ndash  色を使用して達成のしきい値を示すプライマリメジャーの背景に赤

黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます

ndash  概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます

3813

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒10 Show Me gt ヒートマップ

bull  ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます

bull  例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード

bull  応用例ndash  四角形のサイズを変えますヒート マップでは四角形

のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます

ndash  四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります

3913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒11 Show Me gt ハイライト表

bull  ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます

bull  例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口

bull  応用例例ndash  ハイライト表を他の種類のチャートと組み合わせる たと

えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります

4013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 4: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server

5  Tableau times Treasure Data

6  Tableau テクニック集

413

この 10 項目のトレンドに将来性がある

これらのトレンドは顧客が現在何をしていて将来のためにどこに投資しているかについて顧客と話すことで見えてきます良い知らせは先手を打って失敗した挫折感ではなくさらに確実な先手を打つ意欲によって推進されている投資が最も多いことですおそらく過去数年間の新しいテクノロジーと投資がついに成果を上げ始めているのです2013 年にはビジネス インテリジェンスの大きな変化を必ず期待できます

wwwtableausoftwarecomdesktop

Tableau Software はお客様がデータを見て理解するのをお手伝いします世界中の 10000 を超える組織で使用されている Tableau は迅速な分析視覚化および超高速処理ビジネスインテリジェンスを提供しています

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒1 誰もがデータサイエンスを武器にできる時代に

513

bull  データサイエンスは専門家だけでなく一般のビジネスマンが扱うものになりつつありますbull  データ分析に関する知識識は肩書きに「アナリスト」が付くような専門家だけではなく一般のビ ジネスマンにも必要な知識識になり

始めていますデータに基づいて決定を行行う企業が競争力力を高めデータを活用しない企業が競争力力を弱めています詳細はThe Economist の「Fostering a Data-Driven Culture (データ主導型の文化を育成)」 をご覧ください

データサイエンティストの消滅 データサイエンスは専門家だけでなく一般のビジネスマンが扱うものになりつつありますデータ分析に関する知識は肩書きに「アナリスト」が付くような専門家だけではなく一般のビジネスマンにも必要な知識になり始めていますデータに基づいて決定を行う企業が競争力を高めデータを活用しない企業が競争力を弱めています

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒2 ビッグデータBI は共にクラウドへ

613

bull  データ分析の導入を速めたい企業はクラウドベースのビジネスインテリジェンスの採用を推進していますbull  顧客との連携やモバイルアクセスなどの新たなシナリオもクラウドビジネスインテリジェンスの導入を加速しています

bull  Treasure Data のクラウド データ ウェアハウスにより数カ月かかるデータウェアハウスの構築を数日で実現することができます

bull  これによりラピッド プロトタイピングが可能になり以前とは比較にならない柔軟性をもたらします

詳細はホワイトペーパー「Business Analytics in the Cloud (クラウドのビジネス分析)」をご覧ください

クラウド ビジネス インテリジェンスが主流になる データ分析の導入を速めたい企業はクラウド ベースのビジネス インテリジェンスの採用を推進しています顧客との連携やファイアウォール外のモバイル アクセスなどの新たなシナリオもクラウド ビジネス インテリジェンスの導入を加速していますまたクラウド サービスが成熟することで IT 部門によるビジネス インテリジェンスのクラウド化への懸念が弱まっています

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒3 ストーリーテリングの重要性

713

bull  人々はコンテクストのないダッシュボードが増えても役立立たないことを理理解してきましたbull  ストーリーテリングではデータを利利用してアイデアや洞洞察を効果的に伝えることができます

bull  また大容量量の異異種データが持つ意味を汲み取ることもできます詳細はホワイトペーパー「5 Best Practices for Telling Great Stories (優れたストリーを伝える 5 つのベスト プラクティス)」をご覧ください

ストリーテリングの重要性 人々はコンテクストのないダッシュボードが増えても役立たないことを理解してきましたストリーテリングではデータを利用してアイデアや洞察を効果的に伝えることができますまた大容量の異種データが持つ意味を汲み取ることもできます

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒4 モバイルBIが主流流に

813

bull  最先端の企業にとってモバイル ビジネスインテリジェンス は主流流となり 特別な場合のみに使用するものではなくなっていますbull  ビジネス ユーザーはオフィスだけではなく日常業務の流流れでどんな時でも情報にアクセスする必要性に 迫られています

最先端の企業にとってモバイル ビジネス インテリジェンスは主流となり 特別なときに使用するものではなくなっていますビジネス ユーザーはオフィスだけではなく日常業務の流れでどんな時でも情報にアクセスする必要性に迫られています

事例についてはホワイトペーパー「How Mobile Business Intelligence Drives Efficiency and Transformation for Supervalue (モバイル ビジネス インテリジェンスが Supervalue の効率と変革を促進)」をご覧ください

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒5 データストアの急増

913

bull  その昔組織には様々ななタイプのデータがありましたbull  CRMデータ販売時点データ電子メールなど組織の経営

陣は多大な努力力を払いすべてのデータを1つの自社の高速なデータウェアハウスに保存していました

bull  2014年年にはこれがおとぎ話となりますすべてのデータはFluentd ベースの Treasure Agent を通じて一元的に収集管理理できまたトレジャーストレージはあらゆるデータの共存を容易易に実現しています

bull  トレジャーを初めとするデータや作業負荷に適したデータストアは解決すべき問題ではなく優れた IT 組織の特徴の 1 つとなります データ ストアの急増その昔組織にはさまざまなタイプのデータがありましたCRM データ販売時点データ電子メールなど組織の経営陣は多大な努力を払いすべてのデータを 1 つの高速なデータ ウェアハウスに保存していました

2013 年にはこれがおとぎ話となりますすべてのデータを 1 か所に保管する組織はもはや存在しませんさらに1 か所に保管する理由もなくなります大量のデータは Teradata や Hadoop などの場所に保管できます取引データは Oracle や SQL Server に保管できますデータや作業負荷に適したデータ ストアは解決すべき問題ではなく優れた IT 組織の特徴の 1 つとなります

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒6 自立性が新しいセルフサービスに

1013

bull  セルフ サービス BI はビジネス ユーザーがより優れた決定を行行うために必要なデータを分析できるようにするという考え方です

bull  自立立性はこの概念念の時代の到来ですこれはndash  ビジネス ユーザーが適切切なデータにアクセスできること

ndash  そのデータが 使用可能な形式と場所にあること

ndash  またビジネス ユーザーにセルフサービス分析が可能なソリューションがあること

を意味します

bull  これらすべてが実現できればビジネス ユーザーはビジネス上の問題に自分で対応できIT は安全なデータとそれにア クセスするためのソリューションの提供に集中することができます

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒7 コラボレーションは機能でなく現実に

1113

bull  ビジネスインテリジェンスソリューションではよくコラボレーション機能が盛んに宣伝されてきましたが2014年年にはそれだけでは十分でなくなります

bull  コラボレーションはビジネス インテリジェンスの導入の本質でなければなりません

bull  ビジネ スに関する質問のやり取りといった共有体験なくしてビジネスインテリジェンスは存在し得ないためです

bull  2014 年年には企業は問題の理理解と解決に向けた共同作業に組織全体の人を関与させるための方法を追求するようになります

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

1213

a  Tableau Desktopb  Tableau Readerc  Tableau Serverd  Tableau Public

Copyright copy2014 Treasure Data All Rights Reserved

2 ビジネスが抱える課題

1  上層部から分析を要求されているndash  幹部チームからもっとデータ主導型企業になるよう要求されているけれども具体的な施策が見つからない

2  大量量のレポートの要求を受け続けているndash  終わらないまま毎日増え続けるリストにうんざりしお手上げ状態である

ndash  優秀な分析チームも最善を尽くし少なくともリクエストに優先順位を付けて作業することは可能ですがその場合は優先度度の高いものだけが処理理されその他のものは手つかずに終わる可能性があります

3  レポートを提出することでさらに必要なレポートが増えていくndash  レポートの作成前に必要な内容をすべて確認したにもかかわらずフォローアップの質問は途切切れることがありません

ndash  あなたのレポート内容に人々が惹きつけられたということでもありますがその後の度度重なる質問に回答するため再度度チーム内に聞いて回っていては 非効率率率的です

4  データが古いことにフラストレーションを感じているndash  レポートを要求しレポートを待ちそのレポートに 関する質問を投げかけるというサイクルで避けられない問題の 1

つにデータが最新でなくなるという点があります

ndash  ビジネスにおいてもプライベートにおいても現代の世界では「すぐに満足感を得たい」という風潮がありますこのように待ち時間が多くてはその期待には応えられません

1313

Copyright copy2014 Treasure Data All Rights Reserved

2 ビジネスが抱える課題5  マッシュアップしたデータを要求される

ndash  実際に「マッシュアップ」という単語が使われていないかもしれませんが「サードパーティのデータも追加してくれないか」 「Excel ファイルに大量量のデータがあるがそれがこれとどう関係しているのかが見見たい」など要求されていませんか

ndash  複数のデータソースを組み合わせることの有用性は分かっていても一元管理理された BI チームでこのような調整を行行うのは容易易ではありません

6  視覚的分析を求めているndash  人間は行行や列列表を見見 る よりも分かりやすい視覚的な形でデータを見見た方が多くの情報を認識識できます

ndash  まだ視覚的データを要求されてい なくても近いうちに要求されるようになるはずです

ndash  それ がセルフサービスBIとどう関係するのかデータを様々な形で見見ることができれば疑問に対する新たな視点を求められることがなくなります

7  すでに一部で使用しているndash  全てに当てはまるわけではありませんが多くの企業がすでにセルフサービスBIを独自に採用しています

ndash  才覚のあるビジネスリーダーはチームの処理理能力力の限界を把握し彼らが非常に優秀で優れたプロジェクトを運営できることを認識識しています

ndash  その結果独自のセルフサービスBIを採用するケースが多く見見られます

ndash  ITリーダーにとって希望の兆しとなるのはその導入によってすばらしい結果が生み出されることでセルフサービス BI の取り組みをサポートする支援者を 得られるという点です

1413

Copyright copy2014 Treasure Data All Rights Reserved

2 回避したい7つの間違い1  複雑すぎるスタート

ndash  野心的になりすぎてすべてのビジネス課題を網羅羅する詳細すぎるリアルタイムのダッシュボードを作成しユーザーにたくさんの詳細オプションを提供することは簡単です

ndash  「完璧」なダッシュボードを作成するために何週間も何ヶ月も時間を費やさないでくださいその代わり試作品とテスト調整の短いサイクルで作業します

2  誰も理理解できない指標を使用するndash  あなたにとってつじつまが合う指標の表示方法やラベル付け方法は他の人にとってもそうでしょうか

ndash  あなたは指標を熟知しているので別のものと検証するステップはいらないかもしれません

ndash  指標がダッシュボードの目標をサポートするだけ でなく閲覧者が理理解できるようにする必要があります

3  重要でないグラフィックや分かりにくいウィジェットで乱雑なダッシュボードにするndash  ゲージのようなグラフィックやウィジェットでダッシュボードを派手にデザインしすぎないようにします

ndash  こうしたものは見見た目は良良いですが迅速かつ簡単に閲覧者に知らせるというダッシュボードの目的が妨げられる場合がありますダッシュボードは見見た目をシンプルに抑えてください

4  複雑なテクノロジーや大きなビジネス インテリジェンス展開プロジェクトを待つndash  従来のビジネス インテリジェンス (BI) の実装は最初の予測よりも長くかかる場合があります従来の BI プロジェクト

が実現するまで待つと何ヶ月も何年年も遅れる場合がありますすぐにダッシュボードを構築して配布できるアプリケーションを使用してください

1513

Copyright copy2014 Treasure Data All Rights Reserved

2 回避したい7つの間違い

5  ダッシュボードの作成と維持のための時間とリソースを過小評価するndash  ダッシュボードの展開は1回で終わる作業ではありません

ndash  指標に関連性がありデータが最新であるかを閲覧者と確認 することを怠ると誰も使用しなくなります定期的にダッシュボードの実用性を確認してください

6  指標と目標が一致しないndash  ダッシュボードは大きな目標に接続するとより強力力になります部署内の主な指標が組織全体としての成功に反映しない

ダッシュボードを作成してしまうことのないようにします

7  効果的でないデザインの悪いグラフやチャートを使うndash  グラフやチャートをデザインする際は気をつける必要があります

ndash  たとえば3D チャートで閲覧者の理理解が増すことはありません派手な色が解釈の邪魔になることもあります円グラフは値が6つ以上ある場合は特に効果的とは言えません

ndash  優れたビジュアライゼーションのデザインは「6 Tableau Best Practice」を参照してください

1613

Copyright copy2014 Treasure Data All Rights Reserved

2 Tableauの特徴

1713

p4

ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI 二分に満たしていたためです 4700 人以上の従業員用に

同院では Tableau の超高速処理ビジネス インテリジェンス ソリューションを組織全体 (病院研究施設財団法人) に導入しました

特定の人が適切な時間管理のために病院内にいる必要はありません誰もが時間管理を改善したいと考えていますビジネス ユーザーにも IT 部門にも時間節約のニーズがあります超高速処理 BI を導入すれば大規模な BI プロジェクトでも長引くことはなくなりますビジネス ユーザーが実際に使用できる成果物を得られるまで数か月場合によっては数年かかるような事態に陥ることはなくなりますまたExcel でのレポート作成と共有という不便な環境を強いられることもなくなります

次のいずれかの質問に当てはまる場合既存の BI システムは想定された速度で機能していない bull ビジネス インテリジェンス ソリューションの導入または変更に数週間から数か月かかりますか

bull レポートやダッシュボードの作成または変更に IT 部門への依頼が必要でありIT 部門による対応待ちや未処理の状態になったりしますか

bull BI ソリューションでは新しいユーザーが初めてダッシュボードまたはレポートを作成してパブリッシュできるようになるまでトレーニングに数日または数週間かかりますか

bull BI ソリューションは綿密なスケジュールやシステムの

パフォーマンス低下の場合の回避策に依存していますか

bull 企業のデータ ウェアハウスや高速データベースに多額の投資を行っていてもBI ソリューションによりデータの複製が必要になりますか

bull BI ソリューションでは統合前の特殊な作業を行わないとデータにアクセスできませんか

bull リレーショナル データベース以外に保存されている生データや非構造化データを含め複数のソースからのデータをブレンドできることに制約はありませんか

これまでのビジネス インテリジェンス ソフトウェアは導入に時間がかかります購入に数か月実装に数か月以上かかりますユーザーのトレーニングには数週間かかり高いコストもかかります開発者はビジネス ユーザーに要望を聞きその結果を持ち帰ってレポートを作成します変更の反映には何度かの確認とやり直しを経て数週間かかります2 つのデータ ソースを組み合わせるためにITはそれらの両方を収容する新しいデータ リポジトリを構築する必要がありますその後開発者は再びレポート作成のプログラミングに取り組みますこれでは導入プロセス全体が大幅に停滞しているように感じられます

超高速処理ビジネス インテリジェンスの場合と比べてみましょうこの場合まずトライアル版ソフトウェアをダウンロードしてインストールしますスプレッドシートやリレーショナル データベースからキューブHadoop などに至るまであらゆる種類のデータにアクセスしますこの操作はワンクリックで可能です高速データ ストアにライブ接続するか抽出データを高速データ エンジンにインポートするかを選

図 1 データ ワークフローのあらゆる段階で高速化

これまでのビジネス インテリジェンスと比べて超高速処理分析ではソフトウェアのインストールからデータへのアクセス複雑な情報の

分析インタラクティブなダッシュボードのパブリッシュ組織全体での共有に至るまでワークフローのあらゆる段階でその処理速度は

10 ~ 100 倍高速です

Install Access Analyze Publish Share

10 X 100 TIMES FASTER

p14

ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI

Tableau 超高速処理ビジネス インテリジェンスの背景テクノロジー超高速処理ビジネス インテリジェンスを文字どおり超高速にしている要因は何でしょうかそれは VizQLtrade ですTableau のこの特許取得済みのクエリ言語により簡単なドラッグ アンド ドロップ操作であらゆる規模トピック形式のデータを視覚化できますVizQL はユーザーによる操作をデータベース クエリに変換した後その応答をグラフィカルに表現しますその結果新しいデータベースおよびスプレッドシートのまったく新しい操作方法が生まれました視覚化計算がサポートされているためインタラクティブな質問と回答を通じてデータのさまざまなビューを繰り返し生成することができます

VizQL に続く超高速処理ビジネス インテリジェンスの次の画期的なテクノロジーはTableau のダイレクト接続 amp クエリ機能を使用して既存のデータベースに高速にアクセスして活用できるというものでしたビッグデータを含めほぼすべてのデータ ソースに対して最適化されたコネクタを使用することでTableau では専門知識を必要とせずにライブ データ ソースへのクエリと接続が可能です

ldquoTableau を使用して昨年度は収益が 2 増加しましたこれは 2 億米ドルに相当します航空または運送業界で収益を挙げたいと考えるならばTableau の使用をお勧めしますrdquo

China Eastern Airlines 社ネットワーキングおよび収益部門上級管理

者James Pu 氏

しかしTableau の進化はまだ続きますライブ データ ソースに接続できないときや接続したくないときのためにTableau にはビルトイン データ エンジンを使用して数百万行のデータのアド ホック分析を数秒で実行できる機能が用意されていますTableau のビルトイン データ エンジンは膨大なデータの高速処理が可能であるためビュー間を簡単に切り替えて意味のある傾向や外れ値を検出できますデータ エンジンは PC 上で動作する高性能のインメモリ分析データベースですデータ エンジンにより低速のデータ ソースを高速化できますさらにその速度を活か

して高速のデータ ストアに直接接続することもできますもちろんこれらの 2 つのデータ アクセス方式 (ライブ接続とインメモリ) の間には完全な互換性がありますアクセス方式がライブ接続かインメモリかにかかわらず複数のデータ ソースをブレンドし組み合わせることができます

Databases Cubes Spreadsheets Hadoop amp More

In-Memory Data Live Connection

PC Browser iPad AndroidDesktop

図 10 Tableau アーキテクチャTableau のアーキテクチャには膨大なデータ ソースに対応する

ためにインメモリとライブ接続という 2 つの方法が用意されて

います

最後に 結論企業や公共機関がビジネス インテリジェンスに求めるものには大きな変化が生じていますこれまでの BI の処理は低速で膨大なリソースが必要ですたとえばSeattle Childrenrsquos Hospital に家族が病気の子供を 連れて行くとしましょう家族は一刻も早く子供を診察してもらいたいと思うでしょう速度の重要性は病院に限られることではありません競争の激しい市場では企業は販売促進やコスト削減のために数か月も待つことはできませんたとえばM Financial Group 社は競合他社より勝るペースで北米で最も認知度と評価度の高い保険ブランドの 2000 万米ドルを超える有標製品を発売しましたTableau を使用して私は膨大なデータ セットをドリルダウンしすぐにリレーシ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

uarr 導入から分析共有までのサイクルが10〜~100倍速いです larrあらゆるデータソース(インプット)あらゆる端末(アウトプット)をTableauが繋ぎます darrTableau Desktop で作成したレポートをすぐにパブリックにできます

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒a Tableau Desktop

bull  考える速さで分析するndash  データに接続しコードを1行行も書かずにクエリを実行行できます

ndash  ドラッグアンドドロップを使用したビュー間の直感に沿った移動が可能ですndash  ペタバイト単位または何十億行行ものデータを測定するかどうかに関わらずTableau は可能な限り高速に動作するように構築さ

れています

ndash  Windows Macemsp 両対応(ver 82)

ndash  Tablesu Desktop のインプットソースとして無尽蔵の Treasure ストレージを選択可能ビッグデータをマウスでアドホックに扱えます

1813

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒b Tableau Reader

bull  Tableau Reader はTableau Desktopで作成したビジュアライゼーションを開いて表示できる無料料のデスクトップアプリケーションです

bull  Tableau Reader ではデータを含むTableau Desktopで作成したビジュアライゼーションを開いて操作可能です

bull  作成者の許可の範囲内であればデータをフィルタードリルダウン表示が可能です

bull  作成者によって組み込まれていない場合は操作を編集したり実行行したりすることは不不可能です

bull  Window Mac 両対応

1913

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒c Tableau Server

bull  作成したダッシュボードをWEBアプリ化する事でどこからでもどのデバイスでも分析出来るようになります

bull  データソースへの接続を Tableau Server に集約することによりデータの共有データマートとしての利利用が可能になります

2013

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒d Tableau Public

bull  導入利利用は無料料です

bull  接続出来るデータの種類に制限されます

bull  EXCELテキスト等接続データソースに制限です

bull  利利用出来る行行数データサイズに(100万行行1GB)制約があります

bull  一般公開を前提としたサービスです

2113

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

2213

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2313

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2413

ディメンションbull  定性的な情報やカテゴリ情報を含むフィール

ドを『ディメンション』として扱います

bull  テキストや日付の値を持つフィールドもこれらに含まれます

bull  行行または列列の棚にドラッグドロップをする事でヘッダを生成します

メジャーbull  行行または列列の棚にドラッグドロップを行行う

と『軸』を生成します

bull  デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2513

フィルタ

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2613

マーク gt カラー

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2713

マーク gt サイズ マーク gt ラベル

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  テキストテーブル(text tables)b  ヒートマップ(heat maps)c  ハイライトテーブル(highlight tables)d  記号マップ(symbol maps)e  色塗りマップ(filled maps)f  円グラフ(pie charts)g  水平棒グラフ(horizontal bars)h  積み上げ棒グラフ(stacked bars)i  並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j  ツリーマップ(tree maps)k  円ビュー(circle views)l  並列列円(side-‐‑‒by-‐‑‒side circles)

2813

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  線グラフ連続(lines continuous)b  線グラフ不不連続(lines discrete)c  二重線(dual lines)d  エリアチャート連続(area charts continuous)e  エリアチャート不不連続(area charts discrete)f  2つの組み合わせ(dual combination)g  散布図(scatter plots)h  ヒストグラム(histgram)i  箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j  ガントビュー(gantt view)k  ブレットグラフ(bullet graphs)l  パックバブル(packed bubbles)

2913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒1 Show Me gt 棒グラフ

bull  ひと目で最高値と最低値を見見ることができます

bull  棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます

bull  例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較

bull  応用例例ndash  1つのダッシュボードに複数の棒グラフを使用多数のス

プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります

ndash  棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます

ndash  積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です

ndash  棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます

ndash  バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります

3013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒2 Show Me gt 折れ線グラフ

bull  折れ線グラフは個々の数値データ ポイントを「線」で結びます

bull  それにより値の連続性をわかりやすく視覚化することが可能です

bull  主に一定期間にわたる傾向を表す際に使用します

bull  応用例例ndash  折れ線グラフと棒グラフを組み併せ特定の株価の1日あ

たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます

ndash  線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます

3113

7HFKHDGVampDSLWDO5DLVHGLQ

Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1

$0

$5000

$10000

$15000

$20000

$25000

$30000

$35000

Run

ning

Sum

of O

ffer A

mou

nt (i

n m

il)

7HFKQRORJ

(QHUJ

+HDOWKampDUH

ampRQVXPHU

XVLQHVV6HUYLFHV5HDO(VWDWH

6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV

ampOLFNKHUHWRFOHDUILOWHU

5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒3 Show Me gt 円グラフ

bull  円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです

bull  円グラフは最も誤用されやすいグラフです

bull  データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします

bull  円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように

bull  例例比率率率を表す

bull  応用例ndash  円の扇形を6つまでに制限します比率率率が6つ以上ある場

合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります

ndash  円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします

3213

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒4 Show Me gt マップ

bull  郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります

bull  例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域

bull  応用例例ndash  マップを他の種類のチャートグラフ表のフィルターと

して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます

ndash  マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます

3313

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒5 Show Me gt 散布図

bull  一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます

bull  例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料

bull  応用例 ndash  傾向線最良良適合線を追加します データの相関性に傾向

線を追加すると結果がより明瞭になります

ndash  フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます

ndash  情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります

3413

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒6 Show Me gt ガントチャート

bull  ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です

bull  プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます

bull  応用例ndash  色を追加するガント チャート内のバーの色を変えるこ

とで変数の重要側面をすばやく 伝えることができますndash  マップや他の種類のチャートをガントチャートと組み合わ

せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます

3513

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒7 Show Me gt バブルチャート

bull  バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください

bull  様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す

bull  例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率

bull  応用例ndash  散布図のデータを強調する 各データ ポイントのサイズ

や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます

ndash  マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります

3613

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒8 Show Me gt ヒストグラムbull  ヒストグラムはグループ間でのデータの分散を表示

する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです

bull  データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます

bull  データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます

bull  例例ndash  データのグループ化をテストする データに合ったグ

ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます

ndash  フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります

3713

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒9 Show Me gt ブレットグラフbull  目標がある場合その目標までの進行行状況を追跡するにはブレッ

トグラフが適しています

bull  本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです

bull  ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します

bull  ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)

bull  例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)

bull  応用例例ndash  色を使用して達成のしきい値を示すプライマリメジャーの背景に赤

黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます

ndash  概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます

3813

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒10 Show Me gt ヒートマップ

bull  ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます

bull  例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード

bull  応用例ndash  四角形のサイズを変えますヒート マップでは四角形

のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます

ndash  四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります

3913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒11 Show Me gt ハイライト表

bull  ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます

bull  例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口

bull  応用例例ndash  ハイライト表を他の種類のチャートと組み合わせる たと

えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります

4013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 5: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒1 誰もがデータサイエンスを武器にできる時代に

513

bull  データサイエンスは専門家だけでなく一般のビジネスマンが扱うものになりつつありますbull  データ分析に関する知識識は肩書きに「アナリスト」が付くような専門家だけではなく一般のビ ジネスマンにも必要な知識識になり

始めていますデータに基づいて決定を行行う企業が競争力力を高めデータを活用しない企業が競争力力を弱めています詳細はThe Economist の「Fostering a Data-Driven Culture (データ主導型の文化を育成)」 をご覧ください

データサイエンティストの消滅 データサイエンスは専門家だけでなく一般のビジネスマンが扱うものになりつつありますデータ分析に関する知識は肩書きに「アナリスト」が付くような専門家だけではなく一般のビジネスマンにも必要な知識になり始めていますデータに基づいて決定を行う企業が競争力を高めデータを活用しない企業が競争力を弱めています

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒2 ビッグデータBI は共にクラウドへ

613

bull  データ分析の導入を速めたい企業はクラウドベースのビジネスインテリジェンスの採用を推進していますbull  顧客との連携やモバイルアクセスなどの新たなシナリオもクラウドビジネスインテリジェンスの導入を加速しています

bull  Treasure Data のクラウド データ ウェアハウスにより数カ月かかるデータウェアハウスの構築を数日で実現することができます

bull  これによりラピッド プロトタイピングが可能になり以前とは比較にならない柔軟性をもたらします

詳細はホワイトペーパー「Business Analytics in the Cloud (クラウドのビジネス分析)」をご覧ください

クラウド ビジネス インテリジェンスが主流になる データ分析の導入を速めたい企業はクラウド ベースのビジネス インテリジェンスの採用を推進しています顧客との連携やファイアウォール外のモバイル アクセスなどの新たなシナリオもクラウド ビジネス インテリジェンスの導入を加速していますまたクラウド サービスが成熟することで IT 部門によるビジネス インテリジェンスのクラウド化への懸念が弱まっています

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒3 ストーリーテリングの重要性

713

bull  人々はコンテクストのないダッシュボードが増えても役立立たないことを理理解してきましたbull  ストーリーテリングではデータを利利用してアイデアや洞洞察を効果的に伝えることができます

bull  また大容量量の異異種データが持つ意味を汲み取ることもできます詳細はホワイトペーパー「5 Best Practices for Telling Great Stories (優れたストリーを伝える 5 つのベスト プラクティス)」をご覧ください

ストリーテリングの重要性 人々はコンテクストのないダッシュボードが増えても役立たないことを理解してきましたストリーテリングではデータを利用してアイデアや洞察を効果的に伝えることができますまた大容量の異種データが持つ意味を汲み取ることもできます

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒4 モバイルBIが主流流に

813

bull  最先端の企業にとってモバイル ビジネスインテリジェンス は主流流となり 特別な場合のみに使用するものではなくなっていますbull  ビジネス ユーザーはオフィスだけではなく日常業務の流流れでどんな時でも情報にアクセスする必要性に 迫られています

最先端の企業にとってモバイル ビジネス インテリジェンスは主流となり 特別なときに使用するものではなくなっていますビジネス ユーザーはオフィスだけではなく日常業務の流れでどんな時でも情報にアクセスする必要性に迫られています

事例についてはホワイトペーパー「How Mobile Business Intelligence Drives Efficiency and Transformation for Supervalue (モバイル ビジネス インテリジェンスが Supervalue の効率と変革を促進)」をご覧ください

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒5 データストアの急増

913

bull  その昔組織には様々ななタイプのデータがありましたbull  CRMデータ販売時点データ電子メールなど組織の経営

陣は多大な努力力を払いすべてのデータを1つの自社の高速なデータウェアハウスに保存していました

bull  2014年年にはこれがおとぎ話となりますすべてのデータはFluentd ベースの Treasure Agent を通じて一元的に収集管理理できまたトレジャーストレージはあらゆるデータの共存を容易易に実現しています

bull  トレジャーを初めとするデータや作業負荷に適したデータストアは解決すべき問題ではなく優れた IT 組織の特徴の 1 つとなります データ ストアの急増その昔組織にはさまざまなタイプのデータがありましたCRM データ販売時点データ電子メールなど組織の経営陣は多大な努力を払いすべてのデータを 1 つの高速なデータ ウェアハウスに保存していました

2013 年にはこれがおとぎ話となりますすべてのデータを 1 か所に保管する組織はもはや存在しませんさらに1 か所に保管する理由もなくなります大量のデータは Teradata や Hadoop などの場所に保管できます取引データは Oracle や SQL Server に保管できますデータや作業負荷に適したデータ ストアは解決すべき問題ではなく優れた IT 組織の特徴の 1 つとなります

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒6 自立性が新しいセルフサービスに

1013

bull  セルフ サービス BI はビジネス ユーザーがより優れた決定を行行うために必要なデータを分析できるようにするという考え方です

bull  自立立性はこの概念念の時代の到来ですこれはndash  ビジネス ユーザーが適切切なデータにアクセスできること

ndash  そのデータが 使用可能な形式と場所にあること

ndash  またビジネス ユーザーにセルフサービス分析が可能なソリューションがあること

を意味します

bull  これらすべてが実現できればビジネス ユーザーはビジネス上の問題に自分で対応できIT は安全なデータとそれにア クセスするためのソリューションの提供に集中することができます

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒7 コラボレーションは機能でなく現実に

1113

bull  ビジネスインテリジェンスソリューションではよくコラボレーション機能が盛んに宣伝されてきましたが2014年年にはそれだけでは十分でなくなります

bull  コラボレーションはビジネス インテリジェンスの導入の本質でなければなりません

bull  ビジネ スに関する質問のやり取りといった共有体験なくしてビジネスインテリジェンスは存在し得ないためです

bull  2014 年年には企業は問題の理理解と解決に向けた共同作業に組織全体の人を関与させるための方法を追求するようになります

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

1213

a  Tableau Desktopb  Tableau Readerc  Tableau Serverd  Tableau Public

Copyright copy2014 Treasure Data All Rights Reserved

2 ビジネスが抱える課題

1  上層部から分析を要求されているndash  幹部チームからもっとデータ主導型企業になるよう要求されているけれども具体的な施策が見つからない

2  大量量のレポートの要求を受け続けているndash  終わらないまま毎日増え続けるリストにうんざりしお手上げ状態である

ndash  優秀な分析チームも最善を尽くし少なくともリクエストに優先順位を付けて作業することは可能ですがその場合は優先度度の高いものだけが処理理されその他のものは手つかずに終わる可能性があります

3  レポートを提出することでさらに必要なレポートが増えていくndash  レポートの作成前に必要な内容をすべて確認したにもかかわらずフォローアップの質問は途切切れることがありません

ndash  あなたのレポート内容に人々が惹きつけられたということでもありますがその後の度度重なる質問に回答するため再度度チーム内に聞いて回っていては 非効率率率的です

4  データが古いことにフラストレーションを感じているndash  レポートを要求しレポートを待ちそのレポートに 関する質問を投げかけるというサイクルで避けられない問題の 1

つにデータが最新でなくなるという点があります

ndash  ビジネスにおいてもプライベートにおいても現代の世界では「すぐに満足感を得たい」という風潮がありますこのように待ち時間が多くてはその期待には応えられません

1313

Copyright copy2014 Treasure Data All Rights Reserved

2 ビジネスが抱える課題5  マッシュアップしたデータを要求される

ndash  実際に「マッシュアップ」という単語が使われていないかもしれませんが「サードパーティのデータも追加してくれないか」 「Excel ファイルに大量量のデータがあるがそれがこれとどう関係しているのかが見見たい」など要求されていませんか

ndash  複数のデータソースを組み合わせることの有用性は分かっていても一元管理理された BI チームでこのような調整を行行うのは容易易ではありません

6  視覚的分析を求めているndash  人間は行行や列列表を見見 る よりも分かりやすい視覚的な形でデータを見見た方が多くの情報を認識識できます

ndash  まだ視覚的データを要求されてい なくても近いうちに要求されるようになるはずです

ndash  それ がセルフサービスBIとどう関係するのかデータを様々な形で見見ることができれば疑問に対する新たな視点を求められることがなくなります

7  すでに一部で使用しているndash  全てに当てはまるわけではありませんが多くの企業がすでにセルフサービスBIを独自に採用しています

ndash  才覚のあるビジネスリーダーはチームの処理理能力力の限界を把握し彼らが非常に優秀で優れたプロジェクトを運営できることを認識識しています

ndash  その結果独自のセルフサービスBIを採用するケースが多く見見られます

ndash  ITリーダーにとって希望の兆しとなるのはその導入によってすばらしい結果が生み出されることでセルフサービス BI の取り組みをサポートする支援者を 得られるという点です

1413

Copyright copy2014 Treasure Data All Rights Reserved

2 回避したい7つの間違い1  複雑すぎるスタート

ndash  野心的になりすぎてすべてのビジネス課題を網羅羅する詳細すぎるリアルタイムのダッシュボードを作成しユーザーにたくさんの詳細オプションを提供することは簡単です

ndash  「完璧」なダッシュボードを作成するために何週間も何ヶ月も時間を費やさないでくださいその代わり試作品とテスト調整の短いサイクルで作業します

2  誰も理理解できない指標を使用するndash  あなたにとってつじつまが合う指標の表示方法やラベル付け方法は他の人にとってもそうでしょうか

ndash  あなたは指標を熟知しているので別のものと検証するステップはいらないかもしれません

ndash  指標がダッシュボードの目標をサポートするだけ でなく閲覧者が理理解できるようにする必要があります

3  重要でないグラフィックや分かりにくいウィジェットで乱雑なダッシュボードにするndash  ゲージのようなグラフィックやウィジェットでダッシュボードを派手にデザインしすぎないようにします

ndash  こうしたものは見見た目は良良いですが迅速かつ簡単に閲覧者に知らせるというダッシュボードの目的が妨げられる場合がありますダッシュボードは見見た目をシンプルに抑えてください

4  複雑なテクノロジーや大きなビジネス インテリジェンス展開プロジェクトを待つndash  従来のビジネス インテリジェンス (BI) の実装は最初の予測よりも長くかかる場合があります従来の BI プロジェクト

が実現するまで待つと何ヶ月も何年年も遅れる場合がありますすぐにダッシュボードを構築して配布できるアプリケーションを使用してください

1513

Copyright copy2014 Treasure Data All Rights Reserved

2 回避したい7つの間違い

5  ダッシュボードの作成と維持のための時間とリソースを過小評価するndash  ダッシュボードの展開は1回で終わる作業ではありません

ndash  指標に関連性がありデータが最新であるかを閲覧者と確認 することを怠ると誰も使用しなくなります定期的にダッシュボードの実用性を確認してください

6  指標と目標が一致しないndash  ダッシュボードは大きな目標に接続するとより強力力になります部署内の主な指標が組織全体としての成功に反映しない

ダッシュボードを作成してしまうことのないようにします

7  効果的でないデザインの悪いグラフやチャートを使うndash  グラフやチャートをデザインする際は気をつける必要があります

ndash  たとえば3D チャートで閲覧者の理理解が増すことはありません派手な色が解釈の邪魔になることもあります円グラフは値が6つ以上ある場合は特に効果的とは言えません

ndash  優れたビジュアライゼーションのデザインは「6 Tableau Best Practice」を参照してください

1613

Copyright copy2014 Treasure Data All Rights Reserved

2 Tableauの特徴

1713

p4

ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI 二分に満たしていたためです 4700 人以上の従業員用に

同院では Tableau の超高速処理ビジネス インテリジェンス ソリューションを組織全体 (病院研究施設財団法人) に導入しました

特定の人が適切な時間管理のために病院内にいる必要はありません誰もが時間管理を改善したいと考えていますビジネス ユーザーにも IT 部門にも時間節約のニーズがあります超高速処理 BI を導入すれば大規模な BI プロジェクトでも長引くことはなくなりますビジネス ユーザーが実際に使用できる成果物を得られるまで数か月場合によっては数年かかるような事態に陥ることはなくなりますまたExcel でのレポート作成と共有という不便な環境を強いられることもなくなります

次のいずれかの質問に当てはまる場合既存の BI システムは想定された速度で機能していない bull ビジネス インテリジェンス ソリューションの導入または変更に数週間から数か月かかりますか

bull レポートやダッシュボードの作成または変更に IT 部門への依頼が必要でありIT 部門による対応待ちや未処理の状態になったりしますか

bull BI ソリューションでは新しいユーザーが初めてダッシュボードまたはレポートを作成してパブリッシュできるようになるまでトレーニングに数日または数週間かかりますか

bull BI ソリューションは綿密なスケジュールやシステムの

パフォーマンス低下の場合の回避策に依存していますか

bull 企業のデータ ウェアハウスや高速データベースに多額の投資を行っていてもBI ソリューションによりデータの複製が必要になりますか

bull BI ソリューションでは統合前の特殊な作業を行わないとデータにアクセスできませんか

bull リレーショナル データベース以外に保存されている生データや非構造化データを含め複数のソースからのデータをブレンドできることに制約はありませんか

これまでのビジネス インテリジェンス ソフトウェアは導入に時間がかかります購入に数か月実装に数か月以上かかりますユーザーのトレーニングには数週間かかり高いコストもかかります開発者はビジネス ユーザーに要望を聞きその結果を持ち帰ってレポートを作成します変更の反映には何度かの確認とやり直しを経て数週間かかります2 つのデータ ソースを組み合わせるためにITはそれらの両方を収容する新しいデータ リポジトリを構築する必要がありますその後開発者は再びレポート作成のプログラミングに取り組みますこれでは導入プロセス全体が大幅に停滞しているように感じられます

超高速処理ビジネス インテリジェンスの場合と比べてみましょうこの場合まずトライアル版ソフトウェアをダウンロードしてインストールしますスプレッドシートやリレーショナル データベースからキューブHadoop などに至るまであらゆる種類のデータにアクセスしますこの操作はワンクリックで可能です高速データ ストアにライブ接続するか抽出データを高速データ エンジンにインポートするかを選

図 1 データ ワークフローのあらゆる段階で高速化

これまでのビジネス インテリジェンスと比べて超高速処理分析ではソフトウェアのインストールからデータへのアクセス複雑な情報の

分析インタラクティブなダッシュボードのパブリッシュ組織全体での共有に至るまでワークフローのあらゆる段階でその処理速度は

10 ~ 100 倍高速です

Install Access Analyze Publish Share

10 X 100 TIMES FASTER

p14

ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI

Tableau 超高速処理ビジネス インテリジェンスの背景テクノロジー超高速処理ビジネス インテリジェンスを文字どおり超高速にしている要因は何でしょうかそれは VizQLtrade ですTableau のこの特許取得済みのクエリ言語により簡単なドラッグ アンド ドロップ操作であらゆる規模トピック形式のデータを視覚化できますVizQL はユーザーによる操作をデータベース クエリに変換した後その応答をグラフィカルに表現しますその結果新しいデータベースおよびスプレッドシートのまったく新しい操作方法が生まれました視覚化計算がサポートされているためインタラクティブな質問と回答を通じてデータのさまざまなビューを繰り返し生成することができます

VizQL に続く超高速処理ビジネス インテリジェンスの次の画期的なテクノロジーはTableau のダイレクト接続 amp クエリ機能を使用して既存のデータベースに高速にアクセスして活用できるというものでしたビッグデータを含めほぼすべてのデータ ソースに対して最適化されたコネクタを使用することでTableau では専門知識を必要とせずにライブ データ ソースへのクエリと接続が可能です

ldquoTableau を使用して昨年度は収益が 2 増加しましたこれは 2 億米ドルに相当します航空または運送業界で収益を挙げたいと考えるならばTableau の使用をお勧めしますrdquo

China Eastern Airlines 社ネットワーキングおよび収益部門上級管理

者James Pu 氏

しかしTableau の進化はまだ続きますライブ データ ソースに接続できないときや接続したくないときのためにTableau にはビルトイン データ エンジンを使用して数百万行のデータのアド ホック分析を数秒で実行できる機能が用意されていますTableau のビルトイン データ エンジンは膨大なデータの高速処理が可能であるためビュー間を簡単に切り替えて意味のある傾向や外れ値を検出できますデータ エンジンは PC 上で動作する高性能のインメモリ分析データベースですデータ エンジンにより低速のデータ ソースを高速化できますさらにその速度を活か

して高速のデータ ストアに直接接続することもできますもちろんこれらの 2 つのデータ アクセス方式 (ライブ接続とインメモリ) の間には完全な互換性がありますアクセス方式がライブ接続かインメモリかにかかわらず複数のデータ ソースをブレンドし組み合わせることができます

Databases Cubes Spreadsheets Hadoop amp More

In-Memory Data Live Connection

PC Browser iPad AndroidDesktop

図 10 Tableau アーキテクチャTableau のアーキテクチャには膨大なデータ ソースに対応する

ためにインメモリとライブ接続という 2 つの方法が用意されて

います

最後に 結論企業や公共機関がビジネス インテリジェンスに求めるものには大きな変化が生じていますこれまでの BI の処理は低速で膨大なリソースが必要ですたとえばSeattle Childrenrsquos Hospital に家族が病気の子供を 連れて行くとしましょう家族は一刻も早く子供を診察してもらいたいと思うでしょう速度の重要性は病院に限られることではありません競争の激しい市場では企業は販売促進やコスト削減のために数か月も待つことはできませんたとえばM Financial Group 社は競合他社より勝るペースで北米で最も認知度と評価度の高い保険ブランドの 2000 万米ドルを超える有標製品を発売しましたTableau を使用して私は膨大なデータ セットをドリルダウンしすぐにリレーシ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

uarr 導入から分析共有までのサイクルが10〜~100倍速いです larrあらゆるデータソース(インプット)あらゆる端末(アウトプット)をTableauが繋ぎます darrTableau Desktop で作成したレポートをすぐにパブリックにできます

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒a Tableau Desktop

bull  考える速さで分析するndash  データに接続しコードを1行行も書かずにクエリを実行行できます

ndash  ドラッグアンドドロップを使用したビュー間の直感に沿った移動が可能ですndash  ペタバイト単位または何十億行行ものデータを測定するかどうかに関わらずTableau は可能な限り高速に動作するように構築さ

れています

ndash  Windows Macemsp 両対応(ver 82)

ndash  Tablesu Desktop のインプットソースとして無尽蔵の Treasure ストレージを選択可能ビッグデータをマウスでアドホックに扱えます

1813

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒b Tableau Reader

bull  Tableau Reader はTableau Desktopで作成したビジュアライゼーションを開いて表示できる無料料のデスクトップアプリケーションです

bull  Tableau Reader ではデータを含むTableau Desktopで作成したビジュアライゼーションを開いて操作可能です

bull  作成者の許可の範囲内であればデータをフィルタードリルダウン表示が可能です

bull  作成者によって組み込まれていない場合は操作を編集したり実行行したりすることは不不可能です

bull  Window Mac 両対応

1913

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒c Tableau Server

bull  作成したダッシュボードをWEBアプリ化する事でどこからでもどのデバイスでも分析出来るようになります

bull  データソースへの接続を Tableau Server に集約することによりデータの共有データマートとしての利利用が可能になります

2013

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒d Tableau Public

bull  導入利利用は無料料です

bull  接続出来るデータの種類に制限されます

bull  EXCELテキスト等接続データソースに制限です

bull  利利用出来る行行数データサイズに(100万行行1GB)制約があります

bull  一般公開を前提としたサービスです

2113

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

2213

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2313

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2413

ディメンションbull  定性的な情報やカテゴリ情報を含むフィール

ドを『ディメンション』として扱います

bull  テキストや日付の値を持つフィールドもこれらに含まれます

bull  行行または列列の棚にドラッグドロップをする事でヘッダを生成します

メジャーbull  行行または列列の棚にドラッグドロップを行行う

と『軸』を生成します

bull  デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2513

フィルタ

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2613

マーク gt カラー

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2713

マーク gt サイズ マーク gt ラベル

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  テキストテーブル(text tables)b  ヒートマップ(heat maps)c  ハイライトテーブル(highlight tables)d  記号マップ(symbol maps)e  色塗りマップ(filled maps)f  円グラフ(pie charts)g  水平棒グラフ(horizontal bars)h  積み上げ棒グラフ(stacked bars)i  並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j  ツリーマップ(tree maps)k  円ビュー(circle views)l  並列列円(side-‐‑‒by-‐‑‒side circles)

2813

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  線グラフ連続(lines continuous)b  線グラフ不不連続(lines discrete)c  二重線(dual lines)d  エリアチャート連続(area charts continuous)e  エリアチャート不不連続(area charts discrete)f  2つの組み合わせ(dual combination)g  散布図(scatter plots)h  ヒストグラム(histgram)i  箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j  ガントビュー(gantt view)k  ブレットグラフ(bullet graphs)l  パックバブル(packed bubbles)

2913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒1 Show Me gt 棒グラフ

bull  ひと目で最高値と最低値を見見ることができます

bull  棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます

bull  例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較

bull  応用例例ndash  1つのダッシュボードに複数の棒グラフを使用多数のス

プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります

ndash  棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます

ndash  積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です

ndash  棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます

ndash  バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります

3013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒2 Show Me gt 折れ線グラフ

bull  折れ線グラフは個々の数値データ ポイントを「線」で結びます

bull  それにより値の連続性をわかりやすく視覚化することが可能です

bull  主に一定期間にわたる傾向を表す際に使用します

bull  応用例例ndash  折れ線グラフと棒グラフを組み併せ特定の株価の1日あ

たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます

ndash  線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます

3113

7HFKHDGVampDSLWDO5DLVHGLQ

Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1

$0

$5000

$10000

$15000

$20000

$25000

$30000

$35000

Run

ning

Sum

of O

ffer A

mou

nt (i

n m

il)

7HFKQRORJ

(QHUJ

+HDOWKampDUH

ampRQVXPHU

XVLQHVV6HUYLFHV5HDO(VWDWH

6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV

ampOLFNKHUHWRFOHDUILOWHU

5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒3 Show Me gt 円グラフ

bull  円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです

bull  円グラフは最も誤用されやすいグラフです

bull  データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします

bull  円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように

bull  例例比率率率を表す

bull  応用例ndash  円の扇形を6つまでに制限します比率率率が6つ以上ある場

合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります

ndash  円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします

3213

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒4 Show Me gt マップ

bull  郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります

bull  例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域

bull  応用例例ndash  マップを他の種類のチャートグラフ表のフィルターと

して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます

ndash  マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます

3313

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒5 Show Me gt 散布図

bull  一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます

bull  例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料

bull  応用例 ndash  傾向線最良良適合線を追加します データの相関性に傾向

線を追加すると結果がより明瞭になります

ndash  フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます

ndash  情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります

3413

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒6 Show Me gt ガントチャート

bull  ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です

bull  プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます

bull  応用例ndash  色を追加するガント チャート内のバーの色を変えるこ

とで変数の重要側面をすばやく 伝えることができますndash  マップや他の種類のチャートをガントチャートと組み合わ

せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます

3513

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒7 Show Me gt バブルチャート

bull  バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください

bull  様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す

bull  例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率

bull  応用例ndash  散布図のデータを強調する 各データ ポイントのサイズ

や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます

ndash  マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります

3613

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒8 Show Me gt ヒストグラムbull  ヒストグラムはグループ間でのデータの分散を表示

する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです

bull  データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます

bull  データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます

bull  例例ndash  データのグループ化をテストする データに合ったグ

ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます

ndash  フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります

3713

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒9 Show Me gt ブレットグラフbull  目標がある場合その目標までの進行行状況を追跡するにはブレッ

トグラフが適しています

bull  本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです

bull  ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します

bull  ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)

bull  例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)

bull  応用例例ndash  色を使用して達成のしきい値を示すプライマリメジャーの背景に赤

黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます

ndash  概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます

3813

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒10 Show Me gt ヒートマップ

bull  ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます

bull  例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード

bull  応用例ndash  四角形のサイズを変えますヒート マップでは四角形

のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます

ndash  四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります

3913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒11 Show Me gt ハイライト表

bull  ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます

bull  例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口

bull  応用例例ndash  ハイライト表を他の種類のチャートと組み合わせる たと

えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります

4013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 6: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒2 ビッグデータBI は共にクラウドへ

613

bull  データ分析の導入を速めたい企業はクラウドベースのビジネスインテリジェンスの採用を推進していますbull  顧客との連携やモバイルアクセスなどの新たなシナリオもクラウドビジネスインテリジェンスの導入を加速しています

bull  Treasure Data のクラウド データ ウェアハウスにより数カ月かかるデータウェアハウスの構築を数日で実現することができます

bull  これによりラピッド プロトタイピングが可能になり以前とは比較にならない柔軟性をもたらします

詳細はホワイトペーパー「Business Analytics in the Cloud (クラウドのビジネス分析)」をご覧ください

クラウド ビジネス インテリジェンスが主流になる データ分析の導入を速めたい企業はクラウド ベースのビジネス インテリジェンスの採用を推進しています顧客との連携やファイアウォール外のモバイル アクセスなどの新たなシナリオもクラウド ビジネス インテリジェンスの導入を加速していますまたクラウド サービスが成熟することで IT 部門によるビジネス インテリジェンスのクラウド化への懸念が弱まっています

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒3 ストーリーテリングの重要性

713

bull  人々はコンテクストのないダッシュボードが増えても役立立たないことを理理解してきましたbull  ストーリーテリングではデータを利利用してアイデアや洞洞察を効果的に伝えることができます

bull  また大容量量の異異種データが持つ意味を汲み取ることもできます詳細はホワイトペーパー「5 Best Practices for Telling Great Stories (優れたストリーを伝える 5 つのベスト プラクティス)」をご覧ください

ストリーテリングの重要性 人々はコンテクストのないダッシュボードが増えても役立たないことを理解してきましたストリーテリングではデータを利用してアイデアや洞察を効果的に伝えることができますまた大容量の異種データが持つ意味を汲み取ることもできます

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒4 モバイルBIが主流流に

813

bull  最先端の企業にとってモバイル ビジネスインテリジェンス は主流流となり 特別な場合のみに使用するものではなくなっていますbull  ビジネス ユーザーはオフィスだけではなく日常業務の流流れでどんな時でも情報にアクセスする必要性に 迫られています

最先端の企業にとってモバイル ビジネス インテリジェンスは主流となり 特別なときに使用するものではなくなっていますビジネス ユーザーはオフィスだけではなく日常業務の流れでどんな時でも情報にアクセスする必要性に迫られています

事例についてはホワイトペーパー「How Mobile Business Intelligence Drives Efficiency and Transformation for Supervalue (モバイル ビジネス インテリジェンスが Supervalue の効率と変革を促進)」をご覧ください

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒5 データストアの急増

913

bull  その昔組織には様々ななタイプのデータがありましたbull  CRMデータ販売時点データ電子メールなど組織の経営

陣は多大な努力力を払いすべてのデータを1つの自社の高速なデータウェアハウスに保存していました

bull  2014年年にはこれがおとぎ話となりますすべてのデータはFluentd ベースの Treasure Agent を通じて一元的に収集管理理できまたトレジャーストレージはあらゆるデータの共存を容易易に実現しています

bull  トレジャーを初めとするデータや作業負荷に適したデータストアは解決すべき問題ではなく優れた IT 組織の特徴の 1 つとなります データ ストアの急増その昔組織にはさまざまなタイプのデータがありましたCRM データ販売時点データ電子メールなど組織の経営陣は多大な努力を払いすべてのデータを 1 つの高速なデータ ウェアハウスに保存していました

2013 年にはこれがおとぎ話となりますすべてのデータを 1 か所に保管する組織はもはや存在しませんさらに1 か所に保管する理由もなくなります大量のデータは Teradata や Hadoop などの場所に保管できます取引データは Oracle や SQL Server に保管できますデータや作業負荷に適したデータ ストアは解決すべき問題ではなく優れた IT 組織の特徴の 1 つとなります

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒6 自立性が新しいセルフサービスに

1013

bull  セルフ サービス BI はビジネス ユーザーがより優れた決定を行行うために必要なデータを分析できるようにするという考え方です

bull  自立立性はこの概念念の時代の到来ですこれはndash  ビジネス ユーザーが適切切なデータにアクセスできること

ndash  そのデータが 使用可能な形式と場所にあること

ndash  またビジネス ユーザーにセルフサービス分析が可能なソリューションがあること

を意味します

bull  これらすべてが実現できればビジネス ユーザーはビジネス上の問題に自分で対応できIT は安全なデータとそれにア クセスするためのソリューションの提供に集中することができます

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒7 コラボレーションは機能でなく現実に

1113

bull  ビジネスインテリジェンスソリューションではよくコラボレーション機能が盛んに宣伝されてきましたが2014年年にはそれだけでは十分でなくなります

bull  コラボレーションはビジネス インテリジェンスの導入の本質でなければなりません

bull  ビジネ スに関する質問のやり取りといった共有体験なくしてビジネスインテリジェンスは存在し得ないためです

bull  2014 年年には企業は問題の理理解と解決に向けた共同作業に組織全体の人を関与させるための方法を追求するようになります

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

1213

a  Tableau Desktopb  Tableau Readerc  Tableau Serverd  Tableau Public

Copyright copy2014 Treasure Data All Rights Reserved

2 ビジネスが抱える課題

1  上層部から分析を要求されているndash  幹部チームからもっとデータ主導型企業になるよう要求されているけれども具体的な施策が見つからない

2  大量量のレポートの要求を受け続けているndash  終わらないまま毎日増え続けるリストにうんざりしお手上げ状態である

ndash  優秀な分析チームも最善を尽くし少なくともリクエストに優先順位を付けて作業することは可能ですがその場合は優先度度の高いものだけが処理理されその他のものは手つかずに終わる可能性があります

3  レポートを提出することでさらに必要なレポートが増えていくndash  レポートの作成前に必要な内容をすべて確認したにもかかわらずフォローアップの質問は途切切れることがありません

ndash  あなたのレポート内容に人々が惹きつけられたということでもありますがその後の度度重なる質問に回答するため再度度チーム内に聞いて回っていては 非効率率率的です

4  データが古いことにフラストレーションを感じているndash  レポートを要求しレポートを待ちそのレポートに 関する質問を投げかけるというサイクルで避けられない問題の 1

つにデータが最新でなくなるという点があります

ndash  ビジネスにおいてもプライベートにおいても現代の世界では「すぐに満足感を得たい」という風潮がありますこのように待ち時間が多くてはその期待には応えられません

1313

Copyright copy2014 Treasure Data All Rights Reserved

2 ビジネスが抱える課題5  マッシュアップしたデータを要求される

ndash  実際に「マッシュアップ」という単語が使われていないかもしれませんが「サードパーティのデータも追加してくれないか」 「Excel ファイルに大量量のデータがあるがそれがこれとどう関係しているのかが見見たい」など要求されていませんか

ndash  複数のデータソースを組み合わせることの有用性は分かっていても一元管理理された BI チームでこのような調整を行行うのは容易易ではありません

6  視覚的分析を求めているndash  人間は行行や列列表を見見 る よりも分かりやすい視覚的な形でデータを見見た方が多くの情報を認識識できます

ndash  まだ視覚的データを要求されてい なくても近いうちに要求されるようになるはずです

ndash  それ がセルフサービスBIとどう関係するのかデータを様々な形で見見ることができれば疑問に対する新たな視点を求められることがなくなります

7  すでに一部で使用しているndash  全てに当てはまるわけではありませんが多くの企業がすでにセルフサービスBIを独自に採用しています

ndash  才覚のあるビジネスリーダーはチームの処理理能力力の限界を把握し彼らが非常に優秀で優れたプロジェクトを運営できることを認識識しています

ndash  その結果独自のセルフサービスBIを採用するケースが多く見見られます

ndash  ITリーダーにとって希望の兆しとなるのはその導入によってすばらしい結果が生み出されることでセルフサービス BI の取り組みをサポートする支援者を 得られるという点です

1413

Copyright copy2014 Treasure Data All Rights Reserved

2 回避したい7つの間違い1  複雑すぎるスタート

ndash  野心的になりすぎてすべてのビジネス課題を網羅羅する詳細すぎるリアルタイムのダッシュボードを作成しユーザーにたくさんの詳細オプションを提供することは簡単です

ndash  「完璧」なダッシュボードを作成するために何週間も何ヶ月も時間を費やさないでくださいその代わり試作品とテスト調整の短いサイクルで作業します

2  誰も理理解できない指標を使用するndash  あなたにとってつじつまが合う指標の表示方法やラベル付け方法は他の人にとってもそうでしょうか

ndash  あなたは指標を熟知しているので別のものと検証するステップはいらないかもしれません

ndash  指標がダッシュボードの目標をサポートするだけ でなく閲覧者が理理解できるようにする必要があります

3  重要でないグラフィックや分かりにくいウィジェットで乱雑なダッシュボードにするndash  ゲージのようなグラフィックやウィジェットでダッシュボードを派手にデザインしすぎないようにします

ndash  こうしたものは見見た目は良良いですが迅速かつ簡単に閲覧者に知らせるというダッシュボードの目的が妨げられる場合がありますダッシュボードは見見た目をシンプルに抑えてください

4  複雑なテクノロジーや大きなビジネス インテリジェンス展開プロジェクトを待つndash  従来のビジネス インテリジェンス (BI) の実装は最初の予測よりも長くかかる場合があります従来の BI プロジェクト

が実現するまで待つと何ヶ月も何年年も遅れる場合がありますすぐにダッシュボードを構築して配布できるアプリケーションを使用してください

1513

Copyright copy2014 Treasure Data All Rights Reserved

2 回避したい7つの間違い

5  ダッシュボードの作成と維持のための時間とリソースを過小評価するndash  ダッシュボードの展開は1回で終わる作業ではありません

ndash  指標に関連性がありデータが最新であるかを閲覧者と確認 することを怠ると誰も使用しなくなります定期的にダッシュボードの実用性を確認してください

6  指標と目標が一致しないndash  ダッシュボードは大きな目標に接続するとより強力力になります部署内の主な指標が組織全体としての成功に反映しない

ダッシュボードを作成してしまうことのないようにします

7  効果的でないデザインの悪いグラフやチャートを使うndash  グラフやチャートをデザインする際は気をつける必要があります

ndash  たとえば3D チャートで閲覧者の理理解が増すことはありません派手な色が解釈の邪魔になることもあります円グラフは値が6つ以上ある場合は特に効果的とは言えません

ndash  優れたビジュアライゼーションのデザインは「6 Tableau Best Practice」を参照してください

1613

Copyright copy2014 Treasure Data All Rights Reserved

2 Tableauの特徴

1713

p4

ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI 二分に満たしていたためです 4700 人以上の従業員用に

同院では Tableau の超高速処理ビジネス インテリジェンス ソリューションを組織全体 (病院研究施設財団法人) に導入しました

特定の人が適切な時間管理のために病院内にいる必要はありません誰もが時間管理を改善したいと考えていますビジネス ユーザーにも IT 部門にも時間節約のニーズがあります超高速処理 BI を導入すれば大規模な BI プロジェクトでも長引くことはなくなりますビジネス ユーザーが実際に使用できる成果物を得られるまで数か月場合によっては数年かかるような事態に陥ることはなくなりますまたExcel でのレポート作成と共有という不便な環境を強いられることもなくなります

次のいずれかの質問に当てはまる場合既存の BI システムは想定された速度で機能していない bull ビジネス インテリジェンス ソリューションの導入または変更に数週間から数か月かかりますか

bull レポートやダッシュボードの作成または変更に IT 部門への依頼が必要でありIT 部門による対応待ちや未処理の状態になったりしますか

bull BI ソリューションでは新しいユーザーが初めてダッシュボードまたはレポートを作成してパブリッシュできるようになるまでトレーニングに数日または数週間かかりますか

bull BI ソリューションは綿密なスケジュールやシステムの

パフォーマンス低下の場合の回避策に依存していますか

bull 企業のデータ ウェアハウスや高速データベースに多額の投資を行っていてもBI ソリューションによりデータの複製が必要になりますか

bull BI ソリューションでは統合前の特殊な作業を行わないとデータにアクセスできませんか

bull リレーショナル データベース以外に保存されている生データや非構造化データを含め複数のソースからのデータをブレンドできることに制約はありませんか

これまでのビジネス インテリジェンス ソフトウェアは導入に時間がかかります購入に数か月実装に数か月以上かかりますユーザーのトレーニングには数週間かかり高いコストもかかります開発者はビジネス ユーザーに要望を聞きその結果を持ち帰ってレポートを作成します変更の反映には何度かの確認とやり直しを経て数週間かかります2 つのデータ ソースを組み合わせるためにITはそれらの両方を収容する新しいデータ リポジトリを構築する必要がありますその後開発者は再びレポート作成のプログラミングに取り組みますこれでは導入プロセス全体が大幅に停滞しているように感じられます

超高速処理ビジネス インテリジェンスの場合と比べてみましょうこの場合まずトライアル版ソフトウェアをダウンロードしてインストールしますスプレッドシートやリレーショナル データベースからキューブHadoop などに至るまであらゆる種類のデータにアクセスしますこの操作はワンクリックで可能です高速データ ストアにライブ接続するか抽出データを高速データ エンジンにインポートするかを選

図 1 データ ワークフローのあらゆる段階で高速化

これまでのビジネス インテリジェンスと比べて超高速処理分析ではソフトウェアのインストールからデータへのアクセス複雑な情報の

分析インタラクティブなダッシュボードのパブリッシュ組織全体での共有に至るまでワークフローのあらゆる段階でその処理速度は

10 ~ 100 倍高速です

Install Access Analyze Publish Share

10 X 100 TIMES FASTER

p14

ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI

Tableau 超高速処理ビジネス インテリジェンスの背景テクノロジー超高速処理ビジネス インテリジェンスを文字どおり超高速にしている要因は何でしょうかそれは VizQLtrade ですTableau のこの特許取得済みのクエリ言語により簡単なドラッグ アンド ドロップ操作であらゆる規模トピック形式のデータを視覚化できますVizQL はユーザーによる操作をデータベース クエリに変換した後その応答をグラフィカルに表現しますその結果新しいデータベースおよびスプレッドシートのまったく新しい操作方法が生まれました視覚化計算がサポートされているためインタラクティブな質問と回答を通じてデータのさまざまなビューを繰り返し生成することができます

VizQL に続く超高速処理ビジネス インテリジェンスの次の画期的なテクノロジーはTableau のダイレクト接続 amp クエリ機能を使用して既存のデータベースに高速にアクセスして活用できるというものでしたビッグデータを含めほぼすべてのデータ ソースに対して最適化されたコネクタを使用することでTableau では専門知識を必要とせずにライブ データ ソースへのクエリと接続が可能です

ldquoTableau を使用して昨年度は収益が 2 増加しましたこれは 2 億米ドルに相当します航空または運送業界で収益を挙げたいと考えるならばTableau の使用をお勧めしますrdquo

China Eastern Airlines 社ネットワーキングおよび収益部門上級管理

者James Pu 氏

しかしTableau の進化はまだ続きますライブ データ ソースに接続できないときや接続したくないときのためにTableau にはビルトイン データ エンジンを使用して数百万行のデータのアド ホック分析を数秒で実行できる機能が用意されていますTableau のビルトイン データ エンジンは膨大なデータの高速処理が可能であるためビュー間を簡単に切り替えて意味のある傾向や外れ値を検出できますデータ エンジンは PC 上で動作する高性能のインメモリ分析データベースですデータ エンジンにより低速のデータ ソースを高速化できますさらにその速度を活か

して高速のデータ ストアに直接接続することもできますもちろんこれらの 2 つのデータ アクセス方式 (ライブ接続とインメモリ) の間には完全な互換性がありますアクセス方式がライブ接続かインメモリかにかかわらず複数のデータ ソースをブレンドし組み合わせることができます

Databases Cubes Spreadsheets Hadoop amp More

In-Memory Data Live Connection

PC Browser iPad AndroidDesktop

図 10 Tableau アーキテクチャTableau のアーキテクチャには膨大なデータ ソースに対応する

ためにインメモリとライブ接続という 2 つの方法が用意されて

います

最後に 結論企業や公共機関がビジネス インテリジェンスに求めるものには大きな変化が生じていますこれまでの BI の処理は低速で膨大なリソースが必要ですたとえばSeattle Childrenrsquos Hospital に家族が病気の子供を 連れて行くとしましょう家族は一刻も早く子供を診察してもらいたいと思うでしょう速度の重要性は病院に限られることではありません競争の激しい市場では企業は販売促進やコスト削減のために数か月も待つことはできませんたとえばM Financial Group 社は競合他社より勝るペースで北米で最も認知度と評価度の高い保険ブランドの 2000 万米ドルを超える有標製品を発売しましたTableau を使用して私は膨大なデータ セットをドリルダウンしすぐにリレーシ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

uarr 導入から分析共有までのサイクルが10〜~100倍速いです larrあらゆるデータソース(インプット)あらゆる端末(アウトプット)をTableauが繋ぎます darrTableau Desktop で作成したレポートをすぐにパブリックにできます

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒a Tableau Desktop

bull  考える速さで分析するndash  データに接続しコードを1行行も書かずにクエリを実行行できます

ndash  ドラッグアンドドロップを使用したビュー間の直感に沿った移動が可能ですndash  ペタバイト単位または何十億行行ものデータを測定するかどうかに関わらずTableau は可能な限り高速に動作するように構築さ

れています

ndash  Windows Macemsp 両対応(ver 82)

ndash  Tablesu Desktop のインプットソースとして無尽蔵の Treasure ストレージを選択可能ビッグデータをマウスでアドホックに扱えます

1813

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒b Tableau Reader

bull  Tableau Reader はTableau Desktopで作成したビジュアライゼーションを開いて表示できる無料料のデスクトップアプリケーションです

bull  Tableau Reader ではデータを含むTableau Desktopで作成したビジュアライゼーションを開いて操作可能です

bull  作成者の許可の範囲内であればデータをフィルタードリルダウン表示が可能です

bull  作成者によって組み込まれていない場合は操作を編集したり実行行したりすることは不不可能です

bull  Window Mac 両対応

1913

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒c Tableau Server

bull  作成したダッシュボードをWEBアプリ化する事でどこからでもどのデバイスでも分析出来るようになります

bull  データソースへの接続を Tableau Server に集約することによりデータの共有データマートとしての利利用が可能になります

2013

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒d Tableau Public

bull  導入利利用は無料料です

bull  接続出来るデータの種類に制限されます

bull  EXCELテキスト等接続データソースに制限です

bull  利利用出来る行行数データサイズに(100万行行1GB)制約があります

bull  一般公開を前提としたサービスです

2113

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

2213

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2313

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2413

ディメンションbull  定性的な情報やカテゴリ情報を含むフィール

ドを『ディメンション』として扱います

bull  テキストや日付の値を持つフィールドもこれらに含まれます

bull  行行または列列の棚にドラッグドロップをする事でヘッダを生成します

メジャーbull  行行または列列の棚にドラッグドロップを行行う

と『軸』を生成します

bull  デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2513

フィルタ

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2613

マーク gt カラー

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2713

マーク gt サイズ マーク gt ラベル

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  テキストテーブル(text tables)b  ヒートマップ(heat maps)c  ハイライトテーブル(highlight tables)d  記号マップ(symbol maps)e  色塗りマップ(filled maps)f  円グラフ(pie charts)g  水平棒グラフ(horizontal bars)h  積み上げ棒グラフ(stacked bars)i  並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j  ツリーマップ(tree maps)k  円ビュー(circle views)l  並列列円(side-‐‑‒by-‐‑‒side circles)

2813

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  線グラフ連続(lines continuous)b  線グラフ不不連続(lines discrete)c  二重線(dual lines)d  エリアチャート連続(area charts continuous)e  エリアチャート不不連続(area charts discrete)f  2つの組み合わせ(dual combination)g  散布図(scatter plots)h  ヒストグラム(histgram)i  箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j  ガントビュー(gantt view)k  ブレットグラフ(bullet graphs)l  パックバブル(packed bubbles)

2913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒1 Show Me gt 棒グラフ

bull  ひと目で最高値と最低値を見見ることができます

bull  棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます

bull  例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較

bull  応用例例ndash  1つのダッシュボードに複数の棒グラフを使用多数のス

プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります

ndash  棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます

ndash  積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です

ndash  棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます

ndash  バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります

3013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒2 Show Me gt 折れ線グラフ

bull  折れ線グラフは個々の数値データ ポイントを「線」で結びます

bull  それにより値の連続性をわかりやすく視覚化することが可能です

bull  主に一定期間にわたる傾向を表す際に使用します

bull  応用例例ndash  折れ線グラフと棒グラフを組み併せ特定の株価の1日あ

たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます

ndash  線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます

3113

7HFKHDGVampDSLWDO5DLVHGLQ

Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1

$0

$5000

$10000

$15000

$20000

$25000

$30000

$35000

Run

ning

Sum

of O

ffer A

mou

nt (i

n m

il)

7HFKQRORJ

(QHUJ

+HDOWKampDUH

ampRQVXPHU

XVLQHVV6HUYLFHV5HDO(VWDWH

6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV

ampOLFNKHUHWRFOHDUILOWHU

5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒3 Show Me gt 円グラフ

bull  円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです

bull  円グラフは最も誤用されやすいグラフです

bull  データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします

bull  円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように

bull  例例比率率率を表す

bull  応用例ndash  円の扇形を6つまでに制限します比率率率が6つ以上ある場

合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります

ndash  円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします

3213

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒4 Show Me gt マップ

bull  郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります

bull  例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域

bull  応用例例ndash  マップを他の種類のチャートグラフ表のフィルターと

して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます

ndash  マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます

3313

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒5 Show Me gt 散布図

bull  一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます

bull  例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料

bull  応用例 ndash  傾向線最良良適合線を追加します データの相関性に傾向

線を追加すると結果がより明瞭になります

ndash  フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます

ndash  情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります

3413

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒6 Show Me gt ガントチャート

bull  ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です

bull  プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます

bull  応用例ndash  色を追加するガント チャート内のバーの色を変えるこ

とで変数の重要側面をすばやく 伝えることができますndash  マップや他の種類のチャートをガントチャートと組み合わ

せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます

3513

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒7 Show Me gt バブルチャート

bull  バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください

bull  様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す

bull  例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率

bull  応用例ndash  散布図のデータを強調する 各データ ポイントのサイズ

や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます

ndash  マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります

3613

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒8 Show Me gt ヒストグラムbull  ヒストグラムはグループ間でのデータの分散を表示

する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです

bull  データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます

bull  データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます

bull  例例ndash  データのグループ化をテストする データに合ったグ

ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます

ndash  フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります

3713

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒9 Show Me gt ブレットグラフbull  目標がある場合その目標までの進行行状況を追跡するにはブレッ

トグラフが適しています

bull  本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです

bull  ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します

bull  ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)

bull  例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)

bull  応用例例ndash  色を使用して達成のしきい値を示すプライマリメジャーの背景に赤

黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます

ndash  概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます

3813

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒10 Show Me gt ヒートマップ

bull  ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます

bull  例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード

bull  応用例ndash  四角形のサイズを変えますヒート マップでは四角形

のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます

ndash  四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります

3913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒11 Show Me gt ハイライト表

bull  ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます

bull  例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口

bull  応用例例ndash  ハイライト表を他の種類のチャートと組み合わせる たと

えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります

4013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 7: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒3 ストーリーテリングの重要性

713

bull  人々はコンテクストのないダッシュボードが増えても役立立たないことを理理解してきましたbull  ストーリーテリングではデータを利利用してアイデアや洞洞察を効果的に伝えることができます

bull  また大容量量の異異種データが持つ意味を汲み取ることもできます詳細はホワイトペーパー「5 Best Practices for Telling Great Stories (優れたストリーを伝える 5 つのベスト プラクティス)」をご覧ください

ストリーテリングの重要性 人々はコンテクストのないダッシュボードが増えても役立たないことを理解してきましたストリーテリングではデータを利用してアイデアや洞察を効果的に伝えることができますまた大容量の異種データが持つ意味を汲み取ることもできます

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒4 モバイルBIが主流流に

813

bull  最先端の企業にとってモバイル ビジネスインテリジェンス は主流流となり 特別な場合のみに使用するものではなくなっていますbull  ビジネス ユーザーはオフィスだけではなく日常業務の流流れでどんな時でも情報にアクセスする必要性に 迫られています

最先端の企業にとってモバイル ビジネス インテリジェンスは主流となり 特別なときに使用するものではなくなっていますビジネス ユーザーはオフィスだけではなく日常業務の流れでどんな時でも情報にアクセスする必要性に迫られています

事例についてはホワイトペーパー「How Mobile Business Intelligence Drives Efficiency and Transformation for Supervalue (モバイル ビジネス インテリジェンスが Supervalue の効率と変革を促進)」をご覧ください

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒5 データストアの急増

913

bull  その昔組織には様々ななタイプのデータがありましたbull  CRMデータ販売時点データ電子メールなど組織の経営

陣は多大な努力力を払いすべてのデータを1つの自社の高速なデータウェアハウスに保存していました

bull  2014年年にはこれがおとぎ話となりますすべてのデータはFluentd ベースの Treasure Agent を通じて一元的に収集管理理できまたトレジャーストレージはあらゆるデータの共存を容易易に実現しています

bull  トレジャーを初めとするデータや作業負荷に適したデータストアは解決すべき問題ではなく優れた IT 組織の特徴の 1 つとなります データ ストアの急増その昔組織にはさまざまなタイプのデータがありましたCRM データ販売時点データ電子メールなど組織の経営陣は多大な努力を払いすべてのデータを 1 つの高速なデータ ウェアハウスに保存していました

2013 年にはこれがおとぎ話となりますすべてのデータを 1 か所に保管する組織はもはや存在しませんさらに1 か所に保管する理由もなくなります大量のデータは Teradata や Hadoop などの場所に保管できます取引データは Oracle や SQL Server に保管できますデータや作業負荷に適したデータ ストアは解決すべき問題ではなく優れた IT 組織の特徴の 1 つとなります

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒6 自立性が新しいセルフサービスに

1013

bull  セルフ サービス BI はビジネス ユーザーがより優れた決定を行行うために必要なデータを分析できるようにするという考え方です

bull  自立立性はこの概念念の時代の到来ですこれはndash  ビジネス ユーザーが適切切なデータにアクセスできること

ndash  そのデータが 使用可能な形式と場所にあること

ndash  またビジネス ユーザーにセルフサービス分析が可能なソリューションがあること

を意味します

bull  これらすべてが実現できればビジネス ユーザーはビジネス上の問題に自分で対応できIT は安全なデータとそれにア クセスするためのソリューションの提供に集中することができます

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒7 コラボレーションは機能でなく現実に

1113

bull  ビジネスインテリジェンスソリューションではよくコラボレーション機能が盛んに宣伝されてきましたが2014年年にはそれだけでは十分でなくなります

bull  コラボレーションはビジネス インテリジェンスの導入の本質でなければなりません

bull  ビジネ スに関する質問のやり取りといった共有体験なくしてビジネスインテリジェンスは存在し得ないためです

bull  2014 年年には企業は問題の理理解と解決に向けた共同作業に組織全体の人を関与させるための方法を追求するようになります

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

1213

a  Tableau Desktopb  Tableau Readerc  Tableau Serverd  Tableau Public

Copyright copy2014 Treasure Data All Rights Reserved

2 ビジネスが抱える課題

1  上層部から分析を要求されているndash  幹部チームからもっとデータ主導型企業になるよう要求されているけれども具体的な施策が見つからない

2  大量量のレポートの要求を受け続けているndash  終わらないまま毎日増え続けるリストにうんざりしお手上げ状態である

ndash  優秀な分析チームも最善を尽くし少なくともリクエストに優先順位を付けて作業することは可能ですがその場合は優先度度の高いものだけが処理理されその他のものは手つかずに終わる可能性があります

3  レポートを提出することでさらに必要なレポートが増えていくndash  レポートの作成前に必要な内容をすべて確認したにもかかわらずフォローアップの質問は途切切れることがありません

ndash  あなたのレポート内容に人々が惹きつけられたということでもありますがその後の度度重なる質問に回答するため再度度チーム内に聞いて回っていては 非効率率率的です

4  データが古いことにフラストレーションを感じているndash  レポートを要求しレポートを待ちそのレポートに 関する質問を投げかけるというサイクルで避けられない問題の 1

つにデータが最新でなくなるという点があります

ndash  ビジネスにおいてもプライベートにおいても現代の世界では「すぐに満足感を得たい」という風潮がありますこのように待ち時間が多くてはその期待には応えられません

1313

Copyright copy2014 Treasure Data All Rights Reserved

2 ビジネスが抱える課題5  マッシュアップしたデータを要求される

ndash  実際に「マッシュアップ」という単語が使われていないかもしれませんが「サードパーティのデータも追加してくれないか」 「Excel ファイルに大量量のデータがあるがそれがこれとどう関係しているのかが見見たい」など要求されていませんか

ndash  複数のデータソースを組み合わせることの有用性は分かっていても一元管理理された BI チームでこのような調整を行行うのは容易易ではありません

6  視覚的分析を求めているndash  人間は行行や列列表を見見 る よりも分かりやすい視覚的な形でデータを見見た方が多くの情報を認識識できます

ndash  まだ視覚的データを要求されてい なくても近いうちに要求されるようになるはずです

ndash  それ がセルフサービスBIとどう関係するのかデータを様々な形で見見ることができれば疑問に対する新たな視点を求められることがなくなります

7  すでに一部で使用しているndash  全てに当てはまるわけではありませんが多くの企業がすでにセルフサービスBIを独自に採用しています

ndash  才覚のあるビジネスリーダーはチームの処理理能力力の限界を把握し彼らが非常に優秀で優れたプロジェクトを運営できることを認識識しています

ndash  その結果独自のセルフサービスBIを採用するケースが多く見見られます

ndash  ITリーダーにとって希望の兆しとなるのはその導入によってすばらしい結果が生み出されることでセルフサービス BI の取り組みをサポートする支援者を 得られるという点です

1413

Copyright copy2014 Treasure Data All Rights Reserved

2 回避したい7つの間違い1  複雑すぎるスタート

ndash  野心的になりすぎてすべてのビジネス課題を網羅羅する詳細すぎるリアルタイムのダッシュボードを作成しユーザーにたくさんの詳細オプションを提供することは簡単です

ndash  「完璧」なダッシュボードを作成するために何週間も何ヶ月も時間を費やさないでくださいその代わり試作品とテスト調整の短いサイクルで作業します

2  誰も理理解できない指標を使用するndash  あなたにとってつじつまが合う指標の表示方法やラベル付け方法は他の人にとってもそうでしょうか

ndash  あなたは指標を熟知しているので別のものと検証するステップはいらないかもしれません

ndash  指標がダッシュボードの目標をサポートするだけ でなく閲覧者が理理解できるようにする必要があります

3  重要でないグラフィックや分かりにくいウィジェットで乱雑なダッシュボードにするndash  ゲージのようなグラフィックやウィジェットでダッシュボードを派手にデザインしすぎないようにします

ndash  こうしたものは見見た目は良良いですが迅速かつ簡単に閲覧者に知らせるというダッシュボードの目的が妨げられる場合がありますダッシュボードは見見た目をシンプルに抑えてください

4  複雑なテクノロジーや大きなビジネス インテリジェンス展開プロジェクトを待つndash  従来のビジネス インテリジェンス (BI) の実装は最初の予測よりも長くかかる場合があります従来の BI プロジェクト

が実現するまで待つと何ヶ月も何年年も遅れる場合がありますすぐにダッシュボードを構築して配布できるアプリケーションを使用してください

1513

Copyright copy2014 Treasure Data All Rights Reserved

2 回避したい7つの間違い

5  ダッシュボードの作成と維持のための時間とリソースを過小評価するndash  ダッシュボードの展開は1回で終わる作業ではありません

ndash  指標に関連性がありデータが最新であるかを閲覧者と確認 することを怠ると誰も使用しなくなります定期的にダッシュボードの実用性を確認してください

6  指標と目標が一致しないndash  ダッシュボードは大きな目標に接続するとより強力力になります部署内の主な指標が組織全体としての成功に反映しない

ダッシュボードを作成してしまうことのないようにします

7  効果的でないデザインの悪いグラフやチャートを使うndash  グラフやチャートをデザインする際は気をつける必要があります

ndash  たとえば3D チャートで閲覧者の理理解が増すことはありません派手な色が解釈の邪魔になることもあります円グラフは値が6つ以上ある場合は特に効果的とは言えません

ndash  優れたビジュアライゼーションのデザインは「6 Tableau Best Practice」を参照してください

1613

Copyright copy2014 Treasure Data All Rights Reserved

2 Tableauの特徴

1713

p4

ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI 二分に満たしていたためです 4700 人以上の従業員用に

同院では Tableau の超高速処理ビジネス インテリジェンス ソリューションを組織全体 (病院研究施設財団法人) に導入しました

特定の人が適切な時間管理のために病院内にいる必要はありません誰もが時間管理を改善したいと考えていますビジネス ユーザーにも IT 部門にも時間節約のニーズがあります超高速処理 BI を導入すれば大規模な BI プロジェクトでも長引くことはなくなりますビジネス ユーザーが実際に使用できる成果物を得られるまで数か月場合によっては数年かかるような事態に陥ることはなくなりますまたExcel でのレポート作成と共有という不便な環境を強いられることもなくなります

次のいずれかの質問に当てはまる場合既存の BI システムは想定された速度で機能していない bull ビジネス インテリジェンス ソリューションの導入または変更に数週間から数か月かかりますか

bull レポートやダッシュボードの作成または変更に IT 部門への依頼が必要でありIT 部門による対応待ちや未処理の状態になったりしますか

bull BI ソリューションでは新しいユーザーが初めてダッシュボードまたはレポートを作成してパブリッシュできるようになるまでトレーニングに数日または数週間かかりますか

bull BI ソリューションは綿密なスケジュールやシステムの

パフォーマンス低下の場合の回避策に依存していますか

bull 企業のデータ ウェアハウスや高速データベースに多額の投資を行っていてもBI ソリューションによりデータの複製が必要になりますか

bull BI ソリューションでは統合前の特殊な作業を行わないとデータにアクセスできませんか

bull リレーショナル データベース以外に保存されている生データや非構造化データを含め複数のソースからのデータをブレンドできることに制約はありませんか

これまでのビジネス インテリジェンス ソフトウェアは導入に時間がかかります購入に数か月実装に数か月以上かかりますユーザーのトレーニングには数週間かかり高いコストもかかります開発者はビジネス ユーザーに要望を聞きその結果を持ち帰ってレポートを作成します変更の反映には何度かの確認とやり直しを経て数週間かかります2 つのデータ ソースを組み合わせるためにITはそれらの両方を収容する新しいデータ リポジトリを構築する必要がありますその後開発者は再びレポート作成のプログラミングに取り組みますこれでは導入プロセス全体が大幅に停滞しているように感じられます

超高速処理ビジネス インテリジェンスの場合と比べてみましょうこの場合まずトライアル版ソフトウェアをダウンロードしてインストールしますスプレッドシートやリレーショナル データベースからキューブHadoop などに至るまであらゆる種類のデータにアクセスしますこの操作はワンクリックで可能です高速データ ストアにライブ接続するか抽出データを高速データ エンジンにインポートするかを選

図 1 データ ワークフローのあらゆる段階で高速化

これまでのビジネス インテリジェンスと比べて超高速処理分析ではソフトウェアのインストールからデータへのアクセス複雑な情報の

分析インタラクティブなダッシュボードのパブリッシュ組織全体での共有に至るまでワークフローのあらゆる段階でその処理速度は

10 ~ 100 倍高速です

Install Access Analyze Publish Share

10 X 100 TIMES FASTER

p14

ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI

Tableau 超高速処理ビジネス インテリジェンスの背景テクノロジー超高速処理ビジネス インテリジェンスを文字どおり超高速にしている要因は何でしょうかそれは VizQLtrade ですTableau のこの特許取得済みのクエリ言語により簡単なドラッグ アンド ドロップ操作であらゆる規模トピック形式のデータを視覚化できますVizQL はユーザーによる操作をデータベース クエリに変換した後その応答をグラフィカルに表現しますその結果新しいデータベースおよびスプレッドシートのまったく新しい操作方法が生まれました視覚化計算がサポートされているためインタラクティブな質問と回答を通じてデータのさまざまなビューを繰り返し生成することができます

VizQL に続く超高速処理ビジネス インテリジェンスの次の画期的なテクノロジーはTableau のダイレクト接続 amp クエリ機能を使用して既存のデータベースに高速にアクセスして活用できるというものでしたビッグデータを含めほぼすべてのデータ ソースに対して最適化されたコネクタを使用することでTableau では専門知識を必要とせずにライブ データ ソースへのクエリと接続が可能です

ldquoTableau を使用して昨年度は収益が 2 増加しましたこれは 2 億米ドルに相当します航空または運送業界で収益を挙げたいと考えるならばTableau の使用をお勧めしますrdquo

China Eastern Airlines 社ネットワーキングおよび収益部門上級管理

者James Pu 氏

しかしTableau の進化はまだ続きますライブ データ ソースに接続できないときや接続したくないときのためにTableau にはビルトイン データ エンジンを使用して数百万行のデータのアド ホック分析を数秒で実行できる機能が用意されていますTableau のビルトイン データ エンジンは膨大なデータの高速処理が可能であるためビュー間を簡単に切り替えて意味のある傾向や外れ値を検出できますデータ エンジンは PC 上で動作する高性能のインメモリ分析データベースですデータ エンジンにより低速のデータ ソースを高速化できますさらにその速度を活か

して高速のデータ ストアに直接接続することもできますもちろんこれらの 2 つのデータ アクセス方式 (ライブ接続とインメモリ) の間には完全な互換性がありますアクセス方式がライブ接続かインメモリかにかかわらず複数のデータ ソースをブレンドし組み合わせることができます

Databases Cubes Spreadsheets Hadoop amp More

In-Memory Data Live Connection

PC Browser iPad AndroidDesktop

図 10 Tableau アーキテクチャTableau のアーキテクチャには膨大なデータ ソースに対応する

ためにインメモリとライブ接続という 2 つの方法が用意されて

います

最後に 結論企業や公共機関がビジネス インテリジェンスに求めるものには大きな変化が生じていますこれまでの BI の処理は低速で膨大なリソースが必要ですたとえばSeattle Childrenrsquos Hospital に家族が病気の子供を 連れて行くとしましょう家族は一刻も早く子供を診察してもらいたいと思うでしょう速度の重要性は病院に限られることではありません競争の激しい市場では企業は販売促進やコスト削減のために数か月も待つことはできませんたとえばM Financial Group 社は競合他社より勝るペースで北米で最も認知度と評価度の高い保険ブランドの 2000 万米ドルを超える有標製品を発売しましたTableau を使用して私は膨大なデータ セットをドリルダウンしすぐにリレーシ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

uarr 導入から分析共有までのサイクルが10〜~100倍速いです larrあらゆるデータソース(インプット)あらゆる端末(アウトプット)をTableauが繋ぎます darrTableau Desktop で作成したレポートをすぐにパブリックにできます

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒a Tableau Desktop

bull  考える速さで分析するndash  データに接続しコードを1行行も書かずにクエリを実行行できます

ndash  ドラッグアンドドロップを使用したビュー間の直感に沿った移動が可能ですndash  ペタバイト単位または何十億行行ものデータを測定するかどうかに関わらずTableau は可能な限り高速に動作するように構築さ

れています

ndash  Windows Macemsp 両対応(ver 82)

ndash  Tablesu Desktop のインプットソースとして無尽蔵の Treasure ストレージを選択可能ビッグデータをマウスでアドホックに扱えます

1813

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒b Tableau Reader

bull  Tableau Reader はTableau Desktopで作成したビジュアライゼーションを開いて表示できる無料料のデスクトップアプリケーションです

bull  Tableau Reader ではデータを含むTableau Desktopで作成したビジュアライゼーションを開いて操作可能です

bull  作成者の許可の範囲内であればデータをフィルタードリルダウン表示が可能です

bull  作成者によって組み込まれていない場合は操作を編集したり実行行したりすることは不不可能です

bull  Window Mac 両対応

1913

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒c Tableau Server

bull  作成したダッシュボードをWEBアプリ化する事でどこからでもどのデバイスでも分析出来るようになります

bull  データソースへの接続を Tableau Server に集約することによりデータの共有データマートとしての利利用が可能になります

2013

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒d Tableau Public

bull  導入利利用は無料料です

bull  接続出来るデータの種類に制限されます

bull  EXCELテキスト等接続データソースに制限です

bull  利利用出来る行行数データサイズに(100万行行1GB)制約があります

bull  一般公開を前提としたサービスです

2113

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

2213

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2313

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2413

ディメンションbull  定性的な情報やカテゴリ情報を含むフィール

ドを『ディメンション』として扱います

bull  テキストや日付の値を持つフィールドもこれらに含まれます

bull  行行または列列の棚にドラッグドロップをする事でヘッダを生成します

メジャーbull  行行または列列の棚にドラッグドロップを行行う

と『軸』を生成します

bull  デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2513

フィルタ

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2613

マーク gt カラー

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2713

マーク gt サイズ マーク gt ラベル

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  テキストテーブル(text tables)b  ヒートマップ(heat maps)c  ハイライトテーブル(highlight tables)d  記号マップ(symbol maps)e  色塗りマップ(filled maps)f  円グラフ(pie charts)g  水平棒グラフ(horizontal bars)h  積み上げ棒グラフ(stacked bars)i  並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j  ツリーマップ(tree maps)k  円ビュー(circle views)l  並列列円(side-‐‑‒by-‐‑‒side circles)

2813

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  線グラフ連続(lines continuous)b  線グラフ不不連続(lines discrete)c  二重線(dual lines)d  エリアチャート連続(area charts continuous)e  エリアチャート不不連続(area charts discrete)f  2つの組み合わせ(dual combination)g  散布図(scatter plots)h  ヒストグラム(histgram)i  箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j  ガントビュー(gantt view)k  ブレットグラフ(bullet graphs)l  パックバブル(packed bubbles)

2913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒1 Show Me gt 棒グラフ

bull  ひと目で最高値と最低値を見見ることができます

bull  棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます

bull  例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較

bull  応用例例ndash  1つのダッシュボードに複数の棒グラフを使用多数のス

プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります

ndash  棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます

ndash  積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です

ndash  棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます

ndash  バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります

3013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒2 Show Me gt 折れ線グラフ

bull  折れ線グラフは個々の数値データ ポイントを「線」で結びます

bull  それにより値の連続性をわかりやすく視覚化することが可能です

bull  主に一定期間にわたる傾向を表す際に使用します

bull  応用例例ndash  折れ線グラフと棒グラフを組み併せ特定の株価の1日あ

たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます

ndash  線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます

3113

7HFKHDGVampDSLWDO5DLVHGLQ

Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1

$0

$5000

$10000

$15000

$20000

$25000

$30000

$35000

Run

ning

Sum

of O

ffer A

mou

nt (i

n m

il)

7HFKQRORJ

(QHUJ

+HDOWKampDUH

ampRQVXPHU

XVLQHVV6HUYLFHV5HDO(VWDWH

6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV

ampOLFNKHUHWRFOHDUILOWHU

5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒3 Show Me gt 円グラフ

bull  円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです

bull  円グラフは最も誤用されやすいグラフです

bull  データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします

bull  円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように

bull  例例比率率率を表す

bull  応用例ndash  円の扇形を6つまでに制限します比率率率が6つ以上ある場

合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります

ndash  円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします

3213

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒4 Show Me gt マップ

bull  郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります

bull  例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域

bull  応用例例ndash  マップを他の種類のチャートグラフ表のフィルターと

して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます

ndash  マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます

3313

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒5 Show Me gt 散布図

bull  一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます

bull  例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料

bull  応用例 ndash  傾向線最良良適合線を追加します データの相関性に傾向

線を追加すると結果がより明瞭になります

ndash  フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます

ndash  情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります

3413

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒6 Show Me gt ガントチャート

bull  ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です

bull  プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます

bull  応用例ndash  色を追加するガント チャート内のバーの色を変えるこ

とで変数の重要側面をすばやく 伝えることができますndash  マップや他の種類のチャートをガントチャートと組み合わ

せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます

3513

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒7 Show Me gt バブルチャート

bull  バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください

bull  様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す

bull  例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率

bull  応用例ndash  散布図のデータを強調する 各データ ポイントのサイズ

や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます

ndash  マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります

3613

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒8 Show Me gt ヒストグラムbull  ヒストグラムはグループ間でのデータの分散を表示

する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです

bull  データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます

bull  データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます

bull  例例ndash  データのグループ化をテストする データに合ったグ

ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます

ndash  フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります

3713

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒9 Show Me gt ブレットグラフbull  目標がある場合その目標までの進行行状況を追跡するにはブレッ

トグラフが適しています

bull  本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです

bull  ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します

bull  ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)

bull  例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)

bull  応用例例ndash  色を使用して達成のしきい値を示すプライマリメジャーの背景に赤

黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます

ndash  概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます

3813

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒10 Show Me gt ヒートマップ

bull  ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます

bull  例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード

bull  応用例ndash  四角形のサイズを変えますヒート マップでは四角形

のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます

ndash  四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります

3913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒11 Show Me gt ハイライト表

bull  ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます

bull  例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口

bull  応用例例ndash  ハイライト表を他の種類のチャートと組み合わせる たと

えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります

4013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 8: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒4 モバイルBIが主流流に

813

bull  最先端の企業にとってモバイル ビジネスインテリジェンス は主流流となり 特別な場合のみに使用するものではなくなっていますbull  ビジネス ユーザーはオフィスだけではなく日常業務の流流れでどんな時でも情報にアクセスする必要性に 迫られています

最先端の企業にとってモバイル ビジネス インテリジェンスは主流となり 特別なときに使用するものではなくなっていますビジネス ユーザーはオフィスだけではなく日常業務の流れでどんな時でも情報にアクセスする必要性に迫られています

事例についてはホワイトペーパー「How Mobile Business Intelligence Drives Efficiency and Transformation for Supervalue (モバイル ビジネス インテリジェンスが Supervalue の効率と変革を促進)」をご覧ください

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒5 データストアの急増

913

bull  その昔組織には様々ななタイプのデータがありましたbull  CRMデータ販売時点データ電子メールなど組織の経営

陣は多大な努力力を払いすべてのデータを1つの自社の高速なデータウェアハウスに保存していました

bull  2014年年にはこれがおとぎ話となりますすべてのデータはFluentd ベースの Treasure Agent を通じて一元的に収集管理理できまたトレジャーストレージはあらゆるデータの共存を容易易に実現しています

bull  トレジャーを初めとするデータや作業負荷に適したデータストアは解決すべき問題ではなく優れた IT 組織の特徴の 1 つとなります データ ストアの急増その昔組織にはさまざまなタイプのデータがありましたCRM データ販売時点データ電子メールなど組織の経営陣は多大な努力を払いすべてのデータを 1 つの高速なデータ ウェアハウスに保存していました

2013 年にはこれがおとぎ話となりますすべてのデータを 1 か所に保管する組織はもはや存在しませんさらに1 か所に保管する理由もなくなります大量のデータは Teradata や Hadoop などの場所に保管できます取引データは Oracle や SQL Server に保管できますデータや作業負荷に適したデータ ストアは解決すべき問題ではなく優れた IT 組織の特徴の 1 つとなります

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒6 自立性が新しいセルフサービスに

1013

bull  セルフ サービス BI はビジネス ユーザーがより優れた決定を行行うために必要なデータを分析できるようにするという考え方です

bull  自立立性はこの概念念の時代の到来ですこれはndash  ビジネス ユーザーが適切切なデータにアクセスできること

ndash  そのデータが 使用可能な形式と場所にあること

ndash  またビジネス ユーザーにセルフサービス分析が可能なソリューションがあること

を意味します

bull  これらすべてが実現できればビジネス ユーザーはビジネス上の問題に自分で対応できIT は安全なデータとそれにア クセスするためのソリューションの提供に集中することができます

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒7 コラボレーションは機能でなく現実に

1113

bull  ビジネスインテリジェンスソリューションではよくコラボレーション機能が盛んに宣伝されてきましたが2014年年にはそれだけでは十分でなくなります

bull  コラボレーションはビジネス インテリジェンスの導入の本質でなければなりません

bull  ビジネ スに関する質問のやり取りといった共有体験なくしてビジネスインテリジェンスは存在し得ないためです

bull  2014 年年には企業は問題の理理解と解決に向けた共同作業に組織全体の人を関与させるための方法を追求するようになります

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

1213

a  Tableau Desktopb  Tableau Readerc  Tableau Serverd  Tableau Public

Copyright copy2014 Treasure Data All Rights Reserved

2 ビジネスが抱える課題

1  上層部から分析を要求されているndash  幹部チームからもっとデータ主導型企業になるよう要求されているけれども具体的な施策が見つからない

2  大量量のレポートの要求を受け続けているndash  終わらないまま毎日増え続けるリストにうんざりしお手上げ状態である

ndash  優秀な分析チームも最善を尽くし少なくともリクエストに優先順位を付けて作業することは可能ですがその場合は優先度度の高いものだけが処理理されその他のものは手つかずに終わる可能性があります

3  レポートを提出することでさらに必要なレポートが増えていくndash  レポートの作成前に必要な内容をすべて確認したにもかかわらずフォローアップの質問は途切切れることがありません

ndash  あなたのレポート内容に人々が惹きつけられたということでもありますがその後の度度重なる質問に回答するため再度度チーム内に聞いて回っていては 非効率率率的です

4  データが古いことにフラストレーションを感じているndash  レポートを要求しレポートを待ちそのレポートに 関する質問を投げかけるというサイクルで避けられない問題の 1

つにデータが最新でなくなるという点があります

ndash  ビジネスにおいてもプライベートにおいても現代の世界では「すぐに満足感を得たい」という風潮がありますこのように待ち時間が多くてはその期待には応えられません

1313

Copyright copy2014 Treasure Data All Rights Reserved

2 ビジネスが抱える課題5  マッシュアップしたデータを要求される

ndash  実際に「マッシュアップ」という単語が使われていないかもしれませんが「サードパーティのデータも追加してくれないか」 「Excel ファイルに大量量のデータがあるがそれがこれとどう関係しているのかが見見たい」など要求されていませんか

ndash  複数のデータソースを組み合わせることの有用性は分かっていても一元管理理された BI チームでこのような調整を行行うのは容易易ではありません

6  視覚的分析を求めているndash  人間は行行や列列表を見見 る よりも分かりやすい視覚的な形でデータを見見た方が多くの情報を認識識できます

ndash  まだ視覚的データを要求されてい なくても近いうちに要求されるようになるはずです

ndash  それ がセルフサービスBIとどう関係するのかデータを様々な形で見見ることができれば疑問に対する新たな視点を求められることがなくなります

7  すでに一部で使用しているndash  全てに当てはまるわけではありませんが多くの企業がすでにセルフサービスBIを独自に採用しています

ndash  才覚のあるビジネスリーダーはチームの処理理能力力の限界を把握し彼らが非常に優秀で優れたプロジェクトを運営できることを認識識しています

ndash  その結果独自のセルフサービスBIを採用するケースが多く見見られます

ndash  ITリーダーにとって希望の兆しとなるのはその導入によってすばらしい結果が生み出されることでセルフサービス BI の取り組みをサポートする支援者を 得られるという点です

1413

Copyright copy2014 Treasure Data All Rights Reserved

2 回避したい7つの間違い1  複雑すぎるスタート

ndash  野心的になりすぎてすべてのビジネス課題を網羅羅する詳細すぎるリアルタイムのダッシュボードを作成しユーザーにたくさんの詳細オプションを提供することは簡単です

ndash  「完璧」なダッシュボードを作成するために何週間も何ヶ月も時間を費やさないでくださいその代わり試作品とテスト調整の短いサイクルで作業します

2  誰も理理解できない指標を使用するndash  あなたにとってつじつまが合う指標の表示方法やラベル付け方法は他の人にとってもそうでしょうか

ndash  あなたは指標を熟知しているので別のものと検証するステップはいらないかもしれません

ndash  指標がダッシュボードの目標をサポートするだけ でなく閲覧者が理理解できるようにする必要があります

3  重要でないグラフィックや分かりにくいウィジェットで乱雑なダッシュボードにするndash  ゲージのようなグラフィックやウィジェットでダッシュボードを派手にデザインしすぎないようにします

ndash  こうしたものは見見た目は良良いですが迅速かつ簡単に閲覧者に知らせるというダッシュボードの目的が妨げられる場合がありますダッシュボードは見見た目をシンプルに抑えてください

4  複雑なテクノロジーや大きなビジネス インテリジェンス展開プロジェクトを待つndash  従来のビジネス インテリジェンス (BI) の実装は最初の予測よりも長くかかる場合があります従来の BI プロジェクト

が実現するまで待つと何ヶ月も何年年も遅れる場合がありますすぐにダッシュボードを構築して配布できるアプリケーションを使用してください

1513

Copyright copy2014 Treasure Data All Rights Reserved

2 回避したい7つの間違い

5  ダッシュボードの作成と維持のための時間とリソースを過小評価するndash  ダッシュボードの展開は1回で終わる作業ではありません

ndash  指標に関連性がありデータが最新であるかを閲覧者と確認 することを怠ると誰も使用しなくなります定期的にダッシュボードの実用性を確認してください

6  指標と目標が一致しないndash  ダッシュボードは大きな目標に接続するとより強力力になります部署内の主な指標が組織全体としての成功に反映しない

ダッシュボードを作成してしまうことのないようにします

7  効果的でないデザインの悪いグラフやチャートを使うndash  グラフやチャートをデザインする際は気をつける必要があります

ndash  たとえば3D チャートで閲覧者の理理解が増すことはありません派手な色が解釈の邪魔になることもあります円グラフは値が6つ以上ある場合は特に効果的とは言えません

ndash  優れたビジュアライゼーションのデザインは「6 Tableau Best Practice」を参照してください

1613

Copyright copy2014 Treasure Data All Rights Reserved

2 Tableauの特徴

1713

p4

ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI 二分に満たしていたためです 4700 人以上の従業員用に

同院では Tableau の超高速処理ビジネス インテリジェンス ソリューションを組織全体 (病院研究施設財団法人) に導入しました

特定の人が適切な時間管理のために病院内にいる必要はありません誰もが時間管理を改善したいと考えていますビジネス ユーザーにも IT 部門にも時間節約のニーズがあります超高速処理 BI を導入すれば大規模な BI プロジェクトでも長引くことはなくなりますビジネス ユーザーが実際に使用できる成果物を得られるまで数か月場合によっては数年かかるような事態に陥ることはなくなりますまたExcel でのレポート作成と共有という不便な環境を強いられることもなくなります

次のいずれかの質問に当てはまる場合既存の BI システムは想定された速度で機能していない bull ビジネス インテリジェンス ソリューションの導入または変更に数週間から数か月かかりますか

bull レポートやダッシュボードの作成または変更に IT 部門への依頼が必要でありIT 部門による対応待ちや未処理の状態になったりしますか

bull BI ソリューションでは新しいユーザーが初めてダッシュボードまたはレポートを作成してパブリッシュできるようになるまでトレーニングに数日または数週間かかりますか

bull BI ソリューションは綿密なスケジュールやシステムの

パフォーマンス低下の場合の回避策に依存していますか

bull 企業のデータ ウェアハウスや高速データベースに多額の投資を行っていてもBI ソリューションによりデータの複製が必要になりますか

bull BI ソリューションでは統合前の特殊な作業を行わないとデータにアクセスできませんか

bull リレーショナル データベース以外に保存されている生データや非構造化データを含め複数のソースからのデータをブレンドできることに制約はありませんか

これまでのビジネス インテリジェンス ソフトウェアは導入に時間がかかります購入に数か月実装に数か月以上かかりますユーザーのトレーニングには数週間かかり高いコストもかかります開発者はビジネス ユーザーに要望を聞きその結果を持ち帰ってレポートを作成します変更の反映には何度かの確認とやり直しを経て数週間かかります2 つのデータ ソースを組み合わせるためにITはそれらの両方を収容する新しいデータ リポジトリを構築する必要がありますその後開発者は再びレポート作成のプログラミングに取り組みますこれでは導入プロセス全体が大幅に停滞しているように感じられます

超高速処理ビジネス インテリジェンスの場合と比べてみましょうこの場合まずトライアル版ソフトウェアをダウンロードしてインストールしますスプレッドシートやリレーショナル データベースからキューブHadoop などに至るまであらゆる種類のデータにアクセスしますこの操作はワンクリックで可能です高速データ ストアにライブ接続するか抽出データを高速データ エンジンにインポートするかを選

図 1 データ ワークフローのあらゆる段階で高速化

これまでのビジネス インテリジェンスと比べて超高速処理分析ではソフトウェアのインストールからデータへのアクセス複雑な情報の

分析インタラクティブなダッシュボードのパブリッシュ組織全体での共有に至るまでワークフローのあらゆる段階でその処理速度は

10 ~ 100 倍高速です

Install Access Analyze Publish Share

10 X 100 TIMES FASTER

p14

ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI

Tableau 超高速処理ビジネス インテリジェンスの背景テクノロジー超高速処理ビジネス インテリジェンスを文字どおり超高速にしている要因は何でしょうかそれは VizQLtrade ですTableau のこの特許取得済みのクエリ言語により簡単なドラッグ アンド ドロップ操作であらゆる規模トピック形式のデータを視覚化できますVizQL はユーザーによる操作をデータベース クエリに変換した後その応答をグラフィカルに表現しますその結果新しいデータベースおよびスプレッドシートのまったく新しい操作方法が生まれました視覚化計算がサポートされているためインタラクティブな質問と回答を通じてデータのさまざまなビューを繰り返し生成することができます

VizQL に続く超高速処理ビジネス インテリジェンスの次の画期的なテクノロジーはTableau のダイレクト接続 amp クエリ機能を使用して既存のデータベースに高速にアクセスして活用できるというものでしたビッグデータを含めほぼすべてのデータ ソースに対して最適化されたコネクタを使用することでTableau では専門知識を必要とせずにライブ データ ソースへのクエリと接続が可能です

ldquoTableau を使用して昨年度は収益が 2 増加しましたこれは 2 億米ドルに相当します航空または運送業界で収益を挙げたいと考えるならばTableau の使用をお勧めしますrdquo

China Eastern Airlines 社ネットワーキングおよび収益部門上級管理

者James Pu 氏

しかしTableau の進化はまだ続きますライブ データ ソースに接続できないときや接続したくないときのためにTableau にはビルトイン データ エンジンを使用して数百万行のデータのアド ホック分析を数秒で実行できる機能が用意されていますTableau のビルトイン データ エンジンは膨大なデータの高速処理が可能であるためビュー間を簡単に切り替えて意味のある傾向や外れ値を検出できますデータ エンジンは PC 上で動作する高性能のインメモリ分析データベースですデータ エンジンにより低速のデータ ソースを高速化できますさらにその速度を活か

して高速のデータ ストアに直接接続することもできますもちろんこれらの 2 つのデータ アクセス方式 (ライブ接続とインメモリ) の間には完全な互換性がありますアクセス方式がライブ接続かインメモリかにかかわらず複数のデータ ソースをブレンドし組み合わせることができます

Databases Cubes Spreadsheets Hadoop amp More

In-Memory Data Live Connection

PC Browser iPad AndroidDesktop

図 10 Tableau アーキテクチャTableau のアーキテクチャには膨大なデータ ソースに対応する

ためにインメモリとライブ接続という 2 つの方法が用意されて

います

最後に 結論企業や公共機関がビジネス インテリジェンスに求めるものには大きな変化が生じていますこれまでの BI の処理は低速で膨大なリソースが必要ですたとえばSeattle Childrenrsquos Hospital に家族が病気の子供を 連れて行くとしましょう家族は一刻も早く子供を診察してもらいたいと思うでしょう速度の重要性は病院に限られることではありません競争の激しい市場では企業は販売促進やコスト削減のために数か月も待つことはできませんたとえばM Financial Group 社は競合他社より勝るペースで北米で最も認知度と評価度の高い保険ブランドの 2000 万米ドルを超える有標製品を発売しましたTableau を使用して私は膨大なデータ セットをドリルダウンしすぐにリレーシ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

uarr 導入から分析共有までのサイクルが10〜~100倍速いです larrあらゆるデータソース(インプット)あらゆる端末(アウトプット)をTableauが繋ぎます darrTableau Desktop で作成したレポートをすぐにパブリックにできます

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒a Tableau Desktop

bull  考える速さで分析するndash  データに接続しコードを1行行も書かずにクエリを実行行できます

ndash  ドラッグアンドドロップを使用したビュー間の直感に沿った移動が可能ですndash  ペタバイト単位または何十億行行ものデータを測定するかどうかに関わらずTableau は可能な限り高速に動作するように構築さ

れています

ndash  Windows Macemsp 両対応(ver 82)

ndash  Tablesu Desktop のインプットソースとして無尽蔵の Treasure ストレージを選択可能ビッグデータをマウスでアドホックに扱えます

1813

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒b Tableau Reader

bull  Tableau Reader はTableau Desktopで作成したビジュアライゼーションを開いて表示できる無料料のデスクトップアプリケーションです

bull  Tableau Reader ではデータを含むTableau Desktopで作成したビジュアライゼーションを開いて操作可能です

bull  作成者の許可の範囲内であればデータをフィルタードリルダウン表示が可能です

bull  作成者によって組み込まれていない場合は操作を編集したり実行行したりすることは不不可能です

bull  Window Mac 両対応

1913

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒c Tableau Server

bull  作成したダッシュボードをWEBアプリ化する事でどこからでもどのデバイスでも分析出来るようになります

bull  データソースへの接続を Tableau Server に集約することによりデータの共有データマートとしての利利用が可能になります

2013

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒d Tableau Public

bull  導入利利用は無料料です

bull  接続出来るデータの種類に制限されます

bull  EXCELテキスト等接続データソースに制限です

bull  利利用出来る行行数データサイズに(100万行行1GB)制約があります

bull  一般公開を前提としたサービスです

2113

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

2213

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2313

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2413

ディメンションbull  定性的な情報やカテゴリ情報を含むフィール

ドを『ディメンション』として扱います

bull  テキストや日付の値を持つフィールドもこれらに含まれます

bull  行行または列列の棚にドラッグドロップをする事でヘッダを生成します

メジャーbull  行行または列列の棚にドラッグドロップを行行う

と『軸』を生成します

bull  デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2513

フィルタ

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2613

マーク gt カラー

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2713

マーク gt サイズ マーク gt ラベル

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  テキストテーブル(text tables)b  ヒートマップ(heat maps)c  ハイライトテーブル(highlight tables)d  記号マップ(symbol maps)e  色塗りマップ(filled maps)f  円グラフ(pie charts)g  水平棒グラフ(horizontal bars)h  積み上げ棒グラフ(stacked bars)i  並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j  ツリーマップ(tree maps)k  円ビュー(circle views)l  並列列円(side-‐‑‒by-‐‑‒side circles)

2813

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  線グラフ連続(lines continuous)b  線グラフ不不連続(lines discrete)c  二重線(dual lines)d  エリアチャート連続(area charts continuous)e  エリアチャート不不連続(area charts discrete)f  2つの組み合わせ(dual combination)g  散布図(scatter plots)h  ヒストグラム(histgram)i  箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j  ガントビュー(gantt view)k  ブレットグラフ(bullet graphs)l  パックバブル(packed bubbles)

2913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒1 Show Me gt 棒グラフ

bull  ひと目で最高値と最低値を見見ることができます

bull  棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます

bull  例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較

bull  応用例例ndash  1つのダッシュボードに複数の棒グラフを使用多数のス

プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります

ndash  棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます

ndash  積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です

ndash  棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます

ndash  バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります

3013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒2 Show Me gt 折れ線グラフ

bull  折れ線グラフは個々の数値データ ポイントを「線」で結びます

bull  それにより値の連続性をわかりやすく視覚化することが可能です

bull  主に一定期間にわたる傾向を表す際に使用します

bull  応用例例ndash  折れ線グラフと棒グラフを組み併せ特定の株価の1日あ

たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます

ndash  線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます

3113

7HFKHDGVampDSLWDO5DLVHGLQ

Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1

$0

$5000

$10000

$15000

$20000

$25000

$30000

$35000

Run

ning

Sum

of O

ffer A

mou

nt (i

n m

il)

7HFKQRORJ

(QHUJ

+HDOWKampDUH

ampRQVXPHU

XVLQHVV6HUYLFHV5HDO(VWDWH

6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV

ampOLFNKHUHWRFOHDUILOWHU

5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒3 Show Me gt 円グラフ

bull  円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです

bull  円グラフは最も誤用されやすいグラフです

bull  データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします

bull  円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように

bull  例例比率率率を表す

bull  応用例ndash  円の扇形を6つまでに制限します比率率率が6つ以上ある場

合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります

ndash  円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします

3213

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒4 Show Me gt マップ

bull  郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります

bull  例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域

bull  応用例例ndash  マップを他の種類のチャートグラフ表のフィルターと

して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます

ndash  マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます

3313

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒5 Show Me gt 散布図

bull  一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます

bull  例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料

bull  応用例 ndash  傾向線最良良適合線を追加します データの相関性に傾向

線を追加すると結果がより明瞭になります

ndash  フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます

ndash  情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります

3413

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒6 Show Me gt ガントチャート

bull  ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です

bull  プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます

bull  応用例ndash  色を追加するガント チャート内のバーの色を変えるこ

とで変数の重要側面をすばやく 伝えることができますndash  マップや他の種類のチャートをガントチャートと組み合わ

せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます

3513

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒7 Show Me gt バブルチャート

bull  バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください

bull  様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す

bull  例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率

bull  応用例ndash  散布図のデータを強調する 各データ ポイントのサイズ

や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます

ndash  マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります

3613

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒8 Show Me gt ヒストグラムbull  ヒストグラムはグループ間でのデータの分散を表示

する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです

bull  データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます

bull  データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます

bull  例例ndash  データのグループ化をテストする データに合ったグ

ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます

ndash  フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります

3713

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒9 Show Me gt ブレットグラフbull  目標がある場合その目標までの進行行状況を追跡するにはブレッ

トグラフが適しています

bull  本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです

bull  ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します

bull  ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)

bull  例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)

bull  応用例例ndash  色を使用して達成のしきい値を示すプライマリメジャーの背景に赤

黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます

ndash  概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます

3813

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒10 Show Me gt ヒートマップ

bull  ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます

bull  例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード

bull  応用例ndash  四角形のサイズを変えますヒート マップでは四角形

のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます

ndash  四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります

3913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒11 Show Me gt ハイライト表

bull  ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます

bull  例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口

bull  応用例例ndash  ハイライト表を他の種類のチャートと組み合わせる たと

えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります

4013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 9: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒5 データストアの急増

913

bull  その昔組織には様々ななタイプのデータがありましたbull  CRMデータ販売時点データ電子メールなど組織の経営

陣は多大な努力力を払いすべてのデータを1つの自社の高速なデータウェアハウスに保存していました

bull  2014年年にはこれがおとぎ話となりますすべてのデータはFluentd ベースの Treasure Agent を通じて一元的に収集管理理できまたトレジャーストレージはあらゆるデータの共存を容易易に実現しています

bull  トレジャーを初めとするデータや作業負荷に適したデータストアは解決すべき問題ではなく優れた IT 組織の特徴の 1 つとなります データ ストアの急増その昔組織にはさまざまなタイプのデータがありましたCRM データ販売時点データ電子メールなど組織の経営陣は多大な努力を払いすべてのデータを 1 つの高速なデータ ウェアハウスに保存していました

2013 年にはこれがおとぎ話となりますすべてのデータを 1 か所に保管する組織はもはや存在しませんさらに1 か所に保管する理由もなくなります大量のデータは Teradata や Hadoop などの場所に保管できます取引データは Oracle や SQL Server に保管できますデータや作業負荷に適したデータ ストアは解決すべき問題ではなく優れた IT 組織の特徴の 1 つとなります

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒6 自立性が新しいセルフサービスに

1013

bull  セルフ サービス BI はビジネス ユーザーがより優れた決定を行行うために必要なデータを分析できるようにするという考え方です

bull  自立立性はこの概念念の時代の到来ですこれはndash  ビジネス ユーザーが適切切なデータにアクセスできること

ndash  そのデータが 使用可能な形式と場所にあること

ndash  またビジネス ユーザーにセルフサービス分析が可能なソリューションがあること

を意味します

bull  これらすべてが実現できればビジネス ユーザーはビジネス上の問題に自分で対応できIT は安全なデータとそれにア クセスするためのソリューションの提供に集中することができます

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒7 コラボレーションは機能でなく現実に

1113

bull  ビジネスインテリジェンスソリューションではよくコラボレーション機能が盛んに宣伝されてきましたが2014年年にはそれだけでは十分でなくなります

bull  コラボレーションはビジネス インテリジェンスの導入の本質でなければなりません

bull  ビジネ スに関する質問のやり取りといった共有体験なくしてビジネスインテリジェンスは存在し得ないためです

bull  2014 年年には企業は問題の理理解と解決に向けた共同作業に組織全体の人を関与させるための方法を追求するようになります

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

1213

a  Tableau Desktopb  Tableau Readerc  Tableau Serverd  Tableau Public

Copyright copy2014 Treasure Data All Rights Reserved

2 ビジネスが抱える課題

1  上層部から分析を要求されているndash  幹部チームからもっとデータ主導型企業になるよう要求されているけれども具体的な施策が見つからない

2  大量量のレポートの要求を受け続けているndash  終わらないまま毎日増え続けるリストにうんざりしお手上げ状態である

ndash  優秀な分析チームも最善を尽くし少なくともリクエストに優先順位を付けて作業することは可能ですがその場合は優先度度の高いものだけが処理理されその他のものは手つかずに終わる可能性があります

3  レポートを提出することでさらに必要なレポートが増えていくndash  レポートの作成前に必要な内容をすべて確認したにもかかわらずフォローアップの質問は途切切れることがありません

ndash  あなたのレポート内容に人々が惹きつけられたということでもありますがその後の度度重なる質問に回答するため再度度チーム内に聞いて回っていては 非効率率率的です

4  データが古いことにフラストレーションを感じているndash  レポートを要求しレポートを待ちそのレポートに 関する質問を投げかけるというサイクルで避けられない問題の 1

つにデータが最新でなくなるという点があります

ndash  ビジネスにおいてもプライベートにおいても現代の世界では「すぐに満足感を得たい」という風潮がありますこのように待ち時間が多くてはその期待には応えられません

1313

Copyright copy2014 Treasure Data All Rights Reserved

2 ビジネスが抱える課題5  マッシュアップしたデータを要求される

ndash  実際に「マッシュアップ」という単語が使われていないかもしれませんが「サードパーティのデータも追加してくれないか」 「Excel ファイルに大量量のデータがあるがそれがこれとどう関係しているのかが見見たい」など要求されていませんか

ndash  複数のデータソースを組み合わせることの有用性は分かっていても一元管理理された BI チームでこのような調整を行行うのは容易易ではありません

6  視覚的分析を求めているndash  人間は行行や列列表を見見 る よりも分かりやすい視覚的な形でデータを見見た方が多くの情報を認識識できます

ndash  まだ視覚的データを要求されてい なくても近いうちに要求されるようになるはずです

ndash  それ がセルフサービスBIとどう関係するのかデータを様々な形で見見ることができれば疑問に対する新たな視点を求められることがなくなります

7  すでに一部で使用しているndash  全てに当てはまるわけではありませんが多くの企業がすでにセルフサービスBIを独自に採用しています

ndash  才覚のあるビジネスリーダーはチームの処理理能力力の限界を把握し彼らが非常に優秀で優れたプロジェクトを運営できることを認識識しています

ndash  その結果独自のセルフサービスBIを採用するケースが多く見見られます

ndash  ITリーダーにとって希望の兆しとなるのはその導入によってすばらしい結果が生み出されることでセルフサービス BI の取り組みをサポートする支援者を 得られるという点です

1413

Copyright copy2014 Treasure Data All Rights Reserved

2 回避したい7つの間違い1  複雑すぎるスタート

ndash  野心的になりすぎてすべてのビジネス課題を網羅羅する詳細すぎるリアルタイムのダッシュボードを作成しユーザーにたくさんの詳細オプションを提供することは簡単です

ndash  「完璧」なダッシュボードを作成するために何週間も何ヶ月も時間を費やさないでくださいその代わり試作品とテスト調整の短いサイクルで作業します

2  誰も理理解できない指標を使用するndash  あなたにとってつじつまが合う指標の表示方法やラベル付け方法は他の人にとってもそうでしょうか

ndash  あなたは指標を熟知しているので別のものと検証するステップはいらないかもしれません

ndash  指標がダッシュボードの目標をサポートするだけ でなく閲覧者が理理解できるようにする必要があります

3  重要でないグラフィックや分かりにくいウィジェットで乱雑なダッシュボードにするndash  ゲージのようなグラフィックやウィジェットでダッシュボードを派手にデザインしすぎないようにします

ndash  こうしたものは見見た目は良良いですが迅速かつ簡単に閲覧者に知らせるというダッシュボードの目的が妨げられる場合がありますダッシュボードは見見た目をシンプルに抑えてください

4  複雑なテクノロジーや大きなビジネス インテリジェンス展開プロジェクトを待つndash  従来のビジネス インテリジェンス (BI) の実装は最初の予測よりも長くかかる場合があります従来の BI プロジェクト

が実現するまで待つと何ヶ月も何年年も遅れる場合がありますすぐにダッシュボードを構築して配布できるアプリケーションを使用してください

1513

Copyright copy2014 Treasure Data All Rights Reserved

2 回避したい7つの間違い

5  ダッシュボードの作成と維持のための時間とリソースを過小評価するndash  ダッシュボードの展開は1回で終わる作業ではありません

ndash  指標に関連性がありデータが最新であるかを閲覧者と確認 することを怠ると誰も使用しなくなります定期的にダッシュボードの実用性を確認してください

6  指標と目標が一致しないndash  ダッシュボードは大きな目標に接続するとより強力力になります部署内の主な指標が組織全体としての成功に反映しない

ダッシュボードを作成してしまうことのないようにします

7  効果的でないデザインの悪いグラフやチャートを使うndash  グラフやチャートをデザインする際は気をつける必要があります

ndash  たとえば3D チャートで閲覧者の理理解が増すことはありません派手な色が解釈の邪魔になることもあります円グラフは値が6つ以上ある場合は特に効果的とは言えません

ndash  優れたビジュアライゼーションのデザインは「6 Tableau Best Practice」を参照してください

1613

Copyright copy2014 Treasure Data All Rights Reserved

2 Tableauの特徴

1713

p4

ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI 二分に満たしていたためです 4700 人以上の従業員用に

同院では Tableau の超高速処理ビジネス インテリジェンス ソリューションを組織全体 (病院研究施設財団法人) に導入しました

特定の人が適切な時間管理のために病院内にいる必要はありません誰もが時間管理を改善したいと考えていますビジネス ユーザーにも IT 部門にも時間節約のニーズがあります超高速処理 BI を導入すれば大規模な BI プロジェクトでも長引くことはなくなりますビジネス ユーザーが実際に使用できる成果物を得られるまで数か月場合によっては数年かかるような事態に陥ることはなくなりますまたExcel でのレポート作成と共有という不便な環境を強いられることもなくなります

次のいずれかの質問に当てはまる場合既存の BI システムは想定された速度で機能していない bull ビジネス インテリジェンス ソリューションの導入または変更に数週間から数か月かかりますか

bull レポートやダッシュボードの作成または変更に IT 部門への依頼が必要でありIT 部門による対応待ちや未処理の状態になったりしますか

bull BI ソリューションでは新しいユーザーが初めてダッシュボードまたはレポートを作成してパブリッシュできるようになるまでトレーニングに数日または数週間かかりますか

bull BI ソリューションは綿密なスケジュールやシステムの

パフォーマンス低下の場合の回避策に依存していますか

bull 企業のデータ ウェアハウスや高速データベースに多額の投資を行っていてもBI ソリューションによりデータの複製が必要になりますか

bull BI ソリューションでは統合前の特殊な作業を行わないとデータにアクセスできませんか

bull リレーショナル データベース以外に保存されている生データや非構造化データを含め複数のソースからのデータをブレンドできることに制約はありませんか

これまでのビジネス インテリジェンス ソフトウェアは導入に時間がかかります購入に数か月実装に数か月以上かかりますユーザーのトレーニングには数週間かかり高いコストもかかります開発者はビジネス ユーザーに要望を聞きその結果を持ち帰ってレポートを作成します変更の反映には何度かの確認とやり直しを経て数週間かかります2 つのデータ ソースを組み合わせるためにITはそれらの両方を収容する新しいデータ リポジトリを構築する必要がありますその後開発者は再びレポート作成のプログラミングに取り組みますこれでは導入プロセス全体が大幅に停滞しているように感じられます

超高速処理ビジネス インテリジェンスの場合と比べてみましょうこの場合まずトライアル版ソフトウェアをダウンロードしてインストールしますスプレッドシートやリレーショナル データベースからキューブHadoop などに至るまであらゆる種類のデータにアクセスしますこの操作はワンクリックで可能です高速データ ストアにライブ接続するか抽出データを高速データ エンジンにインポートするかを選

図 1 データ ワークフローのあらゆる段階で高速化

これまでのビジネス インテリジェンスと比べて超高速処理分析ではソフトウェアのインストールからデータへのアクセス複雑な情報の

分析インタラクティブなダッシュボードのパブリッシュ組織全体での共有に至るまでワークフローのあらゆる段階でその処理速度は

10 ~ 100 倍高速です

Install Access Analyze Publish Share

10 X 100 TIMES FASTER

p14

ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI

Tableau 超高速処理ビジネス インテリジェンスの背景テクノロジー超高速処理ビジネス インテリジェンスを文字どおり超高速にしている要因は何でしょうかそれは VizQLtrade ですTableau のこの特許取得済みのクエリ言語により簡単なドラッグ アンド ドロップ操作であらゆる規模トピック形式のデータを視覚化できますVizQL はユーザーによる操作をデータベース クエリに変換した後その応答をグラフィカルに表現しますその結果新しいデータベースおよびスプレッドシートのまったく新しい操作方法が生まれました視覚化計算がサポートされているためインタラクティブな質問と回答を通じてデータのさまざまなビューを繰り返し生成することができます

VizQL に続く超高速処理ビジネス インテリジェンスの次の画期的なテクノロジーはTableau のダイレクト接続 amp クエリ機能を使用して既存のデータベースに高速にアクセスして活用できるというものでしたビッグデータを含めほぼすべてのデータ ソースに対して最適化されたコネクタを使用することでTableau では専門知識を必要とせずにライブ データ ソースへのクエリと接続が可能です

ldquoTableau を使用して昨年度は収益が 2 増加しましたこれは 2 億米ドルに相当します航空または運送業界で収益を挙げたいと考えるならばTableau の使用をお勧めしますrdquo

China Eastern Airlines 社ネットワーキングおよび収益部門上級管理

者James Pu 氏

しかしTableau の進化はまだ続きますライブ データ ソースに接続できないときや接続したくないときのためにTableau にはビルトイン データ エンジンを使用して数百万行のデータのアド ホック分析を数秒で実行できる機能が用意されていますTableau のビルトイン データ エンジンは膨大なデータの高速処理が可能であるためビュー間を簡単に切り替えて意味のある傾向や外れ値を検出できますデータ エンジンは PC 上で動作する高性能のインメモリ分析データベースですデータ エンジンにより低速のデータ ソースを高速化できますさらにその速度を活か

して高速のデータ ストアに直接接続することもできますもちろんこれらの 2 つのデータ アクセス方式 (ライブ接続とインメモリ) の間には完全な互換性がありますアクセス方式がライブ接続かインメモリかにかかわらず複数のデータ ソースをブレンドし組み合わせることができます

Databases Cubes Spreadsheets Hadoop amp More

In-Memory Data Live Connection

PC Browser iPad AndroidDesktop

図 10 Tableau アーキテクチャTableau のアーキテクチャには膨大なデータ ソースに対応する

ためにインメモリとライブ接続という 2 つの方法が用意されて

います

最後に 結論企業や公共機関がビジネス インテリジェンスに求めるものには大きな変化が生じていますこれまでの BI の処理は低速で膨大なリソースが必要ですたとえばSeattle Childrenrsquos Hospital に家族が病気の子供を 連れて行くとしましょう家族は一刻も早く子供を診察してもらいたいと思うでしょう速度の重要性は病院に限られることではありません競争の激しい市場では企業は販売促進やコスト削減のために数か月も待つことはできませんたとえばM Financial Group 社は競合他社より勝るペースで北米で最も認知度と評価度の高い保険ブランドの 2000 万米ドルを超える有標製品を発売しましたTableau を使用して私は膨大なデータ セットをドリルダウンしすぐにリレーシ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

uarr 導入から分析共有までのサイクルが10〜~100倍速いです larrあらゆるデータソース(インプット)あらゆる端末(アウトプット)をTableauが繋ぎます darrTableau Desktop で作成したレポートをすぐにパブリックにできます

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒a Tableau Desktop

bull  考える速さで分析するndash  データに接続しコードを1行行も書かずにクエリを実行行できます

ndash  ドラッグアンドドロップを使用したビュー間の直感に沿った移動が可能ですndash  ペタバイト単位または何十億行行ものデータを測定するかどうかに関わらずTableau は可能な限り高速に動作するように構築さ

れています

ndash  Windows Macemsp 両対応(ver 82)

ndash  Tablesu Desktop のインプットソースとして無尽蔵の Treasure ストレージを選択可能ビッグデータをマウスでアドホックに扱えます

1813

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒b Tableau Reader

bull  Tableau Reader はTableau Desktopで作成したビジュアライゼーションを開いて表示できる無料料のデスクトップアプリケーションです

bull  Tableau Reader ではデータを含むTableau Desktopで作成したビジュアライゼーションを開いて操作可能です

bull  作成者の許可の範囲内であればデータをフィルタードリルダウン表示が可能です

bull  作成者によって組み込まれていない場合は操作を編集したり実行行したりすることは不不可能です

bull  Window Mac 両対応

1913

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒c Tableau Server

bull  作成したダッシュボードをWEBアプリ化する事でどこからでもどのデバイスでも分析出来るようになります

bull  データソースへの接続を Tableau Server に集約することによりデータの共有データマートとしての利利用が可能になります

2013

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒d Tableau Public

bull  導入利利用は無料料です

bull  接続出来るデータの種類に制限されます

bull  EXCELテキスト等接続データソースに制限です

bull  利利用出来る行行数データサイズに(100万行行1GB)制約があります

bull  一般公開を前提としたサービスです

2113

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

2213

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2313

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2413

ディメンションbull  定性的な情報やカテゴリ情報を含むフィール

ドを『ディメンション』として扱います

bull  テキストや日付の値を持つフィールドもこれらに含まれます

bull  行行または列列の棚にドラッグドロップをする事でヘッダを生成します

メジャーbull  行行または列列の棚にドラッグドロップを行行う

と『軸』を生成します

bull  デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2513

フィルタ

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2613

マーク gt カラー

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2713

マーク gt サイズ マーク gt ラベル

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  テキストテーブル(text tables)b  ヒートマップ(heat maps)c  ハイライトテーブル(highlight tables)d  記号マップ(symbol maps)e  色塗りマップ(filled maps)f  円グラフ(pie charts)g  水平棒グラフ(horizontal bars)h  積み上げ棒グラフ(stacked bars)i  並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j  ツリーマップ(tree maps)k  円ビュー(circle views)l  並列列円(side-‐‑‒by-‐‑‒side circles)

2813

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  線グラフ連続(lines continuous)b  線グラフ不不連続(lines discrete)c  二重線(dual lines)d  エリアチャート連続(area charts continuous)e  エリアチャート不不連続(area charts discrete)f  2つの組み合わせ(dual combination)g  散布図(scatter plots)h  ヒストグラム(histgram)i  箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j  ガントビュー(gantt view)k  ブレットグラフ(bullet graphs)l  パックバブル(packed bubbles)

2913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒1 Show Me gt 棒グラフ

bull  ひと目で最高値と最低値を見見ることができます

bull  棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます

bull  例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較

bull  応用例例ndash  1つのダッシュボードに複数の棒グラフを使用多数のス

プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります

ndash  棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます

ndash  積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です

ndash  棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます

ndash  バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります

3013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒2 Show Me gt 折れ線グラフ

bull  折れ線グラフは個々の数値データ ポイントを「線」で結びます

bull  それにより値の連続性をわかりやすく視覚化することが可能です

bull  主に一定期間にわたる傾向を表す際に使用します

bull  応用例例ndash  折れ線グラフと棒グラフを組み併せ特定の株価の1日あ

たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます

ndash  線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます

3113

7HFKHDGVampDSLWDO5DLVHGLQ

Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1

$0

$5000

$10000

$15000

$20000

$25000

$30000

$35000

Run

ning

Sum

of O

ffer A

mou

nt (i

n m

il)

7HFKQRORJ

(QHUJ

+HDOWKampDUH

ampRQVXPHU

XVLQHVV6HUYLFHV5HDO(VWDWH

6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV

ampOLFNKHUHWRFOHDUILOWHU

5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒3 Show Me gt 円グラフ

bull  円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです

bull  円グラフは最も誤用されやすいグラフです

bull  データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします

bull  円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように

bull  例例比率率率を表す

bull  応用例ndash  円の扇形を6つまでに制限します比率率率が6つ以上ある場

合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります

ndash  円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします

3213

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒4 Show Me gt マップ

bull  郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります

bull  例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域

bull  応用例例ndash  マップを他の種類のチャートグラフ表のフィルターと

して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます

ndash  マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます

3313

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒5 Show Me gt 散布図

bull  一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます

bull  例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料

bull  応用例 ndash  傾向線最良良適合線を追加します データの相関性に傾向

線を追加すると結果がより明瞭になります

ndash  フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます

ndash  情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります

3413

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒6 Show Me gt ガントチャート

bull  ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です

bull  プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます

bull  応用例ndash  色を追加するガント チャート内のバーの色を変えるこ

とで変数の重要側面をすばやく 伝えることができますndash  マップや他の種類のチャートをガントチャートと組み合わ

せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます

3513

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒7 Show Me gt バブルチャート

bull  バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください

bull  様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す

bull  例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率

bull  応用例ndash  散布図のデータを強調する 各データ ポイントのサイズ

や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます

ndash  マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります

3613

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒8 Show Me gt ヒストグラムbull  ヒストグラムはグループ間でのデータの分散を表示

する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです

bull  データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます

bull  データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます

bull  例例ndash  データのグループ化をテストする データに合ったグ

ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます

ndash  フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります

3713

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒9 Show Me gt ブレットグラフbull  目標がある場合その目標までの進行行状況を追跡するにはブレッ

トグラフが適しています

bull  本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです

bull  ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します

bull  ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)

bull  例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)

bull  応用例例ndash  色を使用して達成のしきい値を示すプライマリメジャーの背景に赤

黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます

ndash  概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます

3813

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒10 Show Me gt ヒートマップ

bull  ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます

bull  例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード

bull  応用例ndash  四角形のサイズを変えますヒート マップでは四角形

のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます

ndash  四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります

3913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒11 Show Me gt ハイライト表

bull  ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます

bull  例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口

bull  応用例例ndash  ハイライト表を他の種類のチャートと組み合わせる たと

えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります

4013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 10: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒6 自立性が新しいセルフサービスに

1013

bull  セルフ サービス BI はビジネス ユーザーがより優れた決定を行行うために必要なデータを分析できるようにするという考え方です

bull  自立立性はこの概念念の時代の到来ですこれはndash  ビジネス ユーザーが適切切なデータにアクセスできること

ndash  そのデータが 使用可能な形式と場所にあること

ndash  またビジネス ユーザーにセルフサービス分析が可能なソリューションがあること

を意味します

bull  これらすべてが実現できればビジネス ユーザーはビジネス上の問題に自分で対応できIT は安全なデータとそれにア クセスするためのソリューションの提供に集中することができます

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒7 コラボレーションは機能でなく現実に

1113

bull  ビジネスインテリジェンスソリューションではよくコラボレーション機能が盛んに宣伝されてきましたが2014年年にはそれだけでは十分でなくなります

bull  コラボレーションはビジネス インテリジェンスの導入の本質でなければなりません

bull  ビジネ スに関する質問のやり取りといった共有体験なくしてビジネスインテリジェンスは存在し得ないためです

bull  2014 年年には企業は問題の理理解と解決に向けた共同作業に組織全体の人を関与させるための方法を追求するようになります

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

1213

a  Tableau Desktopb  Tableau Readerc  Tableau Serverd  Tableau Public

Copyright copy2014 Treasure Data All Rights Reserved

2 ビジネスが抱える課題

1  上層部から分析を要求されているndash  幹部チームからもっとデータ主導型企業になるよう要求されているけれども具体的な施策が見つからない

2  大量量のレポートの要求を受け続けているndash  終わらないまま毎日増え続けるリストにうんざりしお手上げ状態である

ndash  優秀な分析チームも最善を尽くし少なくともリクエストに優先順位を付けて作業することは可能ですがその場合は優先度度の高いものだけが処理理されその他のものは手つかずに終わる可能性があります

3  レポートを提出することでさらに必要なレポートが増えていくndash  レポートの作成前に必要な内容をすべて確認したにもかかわらずフォローアップの質問は途切切れることがありません

ndash  あなたのレポート内容に人々が惹きつけられたということでもありますがその後の度度重なる質問に回答するため再度度チーム内に聞いて回っていては 非効率率率的です

4  データが古いことにフラストレーションを感じているndash  レポートを要求しレポートを待ちそのレポートに 関する質問を投げかけるというサイクルで避けられない問題の 1

つにデータが最新でなくなるという点があります

ndash  ビジネスにおいてもプライベートにおいても現代の世界では「すぐに満足感を得たい」という風潮がありますこのように待ち時間が多くてはその期待には応えられません

1313

Copyright copy2014 Treasure Data All Rights Reserved

2 ビジネスが抱える課題5  マッシュアップしたデータを要求される

ndash  実際に「マッシュアップ」という単語が使われていないかもしれませんが「サードパーティのデータも追加してくれないか」 「Excel ファイルに大量量のデータがあるがそれがこれとどう関係しているのかが見見たい」など要求されていませんか

ndash  複数のデータソースを組み合わせることの有用性は分かっていても一元管理理された BI チームでこのような調整を行行うのは容易易ではありません

6  視覚的分析を求めているndash  人間は行行や列列表を見見 る よりも分かりやすい視覚的な形でデータを見見た方が多くの情報を認識識できます

ndash  まだ視覚的データを要求されてい なくても近いうちに要求されるようになるはずです

ndash  それ がセルフサービスBIとどう関係するのかデータを様々な形で見見ることができれば疑問に対する新たな視点を求められることがなくなります

7  すでに一部で使用しているndash  全てに当てはまるわけではありませんが多くの企業がすでにセルフサービスBIを独自に採用しています

ndash  才覚のあるビジネスリーダーはチームの処理理能力力の限界を把握し彼らが非常に優秀で優れたプロジェクトを運営できることを認識識しています

ndash  その結果独自のセルフサービスBIを採用するケースが多く見見られます

ndash  ITリーダーにとって希望の兆しとなるのはその導入によってすばらしい結果が生み出されることでセルフサービス BI の取り組みをサポートする支援者を 得られるという点です

1413

Copyright copy2014 Treasure Data All Rights Reserved

2 回避したい7つの間違い1  複雑すぎるスタート

ndash  野心的になりすぎてすべてのビジネス課題を網羅羅する詳細すぎるリアルタイムのダッシュボードを作成しユーザーにたくさんの詳細オプションを提供することは簡単です

ndash  「完璧」なダッシュボードを作成するために何週間も何ヶ月も時間を費やさないでくださいその代わり試作品とテスト調整の短いサイクルで作業します

2  誰も理理解できない指標を使用するndash  あなたにとってつじつまが合う指標の表示方法やラベル付け方法は他の人にとってもそうでしょうか

ndash  あなたは指標を熟知しているので別のものと検証するステップはいらないかもしれません

ndash  指標がダッシュボードの目標をサポートするだけ でなく閲覧者が理理解できるようにする必要があります

3  重要でないグラフィックや分かりにくいウィジェットで乱雑なダッシュボードにするndash  ゲージのようなグラフィックやウィジェットでダッシュボードを派手にデザインしすぎないようにします

ndash  こうしたものは見見た目は良良いですが迅速かつ簡単に閲覧者に知らせるというダッシュボードの目的が妨げられる場合がありますダッシュボードは見見た目をシンプルに抑えてください

4  複雑なテクノロジーや大きなビジネス インテリジェンス展開プロジェクトを待つndash  従来のビジネス インテリジェンス (BI) の実装は最初の予測よりも長くかかる場合があります従来の BI プロジェクト

が実現するまで待つと何ヶ月も何年年も遅れる場合がありますすぐにダッシュボードを構築して配布できるアプリケーションを使用してください

1513

Copyright copy2014 Treasure Data All Rights Reserved

2 回避したい7つの間違い

5  ダッシュボードの作成と維持のための時間とリソースを過小評価するndash  ダッシュボードの展開は1回で終わる作業ではありません

ndash  指標に関連性がありデータが最新であるかを閲覧者と確認 することを怠ると誰も使用しなくなります定期的にダッシュボードの実用性を確認してください

6  指標と目標が一致しないndash  ダッシュボードは大きな目標に接続するとより強力力になります部署内の主な指標が組織全体としての成功に反映しない

ダッシュボードを作成してしまうことのないようにします

7  効果的でないデザインの悪いグラフやチャートを使うndash  グラフやチャートをデザインする際は気をつける必要があります

ndash  たとえば3D チャートで閲覧者の理理解が増すことはありません派手な色が解釈の邪魔になることもあります円グラフは値が6つ以上ある場合は特に効果的とは言えません

ndash  優れたビジュアライゼーションのデザインは「6 Tableau Best Practice」を参照してください

1613

Copyright copy2014 Treasure Data All Rights Reserved

2 Tableauの特徴

1713

p4

ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI 二分に満たしていたためです 4700 人以上の従業員用に

同院では Tableau の超高速処理ビジネス インテリジェンス ソリューションを組織全体 (病院研究施設財団法人) に導入しました

特定の人が適切な時間管理のために病院内にいる必要はありません誰もが時間管理を改善したいと考えていますビジネス ユーザーにも IT 部門にも時間節約のニーズがあります超高速処理 BI を導入すれば大規模な BI プロジェクトでも長引くことはなくなりますビジネス ユーザーが実際に使用できる成果物を得られるまで数か月場合によっては数年かかるような事態に陥ることはなくなりますまたExcel でのレポート作成と共有という不便な環境を強いられることもなくなります

次のいずれかの質問に当てはまる場合既存の BI システムは想定された速度で機能していない bull ビジネス インテリジェンス ソリューションの導入または変更に数週間から数か月かかりますか

bull レポートやダッシュボードの作成または変更に IT 部門への依頼が必要でありIT 部門による対応待ちや未処理の状態になったりしますか

bull BI ソリューションでは新しいユーザーが初めてダッシュボードまたはレポートを作成してパブリッシュできるようになるまでトレーニングに数日または数週間かかりますか

bull BI ソリューションは綿密なスケジュールやシステムの

パフォーマンス低下の場合の回避策に依存していますか

bull 企業のデータ ウェアハウスや高速データベースに多額の投資を行っていてもBI ソリューションによりデータの複製が必要になりますか

bull BI ソリューションでは統合前の特殊な作業を行わないとデータにアクセスできませんか

bull リレーショナル データベース以外に保存されている生データや非構造化データを含め複数のソースからのデータをブレンドできることに制約はありませんか

これまでのビジネス インテリジェンス ソフトウェアは導入に時間がかかります購入に数か月実装に数か月以上かかりますユーザーのトレーニングには数週間かかり高いコストもかかります開発者はビジネス ユーザーに要望を聞きその結果を持ち帰ってレポートを作成します変更の反映には何度かの確認とやり直しを経て数週間かかります2 つのデータ ソースを組み合わせるためにITはそれらの両方を収容する新しいデータ リポジトリを構築する必要がありますその後開発者は再びレポート作成のプログラミングに取り組みますこれでは導入プロセス全体が大幅に停滞しているように感じられます

超高速処理ビジネス インテリジェンスの場合と比べてみましょうこの場合まずトライアル版ソフトウェアをダウンロードしてインストールしますスプレッドシートやリレーショナル データベースからキューブHadoop などに至るまであらゆる種類のデータにアクセスしますこの操作はワンクリックで可能です高速データ ストアにライブ接続するか抽出データを高速データ エンジンにインポートするかを選

図 1 データ ワークフローのあらゆる段階で高速化

これまでのビジネス インテリジェンスと比べて超高速処理分析ではソフトウェアのインストールからデータへのアクセス複雑な情報の

分析インタラクティブなダッシュボードのパブリッシュ組織全体での共有に至るまでワークフローのあらゆる段階でその処理速度は

10 ~ 100 倍高速です

Install Access Analyze Publish Share

10 X 100 TIMES FASTER

p14

ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI

Tableau 超高速処理ビジネス インテリジェンスの背景テクノロジー超高速処理ビジネス インテリジェンスを文字どおり超高速にしている要因は何でしょうかそれは VizQLtrade ですTableau のこの特許取得済みのクエリ言語により簡単なドラッグ アンド ドロップ操作であらゆる規模トピック形式のデータを視覚化できますVizQL はユーザーによる操作をデータベース クエリに変換した後その応答をグラフィカルに表現しますその結果新しいデータベースおよびスプレッドシートのまったく新しい操作方法が生まれました視覚化計算がサポートされているためインタラクティブな質問と回答を通じてデータのさまざまなビューを繰り返し生成することができます

VizQL に続く超高速処理ビジネス インテリジェンスの次の画期的なテクノロジーはTableau のダイレクト接続 amp クエリ機能を使用して既存のデータベースに高速にアクセスして活用できるというものでしたビッグデータを含めほぼすべてのデータ ソースに対して最適化されたコネクタを使用することでTableau では専門知識を必要とせずにライブ データ ソースへのクエリと接続が可能です

ldquoTableau を使用して昨年度は収益が 2 増加しましたこれは 2 億米ドルに相当します航空または運送業界で収益を挙げたいと考えるならばTableau の使用をお勧めしますrdquo

China Eastern Airlines 社ネットワーキングおよび収益部門上級管理

者James Pu 氏

しかしTableau の進化はまだ続きますライブ データ ソースに接続できないときや接続したくないときのためにTableau にはビルトイン データ エンジンを使用して数百万行のデータのアド ホック分析を数秒で実行できる機能が用意されていますTableau のビルトイン データ エンジンは膨大なデータの高速処理が可能であるためビュー間を簡単に切り替えて意味のある傾向や外れ値を検出できますデータ エンジンは PC 上で動作する高性能のインメモリ分析データベースですデータ エンジンにより低速のデータ ソースを高速化できますさらにその速度を活か

して高速のデータ ストアに直接接続することもできますもちろんこれらの 2 つのデータ アクセス方式 (ライブ接続とインメモリ) の間には完全な互換性がありますアクセス方式がライブ接続かインメモリかにかかわらず複数のデータ ソースをブレンドし組み合わせることができます

Databases Cubes Spreadsheets Hadoop amp More

In-Memory Data Live Connection

PC Browser iPad AndroidDesktop

図 10 Tableau アーキテクチャTableau のアーキテクチャには膨大なデータ ソースに対応する

ためにインメモリとライブ接続という 2 つの方法が用意されて

います

最後に 結論企業や公共機関がビジネス インテリジェンスに求めるものには大きな変化が生じていますこれまでの BI の処理は低速で膨大なリソースが必要ですたとえばSeattle Childrenrsquos Hospital に家族が病気の子供を 連れて行くとしましょう家族は一刻も早く子供を診察してもらいたいと思うでしょう速度の重要性は病院に限られることではありません競争の激しい市場では企業は販売促進やコスト削減のために数か月も待つことはできませんたとえばM Financial Group 社は競合他社より勝るペースで北米で最も認知度と評価度の高い保険ブランドの 2000 万米ドルを超える有標製品を発売しましたTableau を使用して私は膨大なデータ セットをドリルダウンしすぐにリレーシ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

uarr 導入から分析共有までのサイクルが10〜~100倍速いです larrあらゆるデータソース(インプット)あらゆる端末(アウトプット)をTableauが繋ぎます darrTableau Desktop で作成したレポートをすぐにパブリックにできます

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒a Tableau Desktop

bull  考える速さで分析するndash  データに接続しコードを1行行も書かずにクエリを実行行できます

ndash  ドラッグアンドドロップを使用したビュー間の直感に沿った移動が可能ですndash  ペタバイト単位または何十億行行ものデータを測定するかどうかに関わらずTableau は可能な限り高速に動作するように構築さ

れています

ndash  Windows Macemsp 両対応(ver 82)

ndash  Tablesu Desktop のインプットソースとして無尽蔵の Treasure ストレージを選択可能ビッグデータをマウスでアドホックに扱えます

1813

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒b Tableau Reader

bull  Tableau Reader はTableau Desktopで作成したビジュアライゼーションを開いて表示できる無料料のデスクトップアプリケーションです

bull  Tableau Reader ではデータを含むTableau Desktopで作成したビジュアライゼーションを開いて操作可能です

bull  作成者の許可の範囲内であればデータをフィルタードリルダウン表示が可能です

bull  作成者によって組み込まれていない場合は操作を編集したり実行行したりすることは不不可能です

bull  Window Mac 両対応

1913

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒c Tableau Server

bull  作成したダッシュボードをWEBアプリ化する事でどこからでもどのデバイスでも分析出来るようになります

bull  データソースへの接続を Tableau Server に集約することによりデータの共有データマートとしての利利用が可能になります

2013

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒d Tableau Public

bull  導入利利用は無料料です

bull  接続出来るデータの種類に制限されます

bull  EXCELテキスト等接続データソースに制限です

bull  利利用出来る行行数データサイズに(100万行行1GB)制約があります

bull  一般公開を前提としたサービスです

2113

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

2213

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2313

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2413

ディメンションbull  定性的な情報やカテゴリ情報を含むフィール

ドを『ディメンション』として扱います

bull  テキストや日付の値を持つフィールドもこれらに含まれます

bull  行行または列列の棚にドラッグドロップをする事でヘッダを生成します

メジャーbull  行行または列列の棚にドラッグドロップを行行う

と『軸』を生成します

bull  デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2513

フィルタ

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2613

マーク gt カラー

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2713

マーク gt サイズ マーク gt ラベル

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  テキストテーブル(text tables)b  ヒートマップ(heat maps)c  ハイライトテーブル(highlight tables)d  記号マップ(symbol maps)e  色塗りマップ(filled maps)f  円グラフ(pie charts)g  水平棒グラフ(horizontal bars)h  積み上げ棒グラフ(stacked bars)i  並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j  ツリーマップ(tree maps)k  円ビュー(circle views)l  並列列円(side-‐‑‒by-‐‑‒side circles)

2813

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  線グラフ連続(lines continuous)b  線グラフ不不連続(lines discrete)c  二重線(dual lines)d  エリアチャート連続(area charts continuous)e  エリアチャート不不連続(area charts discrete)f  2つの組み合わせ(dual combination)g  散布図(scatter plots)h  ヒストグラム(histgram)i  箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j  ガントビュー(gantt view)k  ブレットグラフ(bullet graphs)l  パックバブル(packed bubbles)

2913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒1 Show Me gt 棒グラフ

bull  ひと目で最高値と最低値を見見ることができます

bull  棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます

bull  例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較

bull  応用例例ndash  1つのダッシュボードに複数の棒グラフを使用多数のス

プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります

ndash  棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます

ndash  積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です

ndash  棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます

ndash  バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります

3013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒2 Show Me gt 折れ線グラフ

bull  折れ線グラフは個々の数値データ ポイントを「線」で結びます

bull  それにより値の連続性をわかりやすく視覚化することが可能です

bull  主に一定期間にわたる傾向を表す際に使用します

bull  応用例例ndash  折れ線グラフと棒グラフを組み併せ特定の株価の1日あ

たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます

ndash  線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます

3113

7HFKHDGVampDSLWDO5DLVHGLQ

Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1

$0

$5000

$10000

$15000

$20000

$25000

$30000

$35000

Run

ning

Sum

of O

ffer A

mou

nt (i

n m

il)

7HFKQRORJ

(QHUJ

+HDOWKampDUH

ampRQVXPHU

XVLQHVV6HUYLFHV5HDO(VWDWH

6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV

ampOLFNKHUHWRFOHDUILOWHU

5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒3 Show Me gt 円グラフ

bull  円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです

bull  円グラフは最も誤用されやすいグラフです

bull  データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします

bull  円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように

bull  例例比率率率を表す

bull  応用例ndash  円の扇形を6つまでに制限します比率率率が6つ以上ある場

合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります

ndash  円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします

3213

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒4 Show Me gt マップ

bull  郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります

bull  例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域

bull  応用例例ndash  マップを他の種類のチャートグラフ表のフィルターと

して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます

ndash  マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます

3313

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒5 Show Me gt 散布図

bull  一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます

bull  例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料

bull  応用例 ndash  傾向線最良良適合線を追加します データの相関性に傾向

線を追加すると結果がより明瞭になります

ndash  フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます

ndash  情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります

3413

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒6 Show Me gt ガントチャート

bull  ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です

bull  プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます

bull  応用例ndash  色を追加するガント チャート内のバーの色を変えるこ

とで変数の重要側面をすばやく 伝えることができますndash  マップや他の種類のチャートをガントチャートと組み合わ

せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます

3513

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒7 Show Me gt バブルチャート

bull  バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください

bull  様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す

bull  例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率

bull  応用例ndash  散布図のデータを強調する 各データ ポイントのサイズ

や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます

ndash  マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります

3613

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒8 Show Me gt ヒストグラムbull  ヒストグラムはグループ間でのデータの分散を表示

する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです

bull  データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます

bull  データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます

bull  例例ndash  データのグループ化をテストする データに合ったグ

ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます

ndash  フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります

3713

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒9 Show Me gt ブレットグラフbull  目標がある場合その目標までの進行行状況を追跡するにはブレッ

トグラフが適しています

bull  本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです

bull  ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します

bull  ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)

bull  例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)

bull  応用例例ndash  色を使用して達成のしきい値を示すプライマリメジャーの背景に赤

黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます

ndash  概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます

3813

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒10 Show Me gt ヒートマップ

bull  ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます

bull  例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード

bull  応用例ndash  四角形のサイズを変えますヒート マップでは四角形

のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます

ndash  四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります

3913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒11 Show Me gt ハイライト表

bull  ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます

bull  例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口

bull  応用例例ndash  ハイライト表を他の種類のチャートと組み合わせる たと

えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります

4013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 11: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

1-‐‑‒7 コラボレーションは機能でなく現実に

1113

bull  ビジネスインテリジェンスソリューションではよくコラボレーション機能が盛んに宣伝されてきましたが2014年年にはそれだけでは十分でなくなります

bull  コラボレーションはビジネス インテリジェンスの導入の本質でなければなりません

bull  ビジネ スに関する質問のやり取りといった共有体験なくしてビジネスインテリジェンスは存在し得ないためです

bull  2014 年年には企業は問題の理理解と解決に向けた共同作業に組織全体の人を関与させるための方法を追求するようになります

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

1213

a  Tableau Desktopb  Tableau Readerc  Tableau Serverd  Tableau Public

Copyright copy2014 Treasure Data All Rights Reserved

2 ビジネスが抱える課題

1  上層部から分析を要求されているndash  幹部チームからもっとデータ主導型企業になるよう要求されているけれども具体的な施策が見つからない

2  大量量のレポートの要求を受け続けているndash  終わらないまま毎日増え続けるリストにうんざりしお手上げ状態である

ndash  優秀な分析チームも最善を尽くし少なくともリクエストに優先順位を付けて作業することは可能ですがその場合は優先度度の高いものだけが処理理されその他のものは手つかずに終わる可能性があります

3  レポートを提出することでさらに必要なレポートが増えていくndash  レポートの作成前に必要な内容をすべて確認したにもかかわらずフォローアップの質問は途切切れることがありません

ndash  あなたのレポート内容に人々が惹きつけられたということでもありますがその後の度度重なる質問に回答するため再度度チーム内に聞いて回っていては 非効率率率的です

4  データが古いことにフラストレーションを感じているndash  レポートを要求しレポートを待ちそのレポートに 関する質問を投げかけるというサイクルで避けられない問題の 1

つにデータが最新でなくなるという点があります

ndash  ビジネスにおいてもプライベートにおいても現代の世界では「すぐに満足感を得たい」という風潮がありますこのように待ち時間が多くてはその期待には応えられません

1313

Copyright copy2014 Treasure Data All Rights Reserved

2 ビジネスが抱える課題5  マッシュアップしたデータを要求される

ndash  実際に「マッシュアップ」という単語が使われていないかもしれませんが「サードパーティのデータも追加してくれないか」 「Excel ファイルに大量量のデータがあるがそれがこれとどう関係しているのかが見見たい」など要求されていませんか

ndash  複数のデータソースを組み合わせることの有用性は分かっていても一元管理理された BI チームでこのような調整を行行うのは容易易ではありません

6  視覚的分析を求めているndash  人間は行行や列列表を見見 る よりも分かりやすい視覚的な形でデータを見見た方が多くの情報を認識識できます

ndash  まだ視覚的データを要求されてい なくても近いうちに要求されるようになるはずです

ndash  それ がセルフサービスBIとどう関係するのかデータを様々な形で見見ることができれば疑問に対する新たな視点を求められることがなくなります

7  すでに一部で使用しているndash  全てに当てはまるわけではありませんが多くの企業がすでにセルフサービスBIを独自に採用しています

ndash  才覚のあるビジネスリーダーはチームの処理理能力力の限界を把握し彼らが非常に優秀で優れたプロジェクトを運営できることを認識識しています

ndash  その結果独自のセルフサービスBIを採用するケースが多く見見られます

ndash  ITリーダーにとって希望の兆しとなるのはその導入によってすばらしい結果が生み出されることでセルフサービス BI の取り組みをサポートする支援者を 得られるという点です

1413

Copyright copy2014 Treasure Data All Rights Reserved

2 回避したい7つの間違い1  複雑すぎるスタート

ndash  野心的になりすぎてすべてのビジネス課題を網羅羅する詳細すぎるリアルタイムのダッシュボードを作成しユーザーにたくさんの詳細オプションを提供することは簡単です

ndash  「完璧」なダッシュボードを作成するために何週間も何ヶ月も時間を費やさないでくださいその代わり試作品とテスト調整の短いサイクルで作業します

2  誰も理理解できない指標を使用するndash  あなたにとってつじつまが合う指標の表示方法やラベル付け方法は他の人にとってもそうでしょうか

ndash  あなたは指標を熟知しているので別のものと検証するステップはいらないかもしれません

ndash  指標がダッシュボードの目標をサポートするだけ でなく閲覧者が理理解できるようにする必要があります

3  重要でないグラフィックや分かりにくいウィジェットで乱雑なダッシュボードにするndash  ゲージのようなグラフィックやウィジェットでダッシュボードを派手にデザインしすぎないようにします

ndash  こうしたものは見見た目は良良いですが迅速かつ簡単に閲覧者に知らせるというダッシュボードの目的が妨げられる場合がありますダッシュボードは見見た目をシンプルに抑えてください

4  複雑なテクノロジーや大きなビジネス インテリジェンス展開プロジェクトを待つndash  従来のビジネス インテリジェンス (BI) の実装は最初の予測よりも長くかかる場合があります従来の BI プロジェクト

が実現するまで待つと何ヶ月も何年年も遅れる場合がありますすぐにダッシュボードを構築して配布できるアプリケーションを使用してください

1513

Copyright copy2014 Treasure Data All Rights Reserved

2 回避したい7つの間違い

5  ダッシュボードの作成と維持のための時間とリソースを過小評価するndash  ダッシュボードの展開は1回で終わる作業ではありません

ndash  指標に関連性がありデータが最新であるかを閲覧者と確認 することを怠ると誰も使用しなくなります定期的にダッシュボードの実用性を確認してください

6  指標と目標が一致しないndash  ダッシュボードは大きな目標に接続するとより強力力になります部署内の主な指標が組織全体としての成功に反映しない

ダッシュボードを作成してしまうことのないようにします

7  効果的でないデザインの悪いグラフやチャートを使うndash  グラフやチャートをデザインする際は気をつける必要があります

ndash  たとえば3D チャートで閲覧者の理理解が増すことはありません派手な色が解釈の邪魔になることもあります円グラフは値が6つ以上ある場合は特に効果的とは言えません

ndash  優れたビジュアライゼーションのデザインは「6 Tableau Best Practice」を参照してください

1613

Copyright copy2014 Treasure Data All Rights Reserved

2 Tableauの特徴

1713

p4

ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI 二分に満たしていたためです 4700 人以上の従業員用に

同院では Tableau の超高速処理ビジネス インテリジェンス ソリューションを組織全体 (病院研究施設財団法人) に導入しました

特定の人が適切な時間管理のために病院内にいる必要はありません誰もが時間管理を改善したいと考えていますビジネス ユーザーにも IT 部門にも時間節約のニーズがあります超高速処理 BI を導入すれば大規模な BI プロジェクトでも長引くことはなくなりますビジネス ユーザーが実際に使用できる成果物を得られるまで数か月場合によっては数年かかるような事態に陥ることはなくなりますまたExcel でのレポート作成と共有という不便な環境を強いられることもなくなります

次のいずれかの質問に当てはまる場合既存の BI システムは想定された速度で機能していない bull ビジネス インテリジェンス ソリューションの導入または変更に数週間から数か月かかりますか

bull レポートやダッシュボードの作成または変更に IT 部門への依頼が必要でありIT 部門による対応待ちや未処理の状態になったりしますか

bull BI ソリューションでは新しいユーザーが初めてダッシュボードまたはレポートを作成してパブリッシュできるようになるまでトレーニングに数日または数週間かかりますか

bull BI ソリューションは綿密なスケジュールやシステムの

パフォーマンス低下の場合の回避策に依存していますか

bull 企業のデータ ウェアハウスや高速データベースに多額の投資を行っていてもBI ソリューションによりデータの複製が必要になりますか

bull BI ソリューションでは統合前の特殊な作業を行わないとデータにアクセスできませんか

bull リレーショナル データベース以外に保存されている生データや非構造化データを含め複数のソースからのデータをブレンドできることに制約はありませんか

これまでのビジネス インテリジェンス ソフトウェアは導入に時間がかかります購入に数か月実装に数か月以上かかりますユーザーのトレーニングには数週間かかり高いコストもかかります開発者はビジネス ユーザーに要望を聞きその結果を持ち帰ってレポートを作成します変更の反映には何度かの確認とやり直しを経て数週間かかります2 つのデータ ソースを組み合わせるためにITはそれらの両方を収容する新しいデータ リポジトリを構築する必要がありますその後開発者は再びレポート作成のプログラミングに取り組みますこれでは導入プロセス全体が大幅に停滞しているように感じられます

超高速処理ビジネス インテリジェンスの場合と比べてみましょうこの場合まずトライアル版ソフトウェアをダウンロードしてインストールしますスプレッドシートやリレーショナル データベースからキューブHadoop などに至るまであらゆる種類のデータにアクセスしますこの操作はワンクリックで可能です高速データ ストアにライブ接続するか抽出データを高速データ エンジンにインポートするかを選

図 1 データ ワークフローのあらゆる段階で高速化

これまでのビジネス インテリジェンスと比べて超高速処理分析ではソフトウェアのインストールからデータへのアクセス複雑な情報の

分析インタラクティブなダッシュボードのパブリッシュ組織全体での共有に至るまでワークフローのあらゆる段階でその処理速度は

10 ~ 100 倍高速です

Install Access Analyze Publish Share

10 X 100 TIMES FASTER

p14

ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI

Tableau 超高速処理ビジネス インテリジェンスの背景テクノロジー超高速処理ビジネス インテリジェンスを文字どおり超高速にしている要因は何でしょうかそれは VizQLtrade ですTableau のこの特許取得済みのクエリ言語により簡単なドラッグ アンド ドロップ操作であらゆる規模トピック形式のデータを視覚化できますVizQL はユーザーによる操作をデータベース クエリに変換した後その応答をグラフィカルに表現しますその結果新しいデータベースおよびスプレッドシートのまったく新しい操作方法が生まれました視覚化計算がサポートされているためインタラクティブな質問と回答を通じてデータのさまざまなビューを繰り返し生成することができます

VizQL に続く超高速処理ビジネス インテリジェンスの次の画期的なテクノロジーはTableau のダイレクト接続 amp クエリ機能を使用して既存のデータベースに高速にアクセスして活用できるというものでしたビッグデータを含めほぼすべてのデータ ソースに対して最適化されたコネクタを使用することでTableau では専門知識を必要とせずにライブ データ ソースへのクエリと接続が可能です

ldquoTableau を使用して昨年度は収益が 2 増加しましたこれは 2 億米ドルに相当します航空または運送業界で収益を挙げたいと考えるならばTableau の使用をお勧めしますrdquo

China Eastern Airlines 社ネットワーキングおよび収益部門上級管理

者James Pu 氏

しかしTableau の進化はまだ続きますライブ データ ソースに接続できないときや接続したくないときのためにTableau にはビルトイン データ エンジンを使用して数百万行のデータのアド ホック分析を数秒で実行できる機能が用意されていますTableau のビルトイン データ エンジンは膨大なデータの高速処理が可能であるためビュー間を簡単に切り替えて意味のある傾向や外れ値を検出できますデータ エンジンは PC 上で動作する高性能のインメモリ分析データベースですデータ エンジンにより低速のデータ ソースを高速化できますさらにその速度を活か

して高速のデータ ストアに直接接続することもできますもちろんこれらの 2 つのデータ アクセス方式 (ライブ接続とインメモリ) の間には完全な互換性がありますアクセス方式がライブ接続かインメモリかにかかわらず複数のデータ ソースをブレンドし組み合わせることができます

Databases Cubes Spreadsheets Hadoop amp More

In-Memory Data Live Connection

PC Browser iPad AndroidDesktop

図 10 Tableau アーキテクチャTableau のアーキテクチャには膨大なデータ ソースに対応する

ためにインメモリとライブ接続という 2 つの方法が用意されて

います

最後に 結論企業や公共機関がビジネス インテリジェンスに求めるものには大きな変化が生じていますこれまでの BI の処理は低速で膨大なリソースが必要ですたとえばSeattle Childrenrsquos Hospital に家族が病気の子供を 連れて行くとしましょう家族は一刻も早く子供を診察してもらいたいと思うでしょう速度の重要性は病院に限られることではありません競争の激しい市場では企業は販売促進やコスト削減のために数か月も待つことはできませんたとえばM Financial Group 社は競合他社より勝るペースで北米で最も認知度と評価度の高い保険ブランドの 2000 万米ドルを超える有標製品を発売しましたTableau を使用して私は膨大なデータ セットをドリルダウンしすぐにリレーシ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

uarr 導入から分析共有までのサイクルが10〜~100倍速いです larrあらゆるデータソース(インプット)あらゆる端末(アウトプット)をTableauが繋ぎます darrTableau Desktop で作成したレポートをすぐにパブリックにできます

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒a Tableau Desktop

bull  考える速さで分析するndash  データに接続しコードを1行行も書かずにクエリを実行行できます

ndash  ドラッグアンドドロップを使用したビュー間の直感に沿った移動が可能ですndash  ペタバイト単位または何十億行行ものデータを測定するかどうかに関わらずTableau は可能な限り高速に動作するように構築さ

れています

ndash  Windows Macemsp 両対応(ver 82)

ndash  Tablesu Desktop のインプットソースとして無尽蔵の Treasure ストレージを選択可能ビッグデータをマウスでアドホックに扱えます

1813

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒b Tableau Reader

bull  Tableau Reader はTableau Desktopで作成したビジュアライゼーションを開いて表示できる無料料のデスクトップアプリケーションです

bull  Tableau Reader ではデータを含むTableau Desktopで作成したビジュアライゼーションを開いて操作可能です

bull  作成者の許可の範囲内であればデータをフィルタードリルダウン表示が可能です

bull  作成者によって組み込まれていない場合は操作を編集したり実行行したりすることは不不可能です

bull  Window Mac 両対応

1913

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒c Tableau Server

bull  作成したダッシュボードをWEBアプリ化する事でどこからでもどのデバイスでも分析出来るようになります

bull  データソースへの接続を Tableau Server に集約することによりデータの共有データマートとしての利利用が可能になります

2013

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒d Tableau Public

bull  導入利利用は無料料です

bull  接続出来るデータの種類に制限されます

bull  EXCELテキスト等接続データソースに制限です

bull  利利用出来る行行数データサイズに(100万行行1GB)制約があります

bull  一般公開を前提としたサービスです

2113

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

2213

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2313

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2413

ディメンションbull  定性的な情報やカテゴリ情報を含むフィール

ドを『ディメンション』として扱います

bull  テキストや日付の値を持つフィールドもこれらに含まれます

bull  行行または列列の棚にドラッグドロップをする事でヘッダを生成します

メジャーbull  行行または列列の棚にドラッグドロップを行行う

と『軸』を生成します

bull  デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2513

フィルタ

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2613

マーク gt カラー

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2713

マーク gt サイズ マーク gt ラベル

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  テキストテーブル(text tables)b  ヒートマップ(heat maps)c  ハイライトテーブル(highlight tables)d  記号マップ(symbol maps)e  色塗りマップ(filled maps)f  円グラフ(pie charts)g  水平棒グラフ(horizontal bars)h  積み上げ棒グラフ(stacked bars)i  並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j  ツリーマップ(tree maps)k  円ビュー(circle views)l  並列列円(side-‐‑‒by-‐‑‒side circles)

2813

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  線グラフ連続(lines continuous)b  線グラフ不不連続(lines discrete)c  二重線(dual lines)d  エリアチャート連続(area charts continuous)e  エリアチャート不不連続(area charts discrete)f  2つの組み合わせ(dual combination)g  散布図(scatter plots)h  ヒストグラム(histgram)i  箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j  ガントビュー(gantt view)k  ブレットグラフ(bullet graphs)l  パックバブル(packed bubbles)

2913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒1 Show Me gt 棒グラフ

bull  ひと目で最高値と最低値を見見ることができます

bull  棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます

bull  例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較

bull  応用例例ndash  1つのダッシュボードに複数の棒グラフを使用多数のス

プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります

ndash  棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます

ndash  積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です

ndash  棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます

ndash  バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります

3013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒2 Show Me gt 折れ線グラフ

bull  折れ線グラフは個々の数値データ ポイントを「線」で結びます

bull  それにより値の連続性をわかりやすく視覚化することが可能です

bull  主に一定期間にわたる傾向を表す際に使用します

bull  応用例例ndash  折れ線グラフと棒グラフを組み併せ特定の株価の1日あ

たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます

ndash  線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます

3113

7HFKHDGVampDSLWDO5DLVHGLQ

Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1

$0

$5000

$10000

$15000

$20000

$25000

$30000

$35000

Run

ning

Sum

of O

ffer A

mou

nt (i

n m

il)

7HFKQRORJ

(QHUJ

+HDOWKampDUH

ampRQVXPHU

XVLQHVV6HUYLFHV5HDO(VWDWH

6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV

ampOLFNKHUHWRFOHDUILOWHU

5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒3 Show Me gt 円グラフ

bull  円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです

bull  円グラフは最も誤用されやすいグラフです

bull  データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします

bull  円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように

bull  例例比率率率を表す

bull  応用例ndash  円の扇形を6つまでに制限します比率率率が6つ以上ある場

合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります

ndash  円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします

3213

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒4 Show Me gt マップ

bull  郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります

bull  例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域

bull  応用例例ndash  マップを他の種類のチャートグラフ表のフィルターと

して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます

ndash  マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます

3313

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒5 Show Me gt 散布図

bull  一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます

bull  例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料

bull  応用例 ndash  傾向線最良良適合線を追加します データの相関性に傾向

線を追加すると結果がより明瞭になります

ndash  フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます

ndash  情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります

3413

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒6 Show Me gt ガントチャート

bull  ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です

bull  プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます

bull  応用例ndash  色を追加するガント チャート内のバーの色を変えるこ

とで変数の重要側面をすばやく 伝えることができますndash  マップや他の種類のチャートをガントチャートと組み合わ

せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます

3513

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒7 Show Me gt バブルチャート

bull  バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください

bull  様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す

bull  例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率

bull  応用例ndash  散布図のデータを強調する 各データ ポイントのサイズ

や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます

ndash  マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります

3613

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒8 Show Me gt ヒストグラムbull  ヒストグラムはグループ間でのデータの分散を表示

する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです

bull  データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます

bull  データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます

bull  例例ndash  データのグループ化をテストする データに合ったグ

ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます

ndash  フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります

3713

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒9 Show Me gt ブレットグラフbull  目標がある場合その目標までの進行行状況を追跡するにはブレッ

トグラフが適しています

bull  本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです

bull  ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します

bull  ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)

bull  例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)

bull  応用例例ndash  色を使用して達成のしきい値を示すプライマリメジャーの背景に赤

黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます

ndash  概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます

3813

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒10 Show Me gt ヒートマップ

bull  ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます

bull  例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード

bull  応用例ndash  四角形のサイズを変えますヒート マップでは四角形

のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます

ndash  四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります

3913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒11 Show Me gt ハイライト表

bull  ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます

bull  例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口

bull  応用例例ndash  ハイライト表を他の種類のチャートと組み合わせる たと

えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります

4013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 12: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

1213

a  Tableau Desktopb  Tableau Readerc  Tableau Serverd  Tableau Public

Copyright copy2014 Treasure Data All Rights Reserved

2 ビジネスが抱える課題

1  上層部から分析を要求されているndash  幹部チームからもっとデータ主導型企業になるよう要求されているけれども具体的な施策が見つからない

2  大量量のレポートの要求を受け続けているndash  終わらないまま毎日増え続けるリストにうんざりしお手上げ状態である

ndash  優秀な分析チームも最善を尽くし少なくともリクエストに優先順位を付けて作業することは可能ですがその場合は優先度度の高いものだけが処理理されその他のものは手つかずに終わる可能性があります

3  レポートを提出することでさらに必要なレポートが増えていくndash  レポートの作成前に必要な内容をすべて確認したにもかかわらずフォローアップの質問は途切切れることがありません

ndash  あなたのレポート内容に人々が惹きつけられたということでもありますがその後の度度重なる質問に回答するため再度度チーム内に聞いて回っていては 非効率率率的です

4  データが古いことにフラストレーションを感じているndash  レポートを要求しレポートを待ちそのレポートに 関する質問を投げかけるというサイクルで避けられない問題の 1

つにデータが最新でなくなるという点があります

ndash  ビジネスにおいてもプライベートにおいても現代の世界では「すぐに満足感を得たい」という風潮がありますこのように待ち時間が多くてはその期待には応えられません

1313

Copyright copy2014 Treasure Data All Rights Reserved

2 ビジネスが抱える課題5  マッシュアップしたデータを要求される

ndash  実際に「マッシュアップ」という単語が使われていないかもしれませんが「サードパーティのデータも追加してくれないか」 「Excel ファイルに大量量のデータがあるがそれがこれとどう関係しているのかが見見たい」など要求されていませんか

ndash  複数のデータソースを組み合わせることの有用性は分かっていても一元管理理された BI チームでこのような調整を行行うのは容易易ではありません

6  視覚的分析を求めているndash  人間は行行や列列表を見見 る よりも分かりやすい視覚的な形でデータを見見た方が多くの情報を認識識できます

ndash  まだ視覚的データを要求されてい なくても近いうちに要求されるようになるはずです

ndash  それ がセルフサービスBIとどう関係するのかデータを様々な形で見見ることができれば疑問に対する新たな視点を求められることがなくなります

7  すでに一部で使用しているndash  全てに当てはまるわけではありませんが多くの企業がすでにセルフサービスBIを独自に採用しています

ndash  才覚のあるビジネスリーダーはチームの処理理能力力の限界を把握し彼らが非常に優秀で優れたプロジェクトを運営できることを認識識しています

ndash  その結果独自のセルフサービスBIを採用するケースが多く見見られます

ndash  ITリーダーにとって希望の兆しとなるのはその導入によってすばらしい結果が生み出されることでセルフサービス BI の取り組みをサポートする支援者を 得られるという点です

1413

Copyright copy2014 Treasure Data All Rights Reserved

2 回避したい7つの間違い1  複雑すぎるスタート

ndash  野心的になりすぎてすべてのビジネス課題を網羅羅する詳細すぎるリアルタイムのダッシュボードを作成しユーザーにたくさんの詳細オプションを提供することは簡単です

ndash  「完璧」なダッシュボードを作成するために何週間も何ヶ月も時間を費やさないでくださいその代わり試作品とテスト調整の短いサイクルで作業します

2  誰も理理解できない指標を使用するndash  あなたにとってつじつまが合う指標の表示方法やラベル付け方法は他の人にとってもそうでしょうか

ndash  あなたは指標を熟知しているので別のものと検証するステップはいらないかもしれません

ndash  指標がダッシュボードの目標をサポートするだけ でなく閲覧者が理理解できるようにする必要があります

3  重要でないグラフィックや分かりにくいウィジェットで乱雑なダッシュボードにするndash  ゲージのようなグラフィックやウィジェットでダッシュボードを派手にデザインしすぎないようにします

ndash  こうしたものは見見た目は良良いですが迅速かつ簡単に閲覧者に知らせるというダッシュボードの目的が妨げられる場合がありますダッシュボードは見見た目をシンプルに抑えてください

4  複雑なテクノロジーや大きなビジネス インテリジェンス展開プロジェクトを待つndash  従来のビジネス インテリジェンス (BI) の実装は最初の予測よりも長くかかる場合があります従来の BI プロジェクト

が実現するまで待つと何ヶ月も何年年も遅れる場合がありますすぐにダッシュボードを構築して配布できるアプリケーションを使用してください

1513

Copyright copy2014 Treasure Data All Rights Reserved

2 回避したい7つの間違い

5  ダッシュボードの作成と維持のための時間とリソースを過小評価するndash  ダッシュボードの展開は1回で終わる作業ではありません

ndash  指標に関連性がありデータが最新であるかを閲覧者と確認 することを怠ると誰も使用しなくなります定期的にダッシュボードの実用性を確認してください

6  指標と目標が一致しないndash  ダッシュボードは大きな目標に接続するとより強力力になります部署内の主な指標が組織全体としての成功に反映しない

ダッシュボードを作成してしまうことのないようにします

7  効果的でないデザインの悪いグラフやチャートを使うndash  グラフやチャートをデザインする際は気をつける必要があります

ndash  たとえば3D チャートで閲覧者の理理解が増すことはありません派手な色が解釈の邪魔になることもあります円グラフは値が6つ以上ある場合は特に効果的とは言えません

ndash  優れたビジュアライゼーションのデザインは「6 Tableau Best Practice」を参照してください

1613

Copyright copy2014 Treasure Data All Rights Reserved

2 Tableauの特徴

1713

p4

ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI 二分に満たしていたためです 4700 人以上の従業員用に

同院では Tableau の超高速処理ビジネス インテリジェンス ソリューションを組織全体 (病院研究施設財団法人) に導入しました

特定の人が適切な時間管理のために病院内にいる必要はありません誰もが時間管理を改善したいと考えていますビジネス ユーザーにも IT 部門にも時間節約のニーズがあります超高速処理 BI を導入すれば大規模な BI プロジェクトでも長引くことはなくなりますビジネス ユーザーが実際に使用できる成果物を得られるまで数か月場合によっては数年かかるような事態に陥ることはなくなりますまたExcel でのレポート作成と共有という不便な環境を強いられることもなくなります

次のいずれかの質問に当てはまる場合既存の BI システムは想定された速度で機能していない bull ビジネス インテリジェンス ソリューションの導入または変更に数週間から数か月かかりますか

bull レポートやダッシュボードの作成または変更に IT 部門への依頼が必要でありIT 部門による対応待ちや未処理の状態になったりしますか

bull BI ソリューションでは新しいユーザーが初めてダッシュボードまたはレポートを作成してパブリッシュできるようになるまでトレーニングに数日または数週間かかりますか

bull BI ソリューションは綿密なスケジュールやシステムの

パフォーマンス低下の場合の回避策に依存していますか

bull 企業のデータ ウェアハウスや高速データベースに多額の投資を行っていてもBI ソリューションによりデータの複製が必要になりますか

bull BI ソリューションでは統合前の特殊な作業を行わないとデータにアクセスできませんか

bull リレーショナル データベース以外に保存されている生データや非構造化データを含め複数のソースからのデータをブレンドできることに制約はありませんか

これまでのビジネス インテリジェンス ソフトウェアは導入に時間がかかります購入に数か月実装に数か月以上かかりますユーザーのトレーニングには数週間かかり高いコストもかかります開発者はビジネス ユーザーに要望を聞きその結果を持ち帰ってレポートを作成します変更の反映には何度かの確認とやり直しを経て数週間かかります2 つのデータ ソースを組み合わせるためにITはそれらの両方を収容する新しいデータ リポジトリを構築する必要がありますその後開発者は再びレポート作成のプログラミングに取り組みますこれでは導入プロセス全体が大幅に停滞しているように感じられます

超高速処理ビジネス インテリジェンスの場合と比べてみましょうこの場合まずトライアル版ソフトウェアをダウンロードしてインストールしますスプレッドシートやリレーショナル データベースからキューブHadoop などに至るまであらゆる種類のデータにアクセスしますこの操作はワンクリックで可能です高速データ ストアにライブ接続するか抽出データを高速データ エンジンにインポートするかを選

図 1 データ ワークフローのあらゆる段階で高速化

これまでのビジネス インテリジェンスと比べて超高速処理分析ではソフトウェアのインストールからデータへのアクセス複雑な情報の

分析インタラクティブなダッシュボードのパブリッシュ組織全体での共有に至るまでワークフローのあらゆる段階でその処理速度は

10 ~ 100 倍高速です

Install Access Analyze Publish Share

10 X 100 TIMES FASTER

p14

ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI

Tableau 超高速処理ビジネス インテリジェンスの背景テクノロジー超高速処理ビジネス インテリジェンスを文字どおり超高速にしている要因は何でしょうかそれは VizQLtrade ですTableau のこの特許取得済みのクエリ言語により簡単なドラッグ アンド ドロップ操作であらゆる規模トピック形式のデータを視覚化できますVizQL はユーザーによる操作をデータベース クエリに変換した後その応答をグラフィカルに表現しますその結果新しいデータベースおよびスプレッドシートのまったく新しい操作方法が生まれました視覚化計算がサポートされているためインタラクティブな質問と回答を通じてデータのさまざまなビューを繰り返し生成することができます

VizQL に続く超高速処理ビジネス インテリジェンスの次の画期的なテクノロジーはTableau のダイレクト接続 amp クエリ機能を使用して既存のデータベースに高速にアクセスして活用できるというものでしたビッグデータを含めほぼすべてのデータ ソースに対して最適化されたコネクタを使用することでTableau では専門知識を必要とせずにライブ データ ソースへのクエリと接続が可能です

ldquoTableau を使用して昨年度は収益が 2 増加しましたこれは 2 億米ドルに相当します航空または運送業界で収益を挙げたいと考えるならばTableau の使用をお勧めしますrdquo

China Eastern Airlines 社ネットワーキングおよび収益部門上級管理

者James Pu 氏

しかしTableau の進化はまだ続きますライブ データ ソースに接続できないときや接続したくないときのためにTableau にはビルトイン データ エンジンを使用して数百万行のデータのアド ホック分析を数秒で実行できる機能が用意されていますTableau のビルトイン データ エンジンは膨大なデータの高速処理が可能であるためビュー間を簡単に切り替えて意味のある傾向や外れ値を検出できますデータ エンジンは PC 上で動作する高性能のインメモリ分析データベースですデータ エンジンにより低速のデータ ソースを高速化できますさらにその速度を活か

して高速のデータ ストアに直接接続することもできますもちろんこれらの 2 つのデータ アクセス方式 (ライブ接続とインメモリ) の間には完全な互換性がありますアクセス方式がライブ接続かインメモリかにかかわらず複数のデータ ソースをブレンドし組み合わせることができます

Databases Cubes Spreadsheets Hadoop amp More

In-Memory Data Live Connection

PC Browser iPad AndroidDesktop

図 10 Tableau アーキテクチャTableau のアーキテクチャには膨大なデータ ソースに対応する

ためにインメモリとライブ接続という 2 つの方法が用意されて

います

最後に 結論企業や公共機関がビジネス インテリジェンスに求めるものには大きな変化が生じていますこれまでの BI の処理は低速で膨大なリソースが必要ですたとえばSeattle Childrenrsquos Hospital に家族が病気の子供を 連れて行くとしましょう家族は一刻も早く子供を診察してもらいたいと思うでしょう速度の重要性は病院に限られることではありません競争の激しい市場では企業は販売促進やコスト削減のために数か月も待つことはできませんたとえばM Financial Group 社は競合他社より勝るペースで北米で最も認知度と評価度の高い保険ブランドの 2000 万米ドルを超える有標製品を発売しましたTableau を使用して私は膨大なデータ セットをドリルダウンしすぐにリレーシ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

uarr 導入から分析共有までのサイクルが10〜~100倍速いです larrあらゆるデータソース(インプット)あらゆる端末(アウトプット)をTableauが繋ぎます darrTableau Desktop で作成したレポートをすぐにパブリックにできます

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒a Tableau Desktop

bull  考える速さで分析するndash  データに接続しコードを1行行も書かずにクエリを実行行できます

ndash  ドラッグアンドドロップを使用したビュー間の直感に沿った移動が可能ですndash  ペタバイト単位または何十億行行ものデータを測定するかどうかに関わらずTableau は可能な限り高速に動作するように構築さ

れています

ndash  Windows Macemsp 両対応(ver 82)

ndash  Tablesu Desktop のインプットソースとして無尽蔵の Treasure ストレージを選択可能ビッグデータをマウスでアドホックに扱えます

1813

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒b Tableau Reader

bull  Tableau Reader はTableau Desktopで作成したビジュアライゼーションを開いて表示できる無料料のデスクトップアプリケーションです

bull  Tableau Reader ではデータを含むTableau Desktopで作成したビジュアライゼーションを開いて操作可能です

bull  作成者の許可の範囲内であればデータをフィルタードリルダウン表示が可能です

bull  作成者によって組み込まれていない場合は操作を編集したり実行行したりすることは不不可能です

bull  Window Mac 両対応

1913

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒c Tableau Server

bull  作成したダッシュボードをWEBアプリ化する事でどこからでもどのデバイスでも分析出来るようになります

bull  データソースへの接続を Tableau Server に集約することによりデータの共有データマートとしての利利用が可能になります

2013

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒d Tableau Public

bull  導入利利用は無料料です

bull  接続出来るデータの種類に制限されます

bull  EXCELテキスト等接続データソースに制限です

bull  利利用出来る行行数データサイズに(100万行行1GB)制約があります

bull  一般公開を前提としたサービスです

2113

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

2213

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2313

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2413

ディメンションbull  定性的な情報やカテゴリ情報を含むフィール

ドを『ディメンション』として扱います

bull  テキストや日付の値を持つフィールドもこれらに含まれます

bull  行行または列列の棚にドラッグドロップをする事でヘッダを生成します

メジャーbull  行行または列列の棚にドラッグドロップを行行う

と『軸』を生成します

bull  デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2513

フィルタ

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2613

マーク gt カラー

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2713

マーク gt サイズ マーク gt ラベル

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  テキストテーブル(text tables)b  ヒートマップ(heat maps)c  ハイライトテーブル(highlight tables)d  記号マップ(symbol maps)e  色塗りマップ(filled maps)f  円グラフ(pie charts)g  水平棒グラフ(horizontal bars)h  積み上げ棒グラフ(stacked bars)i  並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j  ツリーマップ(tree maps)k  円ビュー(circle views)l  並列列円(side-‐‑‒by-‐‑‒side circles)

2813

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  線グラフ連続(lines continuous)b  線グラフ不不連続(lines discrete)c  二重線(dual lines)d  エリアチャート連続(area charts continuous)e  エリアチャート不不連続(area charts discrete)f  2つの組み合わせ(dual combination)g  散布図(scatter plots)h  ヒストグラム(histgram)i  箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j  ガントビュー(gantt view)k  ブレットグラフ(bullet graphs)l  パックバブル(packed bubbles)

2913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒1 Show Me gt 棒グラフ

bull  ひと目で最高値と最低値を見見ることができます

bull  棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます

bull  例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較

bull  応用例例ndash  1つのダッシュボードに複数の棒グラフを使用多数のス

プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります

ndash  棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます

ndash  積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です

ndash  棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます

ndash  バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります

3013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒2 Show Me gt 折れ線グラフ

bull  折れ線グラフは個々の数値データ ポイントを「線」で結びます

bull  それにより値の連続性をわかりやすく視覚化することが可能です

bull  主に一定期間にわたる傾向を表す際に使用します

bull  応用例例ndash  折れ線グラフと棒グラフを組み併せ特定の株価の1日あ

たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます

ndash  線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます

3113

7HFKHDGVampDSLWDO5DLVHGLQ

Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1

$0

$5000

$10000

$15000

$20000

$25000

$30000

$35000

Run

ning

Sum

of O

ffer A

mou

nt (i

n m

il)

7HFKQRORJ

(QHUJ

+HDOWKampDUH

ampRQVXPHU

XVLQHVV6HUYLFHV5HDO(VWDWH

6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV

ampOLFNKHUHWRFOHDUILOWHU

5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒3 Show Me gt 円グラフ

bull  円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです

bull  円グラフは最も誤用されやすいグラフです

bull  データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします

bull  円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように

bull  例例比率率率を表す

bull  応用例ndash  円の扇形を6つまでに制限します比率率率が6つ以上ある場

合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります

ndash  円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします

3213

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒4 Show Me gt マップ

bull  郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります

bull  例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域

bull  応用例例ndash  マップを他の種類のチャートグラフ表のフィルターと

して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます

ndash  マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます

3313

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒5 Show Me gt 散布図

bull  一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます

bull  例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料

bull  応用例 ndash  傾向線最良良適合線を追加します データの相関性に傾向

線を追加すると結果がより明瞭になります

ndash  フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます

ndash  情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります

3413

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒6 Show Me gt ガントチャート

bull  ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です

bull  プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます

bull  応用例ndash  色を追加するガント チャート内のバーの色を変えるこ

とで変数の重要側面をすばやく 伝えることができますndash  マップや他の種類のチャートをガントチャートと組み合わ

せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます

3513

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒7 Show Me gt バブルチャート

bull  バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください

bull  様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す

bull  例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率

bull  応用例ndash  散布図のデータを強調する 各データ ポイントのサイズ

や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます

ndash  マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります

3613

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒8 Show Me gt ヒストグラムbull  ヒストグラムはグループ間でのデータの分散を表示

する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです

bull  データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます

bull  データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます

bull  例例ndash  データのグループ化をテストする データに合ったグ

ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます

ndash  フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります

3713

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒9 Show Me gt ブレットグラフbull  目標がある場合その目標までの進行行状況を追跡するにはブレッ

トグラフが適しています

bull  本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです

bull  ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します

bull  ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)

bull  例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)

bull  応用例例ndash  色を使用して達成のしきい値を示すプライマリメジャーの背景に赤

黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます

ndash  概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます

3813

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒10 Show Me gt ヒートマップ

bull  ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます

bull  例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード

bull  応用例ndash  四角形のサイズを変えますヒート マップでは四角形

のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます

ndash  四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります

3913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒11 Show Me gt ハイライト表

bull  ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます

bull  例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口

bull  応用例例ndash  ハイライト表を他の種類のチャートと組み合わせる たと

えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります

4013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 13: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

2 ビジネスが抱える課題

1  上層部から分析を要求されているndash  幹部チームからもっとデータ主導型企業になるよう要求されているけれども具体的な施策が見つからない

2  大量量のレポートの要求を受け続けているndash  終わらないまま毎日増え続けるリストにうんざりしお手上げ状態である

ndash  優秀な分析チームも最善を尽くし少なくともリクエストに優先順位を付けて作業することは可能ですがその場合は優先度度の高いものだけが処理理されその他のものは手つかずに終わる可能性があります

3  レポートを提出することでさらに必要なレポートが増えていくndash  レポートの作成前に必要な内容をすべて確認したにもかかわらずフォローアップの質問は途切切れることがありません

ndash  あなたのレポート内容に人々が惹きつけられたということでもありますがその後の度度重なる質問に回答するため再度度チーム内に聞いて回っていては 非効率率率的です

4  データが古いことにフラストレーションを感じているndash  レポートを要求しレポートを待ちそのレポートに 関する質問を投げかけるというサイクルで避けられない問題の 1

つにデータが最新でなくなるという点があります

ndash  ビジネスにおいてもプライベートにおいても現代の世界では「すぐに満足感を得たい」という風潮がありますこのように待ち時間が多くてはその期待には応えられません

1313

Copyright copy2014 Treasure Data All Rights Reserved

2 ビジネスが抱える課題5  マッシュアップしたデータを要求される

ndash  実際に「マッシュアップ」という単語が使われていないかもしれませんが「サードパーティのデータも追加してくれないか」 「Excel ファイルに大量量のデータがあるがそれがこれとどう関係しているのかが見見たい」など要求されていませんか

ndash  複数のデータソースを組み合わせることの有用性は分かっていても一元管理理された BI チームでこのような調整を行行うのは容易易ではありません

6  視覚的分析を求めているndash  人間は行行や列列表を見見 る よりも分かりやすい視覚的な形でデータを見見た方が多くの情報を認識識できます

ndash  まだ視覚的データを要求されてい なくても近いうちに要求されるようになるはずです

ndash  それ がセルフサービスBIとどう関係するのかデータを様々な形で見見ることができれば疑問に対する新たな視点を求められることがなくなります

7  すでに一部で使用しているndash  全てに当てはまるわけではありませんが多くの企業がすでにセルフサービスBIを独自に採用しています

ndash  才覚のあるビジネスリーダーはチームの処理理能力力の限界を把握し彼らが非常に優秀で優れたプロジェクトを運営できることを認識識しています

ndash  その結果独自のセルフサービスBIを採用するケースが多く見見られます

ndash  ITリーダーにとって希望の兆しとなるのはその導入によってすばらしい結果が生み出されることでセルフサービス BI の取り組みをサポートする支援者を 得られるという点です

1413

Copyright copy2014 Treasure Data All Rights Reserved

2 回避したい7つの間違い1  複雑すぎるスタート

ndash  野心的になりすぎてすべてのビジネス課題を網羅羅する詳細すぎるリアルタイムのダッシュボードを作成しユーザーにたくさんの詳細オプションを提供することは簡単です

ndash  「完璧」なダッシュボードを作成するために何週間も何ヶ月も時間を費やさないでくださいその代わり試作品とテスト調整の短いサイクルで作業します

2  誰も理理解できない指標を使用するndash  あなたにとってつじつまが合う指標の表示方法やラベル付け方法は他の人にとってもそうでしょうか

ndash  あなたは指標を熟知しているので別のものと検証するステップはいらないかもしれません

ndash  指標がダッシュボードの目標をサポートするだけ でなく閲覧者が理理解できるようにする必要があります

3  重要でないグラフィックや分かりにくいウィジェットで乱雑なダッシュボードにするndash  ゲージのようなグラフィックやウィジェットでダッシュボードを派手にデザインしすぎないようにします

ndash  こうしたものは見見た目は良良いですが迅速かつ簡単に閲覧者に知らせるというダッシュボードの目的が妨げられる場合がありますダッシュボードは見見た目をシンプルに抑えてください

4  複雑なテクノロジーや大きなビジネス インテリジェンス展開プロジェクトを待つndash  従来のビジネス インテリジェンス (BI) の実装は最初の予測よりも長くかかる場合があります従来の BI プロジェクト

が実現するまで待つと何ヶ月も何年年も遅れる場合がありますすぐにダッシュボードを構築して配布できるアプリケーションを使用してください

1513

Copyright copy2014 Treasure Data All Rights Reserved

2 回避したい7つの間違い

5  ダッシュボードの作成と維持のための時間とリソースを過小評価するndash  ダッシュボードの展開は1回で終わる作業ではありません

ndash  指標に関連性がありデータが最新であるかを閲覧者と確認 することを怠ると誰も使用しなくなります定期的にダッシュボードの実用性を確認してください

6  指標と目標が一致しないndash  ダッシュボードは大きな目標に接続するとより強力力になります部署内の主な指標が組織全体としての成功に反映しない

ダッシュボードを作成してしまうことのないようにします

7  効果的でないデザインの悪いグラフやチャートを使うndash  グラフやチャートをデザインする際は気をつける必要があります

ndash  たとえば3D チャートで閲覧者の理理解が増すことはありません派手な色が解釈の邪魔になることもあります円グラフは値が6つ以上ある場合は特に効果的とは言えません

ndash  優れたビジュアライゼーションのデザインは「6 Tableau Best Practice」を参照してください

1613

Copyright copy2014 Treasure Data All Rights Reserved

2 Tableauの特徴

1713

p4

ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI 二分に満たしていたためです 4700 人以上の従業員用に

同院では Tableau の超高速処理ビジネス インテリジェンス ソリューションを組織全体 (病院研究施設財団法人) に導入しました

特定の人が適切な時間管理のために病院内にいる必要はありません誰もが時間管理を改善したいと考えていますビジネス ユーザーにも IT 部門にも時間節約のニーズがあります超高速処理 BI を導入すれば大規模な BI プロジェクトでも長引くことはなくなりますビジネス ユーザーが実際に使用できる成果物を得られるまで数か月場合によっては数年かかるような事態に陥ることはなくなりますまたExcel でのレポート作成と共有という不便な環境を強いられることもなくなります

次のいずれかの質問に当てはまる場合既存の BI システムは想定された速度で機能していない bull ビジネス インテリジェンス ソリューションの導入または変更に数週間から数か月かかりますか

bull レポートやダッシュボードの作成または変更に IT 部門への依頼が必要でありIT 部門による対応待ちや未処理の状態になったりしますか

bull BI ソリューションでは新しいユーザーが初めてダッシュボードまたはレポートを作成してパブリッシュできるようになるまでトレーニングに数日または数週間かかりますか

bull BI ソリューションは綿密なスケジュールやシステムの

パフォーマンス低下の場合の回避策に依存していますか

bull 企業のデータ ウェアハウスや高速データベースに多額の投資を行っていてもBI ソリューションによりデータの複製が必要になりますか

bull BI ソリューションでは統合前の特殊な作業を行わないとデータにアクセスできませんか

bull リレーショナル データベース以外に保存されている生データや非構造化データを含め複数のソースからのデータをブレンドできることに制約はありませんか

これまでのビジネス インテリジェンス ソフトウェアは導入に時間がかかります購入に数か月実装に数か月以上かかりますユーザーのトレーニングには数週間かかり高いコストもかかります開発者はビジネス ユーザーに要望を聞きその結果を持ち帰ってレポートを作成します変更の反映には何度かの確認とやり直しを経て数週間かかります2 つのデータ ソースを組み合わせるためにITはそれらの両方を収容する新しいデータ リポジトリを構築する必要がありますその後開発者は再びレポート作成のプログラミングに取り組みますこれでは導入プロセス全体が大幅に停滞しているように感じられます

超高速処理ビジネス インテリジェンスの場合と比べてみましょうこの場合まずトライアル版ソフトウェアをダウンロードしてインストールしますスプレッドシートやリレーショナル データベースからキューブHadoop などに至るまであらゆる種類のデータにアクセスしますこの操作はワンクリックで可能です高速データ ストアにライブ接続するか抽出データを高速データ エンジンにインポートするかを選

図 1 データ ワークフローのあらゆる段階で高速化

これまでのビジネス インテリジェンスと比べて超高速処理分析ではソフトウェアのインストールからデータへのアクセス複雑な情報の

分析インタラクティブなダッシュボードのパブリッシュ組織全体での共有に至るまでワークフローのあらゆる段階でその処理速度は

10 ~ 100 倍高速です

Install Access Analyze Publish Share

10 X 100 TIMES FASTER

p14

ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI

Tableau 超高速処理ビジネス インテリジェンスの背景テクノロジー超高速処理ビジネス インテリジェンスを文字どおり超高速にしている要因は何でしょうかそれは VizQLtrade ですTableau のこの特許取得済みのクエリ言語により簡単なドラッグ アンド ドロップ操作であらゆる規模トピック形式のデータを視覚化できますVizQL はユーザーによる操作をデータベース クエリに変換した後その応答をグラフィカルに表現しますその結果新しいデータベースおよびスプレッドシートのまったく新しい操作方法が生まれました視覚化計算がサポートされているためインタラクティブな質問と回答を通じてデータのさまざまなビューを繰り返し生成することができます

VizQL に続く超高速処理ビジネス インテリジェンスの次の画期的なテクノロジーはTableau のダイレクト接続 amp クエリ機能を使用して既存のデータベースに高速にアクセスして活用できるというものでしたビッグデータを含めほぼすべてのデータ ソースに対して最適化されたコネクタを使用することでTableau では専門知識を必要とせずにライブ データ ソースへのクエリと接続が可能です

ldquoTableau を使用して昨年度は収益が 2 増加しましたこれは 2 億米ドルに相当します航空または運送業界で収益を挙げたいと考えるならばTableau の使用をお勧めしますrdquo

China Eastern Airlines 社ネットワーキングおよび収益部門上級管理

者James Pu 氏

しかしTableau の進化はまだ続きますライブ データ ソースに接続できないときや接続したくないときのためにTableau にはビルトイン データ エンジンを使用して数百万行のデータのアド ホック分析を数秒で実行できる機能が用意されていますTableau のビルトイン データ エンジンは膨大なデータの高速処理が可能であるためビュー間を簡単に切り替えて意味のある傾向や外れ値を検出できますデータ エンジンは PC 上で動作する高性能のインメモリ分析データベースですデータ エンジンにより低速のデータ ソースを高速化できますさらにその速度を活か

して高速のデータ ストアに直接接続することもできますもちろんこれらの 2 つのデータ アクセス方式 (ライブ接続とインメモリ) の間には完全な互換性がありますアクセス方式がライブ接続かインメモリかにかかわらず複数のデータ ソースをブレンドし組み合わせることができます

Databases Cubes Spreadsheets Hadoop amp More

In-Memory Data Live Connection

PC Browser iPad AndroidDesktop

図 10 Tableau アーキテクチャTableau のアーキテクチャには膨大なデータ ソースに対応する

ためにインメモリとライブ接続という 2 つの方法が用意されて

います

最後に 結論企業や公共機関がビジネス インテリジェンスに求めるものには大きな変化が生じていますこれまでの BI の処理は低速で膨大なリソースが必要ですたとえばSeattle Childrenrsquos Hospital に家族が病気の子供を 連れて行くとしましょう家族は一刻も早く子供を診察してもらいたいと思うでしょう速度の重要性は病院に限られることではありません競争の激しい市場では企業は販売促進やコスト削減のために数か月も待つことはできませんたとえばM Financial Group 社は競合他社より勝るペースで北米で最も認知度と評価度の高い保険ブランドの 2000 万米ドルを超える有標製品を発売しましたTableau を使用して私は膨大なデータ セットをドリルダウンしすぐにリレーシ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

uarr 導入から分析共有までのサイクルが10〜~100倍速いです larrあらゆるデータソース(インプット)あらゆる端末(アウトプット)をTableauが繋ぎます darrTableau Desktop で作成したレポートをすぐにパブリックにできます

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒a Tableau Desktop

bull  考える速さで分析するndash  データに接続しコードを1行行も書かずにクエリを実行行できます

ndash  ドラッグアンドドロップを使用したビュー間の直感に沿った移動が可能ですndash  ペタバイト単位または何十億行行ものデータを測定するかどうかに関わらずTableau は可能な限り高速に動作するように構築さ

れています

ndash  Windows Macemsp 両対応(ver 82)

ndash  Tablesu Desktop のインプットソースとして無尽蔵の Treasure ストレージを選択可能ビッグデータをマウスでアドホックに扱えます

1813

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒b Tableau Reader

bull  Tableau Reader はTableau Desktopで作成したビジュアライゼーションを開いて表示できる無料料のデスクトップアプリケーションです

bull  Tableau Reader ではデータを含むTableau Desktopで作成したビジュアライゼーションを開いて操作可能です

bull  作成者の許可の範囲内であればデータをフィルタードリルダウン表示が可能です

bull  作成者によって組み込まれていない場合は操作を編集したり実行行したりすることは不不可能です

bull  Window Mac 両対応

1913

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒c Tableau Server

bull  作成したダッシュボードをWEBアプリ化する事でどこからでもどのデバイスでも分析出来るようになります

bull  データソースへの接続を Tableau Server に集約することによりデータの共有データマートとしての利利用が可能になります

2013

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒d Tableau Public

bull  導入利利用は無料料です

bull  接続出来るデータの種類に制限されます

bull  EXCELテキスト等接続データソースに制限です

bull  利利用出来る行行数データサイズに(100万行行1GB)制約があります

bull  一般公開を前提としたサービスです

2113

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

2213

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2313

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2413

ディメンションbull  定性的な情報やカテゴリ情報を含むフィール

ドを『ディメンション』として扱います

bull  テキストや日付の値を持つフィールドもこれらに含まれます

bull  行行または列列の棚にドラッグドロップをする事でヘッダを生成します

メジャーbull  行行または列列の棚にドラッグドロップを行行う

と『軸』を生成します

bull  デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2513

フィルタ

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2613

マーク gt カラー

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2713

マーク gt サイズ マーク gt ラベル

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  テキストテーブル(text tables)b  ヒートマップ(heat maps)c  ハイライトテーブル(highlight tables)d  記号マップ(symbol maps)e  色塗りマップ(filled maps)f  円グラフ(pie charts)g  水平棒グラフ(horizontal bars)h  積み上げ棒グラフ(stacked bars)i  並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j  ツリーマップ(tree maps)k  円ビュー(circle views)l  並列列円(side-‐‑‒by-‐‑‒side circles)

2813

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  線グラフ連続(lines continuous)b  線グラフ不不連続(lines discrete)c  二重線(dual lines)d  エリアチャート連続(area charts continuous)e  エリアチャート不不連続(area charts discrete)f  2つの組み合わせ(dual combination)g  散布図(scatter plots)h  ヒストグラム(histgram)i  箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j  ガントビュー(gantt view)k  ブレットグラフ(bullet graphs)l  パックバブル(packed bubbles)

2913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒1 Show Me gt 棒グラフ

bull  ひと目で最高値と最低値を見見ることができます

bull  棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます

bull  例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較

bull  応用例例ndash  1つのダッシュボードに複数の棒グラフを使用多数のス

プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります

ndash  棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます

ndash  積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です

ndash  棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます

ndash  バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります

3013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒2 Show Me gt 折れ線グラフ

bull  折れ線グラフは個々の数値データ ポイントを「線」で結びます

bull  それにより値の連続性をわかりやすく視覚化することが可能です

bull  主に一定期間にわたる傾向を表す際に使用します

bull  応用例例ndash  折れ線グラフと棒グラフを組み併せ特定の株価の1日あ

たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます

ndash  線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます

3113

7HFKHDGVampDSLWDO5DLVHGLQ

Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1

$0

$5000

$10000

$15000

$20000

$25000

$30000

$35000

Run

ning

Sum

of O

ffer A

mou

nt (i

n m

il)

7HFKQRORJ

(QHUJ

+HDOWKampDUH

ampRQVXPHU

XVLQHVV6HUYLFHV5HDO(VWDWH

6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV

ampOLFNKHUHWRFOHDUILOWHU

5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒3 Show Me gt 円グラフ

bull  円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです

bull  円グラフは最も誤用されやすいグラフです

bull  データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします

bull  円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように

bull  例例比率率率を表す

bull  応用例ndash  円の扇形を6つまでに制限します比率率率が6つ以上ある場

合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります

ndash  円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします

3213

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒4 Show Me gt マップ

bull  郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります

bull  例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域

bull  応用例例ndash  マップを他の種類のチャートグラフ表のフィルターと

して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます

ndash  マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます

3313

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒5 Show Me gt 散布図

bull  一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます

bull  例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料

bull  応用例 ndash  傾向線最良良適合線を追加します データの相関性に傾向

線を追加すると結果がより明瞭になります

ndash  フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます

ndash  情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります

3413

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒6 Show Me gt ガントチャート

bull  ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です

bull  プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます

bull  応用例ndash  色を追加するガント チャート内のバーの色を変えるこ

とで変数の重要側面をすばやく 伝えることができますndash  マップや他の種類のチャートをガントチャートと組み合わ

せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます

3513

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒7 Show Me gt バブルチャート

bull  バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください

bull  様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す

bull  例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率

bull  応用例ndash  散布図のデータを強調する 各データ ポイントのサイズ

や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます

ndash  マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります

3613

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒8 Show Me gt ヒストグラムbull  ヒストグラムはグループ間でのデータの分散を表示

する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです

bull  データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます

bull  データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます

bull  例例ndash  データのグループ化をテストする データに合ったグ

ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます

ndash  フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります

3713

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒9 Show Me gt ブレットグラフbull  目標がある場合その目標までの進行行状況を追跡するにはブレッ

トグラフが適しています

bull  本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです

bull  ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します

bull  ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)

bull  例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)

bull  応用例例ndash  色を使用して達成のしきい値を示すプライマリメジャーの背景に赤

黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます

ndash  概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます

3813

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒10 Show Me gt ヒートマップ

bull  ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます

bull  例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード

bull  応用例ndash  四角形のサイズを変えますヒート マップでは四角形

のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます

ndash  四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります

3913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒11 Show Me gt ハイライト表

bull  ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます

bull  例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口

bull  応用例例ndash  ハイライト表を他の種類のチャートと組み合わせる たと

えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります

4013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 14: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

2 ビジネスが抱える課題5  マッシュアップしたデータを要求される

ndash  実際に「マッシュアップ」という単語が使われていないかもしれませんが「サードパーティのデータも追加してくれないか」 「Excel ファイルに大量量のデータがあるがそれがこれとどう関係しているのかが見見たい」など要求されていませんか

ndash  複数のデータソースを組み合わせることの有用性は分かっていても一元管理理された BI チームでこのような調整を行行うのは容易易ではありません

6  視覚的分析を求めているndash  人間は行行や列列表を見見 る よりも分かりやすい視覚的な形でデータを見見た方が多くの情報を認識識できます

ndash  まだ視覚的データを要求されてい なくても近いうちに要求されるようになるはずです

ndash  それ がセルフサービスBIとどう関係するのかデータを様々な形で見見ることができれば疑問に対する新たな視点を求められることがなくなります

7  すでに一部で使用しているndash  全てに当てはまるわけではありませんが多くの企業がすでにセルフサービスBIを独自に採用しています

ndash  才覚のあるビジネスリーダーはチームの処理理能力力の限界を把握し彼らが非常に優秀で優れたプロジェクトを運営できることを認識識しています

ndash  その結果独自のセルフサービスBIを採用するケースが多く見見られます

ndash  ITリーダーにとって希望の兆しとなるのはその導入によってすばらしい結果が生み出されることでセルフサービス BI の取り組みをサポートする支援者を 得られるという点です

1413

Copyright copy2014 Treasure Data All Rights Reserved

2 回避したい7つの間違い1  複雑すぎるスタート

ndash  野心的になりすぎてすべてのビジネス課題を網羅羅する詳細すぎるリアルタイムのダッシュボードを作成しユーザーにたくさんの詳細オプションを提供することは簡単です

ndash  「完璧」なダッシュボードを作成するために何週間も何ヶ月も時間を費やさないでくださいその代わり試作品とテスト調整の短いサイクルで作業します

2  誰も理理解できない指標を使用するndash  あなたにとってつじつまが合う指標の表示方法やラベル付け方法は他の人にとってもそうでしょうか

ndash  あなたは指標を熟知しているので別のものと検証するステップはいらないかもしれません

ndash  指標がダッシュボードの目標をサポートするだけ でなく閲覧者が理理解できるようにする必要があります

3  重要でないグラフィックや分かりにくいウィジェットで乱雑なダッシュボードにするndash  ゲージのようなグラフィックやウィジェットでダッシュボードを派手にデザインしすぎないようにします

ndash  こうしたものは見見た目は良良いですが迅速かつ簡単に閲覧者に知らせるというダッシュボードの目的が妨げられる場合がありますダッシュボードは見見た目をシンプルに抑えてください

4  複雑なテクノロジーや大きなビジネス インテリジェンス展開プロジェクトを待つndash  従来のビジネス インテリジェンス (BI) の実装は最初の予測よりも長くかかる場合があります従来の BI プロジェクト

が実現するまで待つと何ヶ月も何年年も遅れる場合がありますすぐにダッシュボードを構築して配布できるアプリケーションを使用してください

1513

Copyright copy2014 Treasure Data All Rights Reserved

2 回避したい7つの間違い

5  ダッシュボードの作成と維持のための時間とリソースを過小評価するndash  ダッシュボードの展開は1回で終わる作業ではありません

ndash  指標に関連性がありデータが最新であるかを閲覧者と確認 することを怠ると誰も使用しなくなります定期的にダッシュボードの実用性を確認してください

6  指標と目標が一致しないndash  ダッシュボードは大きな目標に接続するとより強力力になります部署内の主な指標が組織全体としての成功に反映しない

ダッシュボードを作成してしまうことのないようにします

7  効果的でないデザインの悪いグラフやチャートを使うndash  グラフやチャートをデザインする際は気をつける必要があります

ndash  たとえば3D チャートで閲覧者の理理解が増すことはありません派手な色が解釈の邪魔になることもあります円グラフは値が6つ以上ある場合は特に効果的とは言えません

ndash  優れたビジュアライゼーションのデザインは「6 Tableau Best Practice」を参照してください

1613

Copyright copy2014 Treasure Data All Rights Reserved

2 Tableauの特徴

1713

p4

ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI 二分に満たしていたためです 4700 人以上の従業員用に

同院では Tableau の超高速処理ビジネス インテリジェンス ソリューションを組織全体 (病院研究施設財団法人) に導入しました

特定の人が適切な時間管理のために病院内にいる必要はありません誰もが時間管理を改善したいと考えていますビジネス ユーザーにも IT 部門にも時間節約のニーズがあります超高速処理 BI を導入すれば大規模な BI プロジェクトでも長引くことはなくなりますビジネス ユーザーが実際に使用できる成果物を得られるまで数か月場合によっては数年かかるような事態に陥ることはなくなりますまたExcel でのレポート作成と共有という不便な環境を強いられることもなくなります

次のいずれかの質問に当てはまる場合既存の BI システムは想定された速度で機能していない bull ビジネス インテリジェンス ソリューションの導入または変更に数週間から数か月かかりますか

bull レポートやダッシュボードの作成または変更に IT 部門への依頼が必要でありIT 部門による対応待ちや未処理の状態になったりしますか

bull BI ソリューションでは新しいユーザーが初めてダッシュボードまたはレポートを作成してパブリッシュできるようになるまでトレーニングに数日または数週間かかりますか

bull BI ソリューションは綿密なスケジュールやシステムの

パフォーマンス低下の場合の回避策に依存していますか

bull 企業のデータ ウェアハウスや高速データベースに多額の投資を行っていてもBI ソリューションによりデータの複製が必要になりますか

bull BI ソリューションでは統合前の特殊な作業を行わないとデータにアクセスできませんか

bull リレーショナル データベース以外に保存されている生データや非構造化データを含め複数のソースからのデータをブレンドできることに制約はありませんか

これまでのビジネス インテリジェンス ソフトウェアは導入に時間がかかります購入に数か月実装に数か月以上かかりますユーザーのトレーニングには数週間かかり高いコストもかかります開発者はビジネス ユーザーに要望を聞きその結果を持ち帰ってレポートを作成します変更の反映には何度かの確認とやり直しを経て数週間かかります2 つのデータ ソースを組み合わせるためにITはそれらの両方を収容する新しいデータ リポジトリを構築する必要がありますその後開発者は再びレポート作成のプログラミングに取り組みますこれでは導入プロセス全体が大幅に停滞しているように感じられます

超高速処理ビジネス インテリジェンスの場合と比べてみましょうこの場合まずトライアル版ソフトウェアをダウンロードしてインストールしますスプレッドシートやリレーショナル データベースからキューブHadoop などに至るまであらゆる種類のデータにアクセスしますこの操作はワンクリックで可能です高速データ ストアにライブ接続するか抽出データを高速データ エンジンにインポートするかを選

図 1 データ ワークフローのあらゆる段階で高速化

これまでのビジネス インテリジェンスと比べて超高速処理分析ではソフトウェアのインストールからデータへのアクセス複雑な情報の

分析インタラクティブなダッシュボードのパブリッシュ組織全体での共有に至るまでワークフローのあらゆる段階でその処理速度は

10 ~ 100 倍高速です

Install Access Analyze Publish Share

10 X 100 TIMES FASTER

p14

ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI

Tableau 超高速処理ビジネス インテリジェンスの背景テクノロジー超高速処理ビジネス インテリジェンスを文字どおり超高速にしている要因は何でしょうかそれは VizQLtrade ですTableau のこの特許取得済みのクエリ言語により簡単なドラッグ アンド ドロップ操作であらゆる規模トピック形式のデータを視覚化できますVizQL はユーザーによる操作をデータベース クエリに変換した後その応答をグラフィカルに表現しますその結果新しいデータベースおよびスプレッドシートのまったく新しい操作方法が生まれました視覚化計算がサポートされているためインタラクティブな質問と回答を通じてデータのさまざまなビューを繰り返し生成することができます

VizQL に続く超高速処理ビジネス インテリジェンスの次の画期的なテクノロジーはTableau のダイレクト接続 amp クエリ機能を使用して既存のデータベースに高速にアクセスして活用できるというものでしたビッグデータを含めほぼすべてのデータ ソースに対して最適化されたコネクタを使用することでTableau では専門知識を必要とせずにライブ データ ソースへのクエリと接続が可能です

ldquoTableau を使用して昨年度は収益が 2 増加しましたこれは 2 億米ドルに相当します航空または運送業界で収益を挙げたいと考えるならばTableau の使用をお勧めしますrdquo

China Eastern Airlines 社ネットワーキングおよび収益部門上級管理

者James Pu 氏

しかしTableau の進化はまだ続きますライブ データ ソースに接続できないときや接続したくないときのためにTableau にはビルトイン データ エンジンを使用して数百万行のデータのアド ホック分析を数秒で実行できる機能が用意されていますTableau のビルトイン データ エンジンは膨大なデータの高速処理が可能であるためビュー間を簡単に切り替えて意味のある傾向や外れ値を検出できますデータ エンジンは PC 上で動作する高性能のインメモリ分析データベースですデータ エンジンにより低速のデータ ソースを高速化できますさらにその速度を活か

して高速のデータ ストアに直接接続することもできますもちろんこれらの 2 つのデータ アクセス方式 (ライブ接続とインメモリ) の間には完全な互換性がありますアクセス方式がライブ接続かインメモリかにかかわらず複数のデータ ソースをブレンドし組み合わせることができます

Databases Cubes Spreadsheets Hadoop amp More

In-Memory Data Live Connection

PC Browser iPad AndroidDesktop

図 10 Tableau アーキテクチャTableau のアーキテクチャには膨大なデータ ソースに対応する

ためにインメモリとライブ接続という 2 つの方法が用意されて

います

最後に 結論企業や公共機関がビジネス インテリジェンスに求めるものには大きな変化が生じていますこれまでの BI の処理は低速で膨大なリソースが必要ですたとえばSeattle Childrenrsquos Hospital に家族が病気の子供を 連れて行くとしましょう家族は一刻も早く子供を診察してもらいたいと思うでしょう速度の重要性は病院に限られることではありません競争の激しい市場では企業は販売促進やコスト削減のために数か月も待つことはできませんたとえばM Financial Group 社は競合他社より勝るペースで北米で最も認知度と評価度の高い保険ブランドの 2000 万米ドルを超える有標製品を発売しましたTableau を使用して私は膨大なデータ セットをドリルダウンしすぐにリレーシ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

uarr 導入から分析共有までのサイクルが10〜~100倍速いです larrあらゆるデータソース(インプット)あらゆる端末(アウトプット)をTableauが繋ぎます darrTableau Desktop で作成したレポートをすぐにパブリックにできます

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒a Tableau Desktop

bull  考える速さで分析するndash  データに接続しコードを1行行も書かずにクエリを実行行できます

ndash  ドラッグアンドドロップを使用したビュー間の直感に沿った移動が可能ですndash  ペタバイト単位または何十億行行ものデータを測定するかどうかに関わらずTableau は可能な限り高速に動作するように構築さ

れています

ndash  Windows Macemsp 両対応(ver 82)

ndash  Tablesu Desktop のインプットソースとして無尽蔵の Treasure ストレージを選択可能ビッグデータをマウスでアドホックに扱えます

1813

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒b Tableau Reader

bull  Tableau Reader はTableau Desktopで作成したビジュアライゼーションを開いて表示できる無料料のデスクトップアプリケーションです

bull  Tableau Reader ではデータを含むTableau Desktopで作成したビジュアライゼーションを開いて操作可能です

bull  作成者の許可の範囲内であればデータをフィルタードリルダウン表示が可能です

bull  作成者によって組み込まれていない場合は操作を編集したり実行行したりすることは不不可能です

bull  Window Mac 両対応

1913

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒c Tableau Server

bull  作成したダッシュボードをWEBアプリ化する事でどこからでもどのデバイスでも分析出来るようになります

bull  データソースへの接続を Tableau Server に集約することによりデータの共有データマートとしての利利用が可能になります

2013

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒d Tableau Public

bull  導入利利用は無料料です

bull  接続出来るデータの種類に制限されます

bull  EXCELテキスト等接続データソースに制限です

bull  利利用出来る行行数データサイズに(100万行行1GB)制約があります

bull  一般公開を前提としたサービスです

2113

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

2213

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2313

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2413

ディメンションbull  定性的な情報やカテゴリ情報を含むフィール

ドを『ディメンション』として扱います

bull  テキストや日付の値を持つフィールドもこれらに含まれます

bull  行行または列列の棚にドラッグドロップをする事でヘッダを生成します

メジャーbull  行行または列列の棚にドラッグドロップを行行う

と『軸』を生成します

bull  デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2513

フィルタ

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2613

マーク gt カラー

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2713

マーク gt サイズ マーク gt ラベル

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  テキストテーブル(text tables)b  ヒートマップ(heat maps)c  ハイライトテーブル(highlight tables)d  記号マップ(symbol maps)e  色塗りマップ(filled maps)f  円グラフ(pie charts)g  水平棒グラフ(horizontal bars)h  積み上げ棒グラフ(stacked bars)i  並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j  ツリーマップ(tree maps)k  円ビュー(circle views)l  並列列円(side-‐‑‒by-‐‑‒side circles)

2813

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  線グラフ連続(lines continuous)b  線グラフ不不連続(lines discrete)c  二重線(dual lines)d  エリアチャート連続(area charts continuous)e  エリアチャート不不連続(area charts discrete)f  2つの組み合わせ(dual combination)g  散布図(scatter plots)h  ヒストグラム(histgram)i  箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j  ガントビュー(gantt view)k  ブレットグラフ(bullet graphs)l  パックバブル(packed bubbles)

2913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒1 Show Me gt 棒グラフ

bull  ひと目で最高値と最低値を見見ることができます

bull  棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます

bull  例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較

bull  応用例例ndash  1つのダッシュボードに複数の棒グラフを使用多数のス

プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります

ndash  棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます

ndash  積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です

ndash  棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます

ndash  バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります

3013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒2 Show Me gt 折れ線グラフ

bull  折れ線グラフは個々の数値データ ポイントを「線」で結びます

bull  それにより値の連続性をわかりやすく視覚化することが可能です

bull  主に一定期間にわたる傾向を表す際に使用します

bull  応用例例ndash  折れ線グラフと棒グラフを組み併せ特定の株価の1日あ

たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます

ndash  線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます

3113

7HFKHDGVampDSLWDO5DLVHGLQ

Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1

$0

$5000

$10000

$15000

$20000

$25000

$30000

$35000

Run

ning

Sum

of O

ffer A

mou

nt (i

n m

il)

7HFKQRORJ

(QHUJ

+HDOWKampDUH

ampRQVXPHU

XVLQHVV6HUYLFHV5HDO(VWDWH

6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV

ampOLFNKHUHWRFOHDUILOWHU

5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒3 Show Me gt 円グラフ

bull  円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです

bull  円グラフは最も誤用されやすいグラフです

bull  データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします

bull  円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように

bull  例例比率率率を表す

bull  応用例ndash  円の扇形を6つまでに制限します比率率率が6つ以上ある場

合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります

ndash  円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします

3213

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒4 Show Me gt マップ

bull  郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります

bull  例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域

bull  応用例例ndash  マップを他の種類のチャートグラフ表のフィルターと

して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます

ndash  マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます

3313

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒5 Show Me gt 散布図

bull  一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます

bull  例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料

bull  応用例 ndash  傾向線最良良適合線を追加します データの相関性に傾向

線を追加すると結果がより明瞭になります

ndash  フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます

ndash  情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります

3413

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒6 Show Me gt ガントチャート

bull  ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です

bull  プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます

bull  応用例ndash  色を追加するガント チャート内のバーの色を変えるこ

とで変数の重要側面をすばやく 伝えることができますndash  マップや他の種類のチャートをガントチャートと組み合わ

せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます

3513

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒7 Show Me gt バブルチャート

bull  バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください

bull  様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す

bull  例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率

bull  応用例ndash  散布図のデータを強調する 各データ ポイントのサイズ

や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます

ndash  マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります

3613

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒8 Show Me gt ヒストグラムbull  ヒストグラムはグループ間でのデータの分散を表示

する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです

bull  データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます

bull  データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます

bull  例例ndash  データのグループ化をテストする データに合ったグ

ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます

ndash  フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります

3713

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒9 Show Me gt ブレットグラフbull  目標がある場合その目標までの進行行状況を追跡するにはブレッ

トグラフが適しています

bull  本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです

bull  ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します

bull  ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)

bull  例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)

bull  応用例例ndash  色を使用して達成のしきい値を示すプライマリメジャーの背景に赤

黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます

ndash  概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます

3813

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒10 Show Me gt ヒートマップ

bull  ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます

bull  例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード

bull  応用例ndash  四角形のサイズを変えますヒート マップでは四角形

のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます

ndash  四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります

3913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒11 Show Me gt ハイライト表

bull  ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます

bull  例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口

bull  応用例例ndash  ハイライト表を他の種類のチャートと組み合わせる たと

えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります

4013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 15: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

2 回避したい7つの間違い1  複雑すぎるスタート

ndash  野心的になりすぎてすべてのビジネス課題を網羅羅する詳細すぎるリアルタイムのダッシュボードを作成しユーザーにたくさんの詳細オプションを提供することは簡単です

ndash  「完璧」なダッシュボードを作成するために何週間も何ヶ月も時間を費やさないでくださいその代わり試作品とテスト調整の短いサイクルで作業します

2  誰も理理解できない指標を使用するndash  あなたにとってつじつまが合う指標の表示方法やラベル付け方法は他の人にとってもそうでしょうか

ndash  あなたは指標を熟知しているので別のものと検証するステップはいらないかもしれません

ndash  指標がダッシュボードの目標をサポートするだけ でなく閲覧者が理理解できるようにする必要があります

3  重要でないグラフィックや分かりにくいウィジェットで乱雑なダッシュボードにするndash  ゲージのようなグラフィックやウィジェットでダッシュボードを派手にデザインしすぎないようにします

ndash  こうしたものは見見た目は良良いですが迅速かつ簡単に閲覧者に知らせるというダッシュボードの目的が妨げられる場合がありますダッシュボードは見見た目をシンプルに抑えてください

4  複雑なテクノロジーや大きなビジネス インテリジェンス展開プロジェクトを待つndash  従来のビジネス インテリジェンス (BI) の実装は最初の予測よりも長くかかる場合があります従来の BI プロジェクト

が実現するまで待つと何ヶ月も何年年も遅れる場合がありますすぐにダッシュボードを構築して配布できるアプリケーションを使用してください

1513

Copyright copy2014 Treasure Data All Rights Reserved

2 回避したい7つの間違い

5  ダッシュボードの作成と維持のための時間とリソースを過小評価するndash  ダッシュボードの展開は1回で終わる作業ではありません

ndash  指標に関連性がありデータが最新であるかを閲覧者と確認 することを怠ると誰も使用しなくなります定期的にダッシュボードの実用性を確認してください

6  指標と目標が一致しないndash  ダッシュボードは大きな目標に接続するとより強力力になります部署内の主な指標が組織全体としての成功に反映しない

ダッシュボードを作成してしまうことのないようにします

7  効果的でないデザインの悪いグラフやチャートを使うndash  グラフやチャートをデザインする際は気をつける必要があります

ndash  たとえば3D チャートで閲覧者の理理解が増すことはありません派手な色が解釈の邪魔になることもあります円グラフは値が6つ以上ある場合は特に効果的とは言えません

ndash  優れたビジュアライゼーションのデザインは「6 Tableau Best Practice」を参照してください

1613

Copyright copy2014 Treasure Data All Rights Reserved

2 Tableauの特徴

1713

p4

ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI 二分に満たしていたためです 4700 人以上の従業員用に

同院では Tableau の超高速処理ビジネス インテリジェンス ソリューションを組織全体 (病院研究施設財団法人) に導入しました

特定の人が適切な時間管理のために病院内にいる必要はありません誰もが時間管理を改善したいと考えていますビジネス ユーザーにも IT 部門にも時間節約のニーズがあります超高速処理 BI を導入すれば大規模な BI プロジェクトでも長引くことはなくなりますビジネス ユーザーが実際に使用できる成果物を得られるまで数か月場合によっては数年かかるような事態に陥ることはなくなりますまたExcel でのレポート作成と共有という不便な環境を強いられることもなくなります

次のいずれかの質問に当てはまる場合既存の BI システムは想定された速度で機能していない bull ビジネス インテリジェンス ソリューションの導入または変更に数週間から数か月かかりますか

bull レポートやダッシュボードの作成または変更に IT 部門への依頼が必要でありIT 部門による対応待ちや未処理の状態になったりしますか

bull BI ソリューションでは新しいユーザーが初めてダッシュボードまたはレポートを作成してパブリッシュできるようになるまでトレーニングに数日または数週間かかりますか

bull BI ソリューションは綿密なスケジュールやシステムの

パフォーマンス低下の場合の回避策に依存していますか

bull 企業のデータ ウェアハウスや高速データベースに多額の投資を行っていてもBI ソリューションによりデータの複製が必要になりますか

bull BI ソリューションでは統合前の特殊な作業を行わないとデータにアクセスできませんか

bull リレーショナル データベース以外に保存されている生データや非構造化データを含め複数のソースからのデータをブレンドできることに制約はありませんか

これまでのビジネス インテリジェンス ソフトウェアは導入に時間がかかります購入に数か月実装に数か月以上かかりますユーザーのトレーニングには数週間かかり高いコストもかかります開発者はビジネス ユーザーに要望を聞きその結果を持ち帰ってレポートを作成します変更の反映には何度かの確認とやり直しを経て数週間かかります2 つのデータ ソースを組み合わせるためにITはそれらの両方を収容する新しいデータ リポジトリを構築する必要がありますその後開発者は再びレポート作成のプログラミングに取り組みますこれでは導入プロセス全体が大幅に停滞しているように感じられます

超高速処理ビジネス インテリジェンスの場合と比べてみましょうこの場合まずトライアル版ソフトウェアをダウンロードしてインストールしますスプレッドシートやリレーショナル データベースからキューブHadoop などに至るまであらゆる種類のデータにアクセスしますこの操作はワンクリックで可能です高速データ ストアにライブ接続するか抽出データを高速データ エンジンにインポートするかを選

図 1 データ ワークフローのあらゆる段階で高速化

これまでのビジネス インテリジェンスと比べて超高速処理分析ではソフトウェアのインストールからデータへのアクセス複雑な情報の

分析インタラクティブなダッシュボードのパブリッシュ組織全体での共有に至るまでワークフローのあらゆる段階でその処理速度は

10 ~ 100 倍高速です

Install Access Analyze Publish Share

10 X 100 TIMES FASTER

p14

ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI

Tableau 超高速処理ビジネス インテリジェンスの背景テクノロジー超高速処理ビジネス インテリジェンスを文字どおり超高速にしている要因は何でしょうかそれは VizQLtrade ですTableau のこの特許取得済みのクエリ言語により簡単なドラッグ アンド ドロップ操作であらゆる規模トピック形式のデータを視覚化できますVizQL はユーザーによる操作をデータベース クエリに変換した後その応答をグラフィカルに表現しますその結果新しいデータベースおよびスプレッドシートのまったく新しい操作方法が生まれました視覚化計算がサポートされているためインタラクティブな質問と回答を通じてデータのさまざまなビューを繰り返し生成することができます

VizQL に続く超高速処理ビジネス インテリジェンスの次の画期的なテクノロジーはTableau のダイレクト接続 amp クエリ機能を使用して既存のデータベースに高速にアクセスして活用できるというものでしたビッグデータを含めほぼすべてのデータ ソースに対して最適化されたコネクタを使用することでTableau では専門知識を必要とせずにライブ データ ソースへのクエリと接続が可能です

ldquoTableau を使用して昨年度は収益が 2 増加しましたこれは 2 億米ドルに相当します航空または運送業界で収益を挙げたいと考えるならばTableau の使用をお勧めしますrdquo

China Eastern Airlines 社ネットワーキングおよび収益部門上級管理

者James Pu 氏

しかしTableau の進化はまだ続きますライブ データ ソースに接続できないときや接続したくないときのためにTableau にはビルトイン データ エンジンを使用して数百万行のデータのアド ホック分析を数秒で実行できる機能が用意されていますTableau のビルトイン データ エンジンは膨大なデータの高速処理が可能であるためビュー間を簡単に切り替えて意味のある傾向や外れ値を検出できますデータ エンジンは PC 上で動作する高性能のインメモリ分析データベースですデータ エンジンにより低速のデータ ソースを高速化できますさらにその速度を活か

して高速のデータ ストアに直接接続することもできますもちろんこれらの 2 つのデータ アクセス方式 (ライブ接続とインメモリ) の間には完全な互換性がありますアクセス方式がライブ接続かインメモリかにかかわらず複数のデータ ソースをブレンドし組み合わせることができます

Databases Cubes Spreadsheets Hadoop amp More

In-Memory Data Live Connection

PC Browser iPad AndroidDesktop

図 10 Tableau アーキテクチャTableau のアーキテクチャには膨大なデータ ソースに対応する

ためにインメモリとライブ接続という 2 つの方法が用意されて

います

最後に 結論企業や公共機関がビジネス インテリジェンスに求めるものには大きな変化が生じていますこれまでの BI の処理は低速で膨大なリソースが必要ですたとえばSeattle Childrenrsquos Hospital に家族が病気の子供を 連れて行くとしましょう家族は一刻も早く子供を診察してもらいたいと思うでしょう速度の重要性は病院に限られることではありません競争の激しい市場では企業は販売促進やコスト削減のために数か月も待つことはできませんたとえばM Financial Group 社は競合他社より勝るペースで北米で最も認知度と評価度の高い保険ブランドの 2000 万米ドルを超える有標製品を発売しましたTableau を使用して私は膨大なデータ セットをドリルダウンしすぐにリレーシ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

uarr 導入から分析共有までのサイクルが10〜~100倍速いです larrあらゆるデータソース(インプット)あらゆる端末(アウトプット)をTableauが繋ぎます darrTableau Desktop で作成したレポートをすぐにパブリックにできます

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒a Tableau Desktop

bull  考える速さで分析するndash  データに接続しコードを1行行も書かずにクエリを実行行できます

ndash  ドラッグアンドドロップを使用したビュー間の直感に沿った移動が可能ですndash  ペタバイト単位または何十億行行ものデータを測定するかどうかに関わらずTableau は可能な限り高速に動作するように構築さ

れています

ndash  Windows Macemsp 両対応(ver 82)

ndash  Tablesu Desktop のインプットソースとして無尽蔵の Treasure ストレージを選択可能ビッグデータをマウスでアドホックに扱えます

1813

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒b Tableau Reader

bull  Tableau Reader はTableau Desktopで作成したビジュアライゼーションを開いて表示できる無料料のデスクトップアプリケーションです

bull  Tableau Reader ではデータを含むTableau Desktopで作成したビジュアライゼーションを開いて操作可能です

bull  作成者の許可の範囲内であればデータをフィルタードリルダウン表示が可能です

bull  作成者によって組み込まれていない場合は操作を編集したり実行行したりすることは不不可能です

bull  Window Mac 両対応

1913

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒c Tableau Server

bull  作成したダッシュボードをWEBアプリ化する事でどこからでもどのデバイスでも分析出来るようになります

bull  データソースへの接続を Tableau Server に集約することによりデータの共有データマートとしての利利用が可能になります

2013

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒d Tableau Public

bull  導入利利用は無料料です

bull  接続出来るデータの種類に制限されます

bull  EXCELテキスト等接続データソースに制限です

bull  利利用出来る行行数データサイズに(100万行行1GB)制約があります

bull  一般公開を前提としたサービスです

2113

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

2213

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2313

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2413

ディメンションbull  定性的な情報やカテゴリ情報を含むフィール

ドを『ディメンション』として扱います

bull  テキストや日付の値を持つフィールドもこれらに含まれます

bull  行行または列列の棚にドラッグドロップをする事でヘッダを生成します

メジャーbull  行行または列列の棚にドラッグドロップを行行う

と『軸』を生成します

bull  デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2513

フィルタ

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2613

マーク gt カラー

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2713

マーク gt サイズ マーク gt ラベル

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  テキストテーブル(text tables)b  ヒートマップ(heat maps)c  ハイライトテーブル(highlight tables)d  記号マップ(symbol maps)e  色塗りマップ(filled maps)f  円グラフ(pie charts)g  水平棒グラフ(horizontal bars)h  積み上げ棒グラフ(stacked bars)i  並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j  ツリーマップ(tree maps)k  円ビュー(circle views)l  並列列円(side-‐‑‒by-‐‑‒side circles)

2813

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  線グラフ連続(lines continuous)b  線グラフ不不連続(lines discrete)c  二重線(dual lines)d  エリアチャート連続(area charts continuous)e  エリアチャート不不連続(area charts discrete)f  2つの組み合わせ(dual combination)g  散布図(scatter plots)h  ヒストグラム(histgram)i  箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j  ガントビュー(gantt view)k  ブレットグラフ(bullet graphs)l  パックバブル(packed bubbles)

2913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒1 Show Me gt 棒グラフ

bull  ひと目で最高値と最低値を見見ることができます

bull  棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます

bull  例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較

bull  応用例例ndash  1つのダッシュボードに複数の棒グラフを使用多数のス

プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります

ndash  棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます

ndash  積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です

ndash  棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます

ndash  バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります

3013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒2 Show Me gt 折れ線グラフ

bull  折れ線グラフは個々の数値データ ポイントを「線」で結びます

bull  それにより値の連続性をわかりやすく視覚化することが可能です

bull  主に一定期間にわたる傾向を表す際に使用します

bull  応用例例ndash  折れ線グラフと棒グラフを組み併せ特定の株価の1日あ

たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます

ndash  線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます

3113

7HFKHDGVampDSLWDO5DLVHGLQ

Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1

$0

$5000

$10000

$15000

$20000

$25000

$30000

$35000

Run

ning

Sum

of O

ffer A

mou

nt (i

n m

il)

7HFKQRORJ

(QHUJ

+HDOWKampDUH

ampRQVXPHU

XVLQHVV6HUYLFHV5HDO(VWDWH

6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV

ampOLFNKHUHWRFOHDUILOWHU

5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒3 Show Me gt 円グラフ

bull  円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです

bull  円グラフは最も誤用されやすいグラフです

bull  データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします

bull  円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように

bull  例例比率率率を表す

bull  応用例ndash  円の扇形を6つまでに制限します比率率率が6つ以上ある場

合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります

ndash  円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします

3213

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒4 Show Me gt マップ

bull  郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります

bull  例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域

bull  応用例例ndash  マップを他の種類のチャートグラフ表のフィルターと

して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます

ndash  マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます

3313

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒5 Show Me gt 散布図

bull  一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます

bull  例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料

bull  応用例 ndash  傾向線最良良適合線を追加します データの相関性に傾向

線を追加すると結果がより明瞭になります

ndash  フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます

ndash  情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります

3413

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒6 Show Me gt ガントチャート

bull  ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です

bull  プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます

bull  応用例ndash  色を追加するガント チャート内のバーの色を変えるこ

とで変数の重要側面をすばやく 伝えることができますndash  マップや他の種類のチャートをガントチャートと組み合わ

せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます

3513

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒7 Show Me gt バブルチャート

bull  バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください

bull  様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す

bull  例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率

bull  応用例ndash  散布図のデータを強調する 各データ ポイントのサイズ

や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます

ndash  マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります

3613

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒8 Show Me gt ヒストグラムbull  ヒストグラムはグループ間でのデータの分散を表示

する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです

bull  データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます

bull  データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます

bull  例例ndash  データのグループ化をテストする データに合ったグ

ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます

ndash  フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります

3713

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒9 Show Me gt ブレットグラフbull  目標がある場合その目標までの進行行状況を追跡するにはブレッ

トグラフが適しています

bull  本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです

bull  ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します

bull  ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)

bull  例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)

bull  応用例例ndash  色を使用して達成のしきい値を示すプライマリメジャーの背景に赤

黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます

ndash  概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます

3813

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒10 Show Me gt ヒートマップ

bull  ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます

bull  例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード

bull  応用例ndash  四角形のサイズを変えますヒート マップでは四角形

のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます

ndash  四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります

3913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒11 Show Me gt ハイライト表

bull  ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます

bull  例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口

bull  応用例例ndash  ハイライト表を他の種類のチャートと組み合わせる たと

えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります

4013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 16: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

2 回避したい7つの間違い

5  ダッシュボードの作成と維持のための時間とリソースを過小評価するndash  ダッシュボードの展開は1回で終わる作業ではありません

ndash  指標に関連性がありデータが最新であるかを閲覧者と確認 することを怠ると誰も使用しなくなります定期的にダッシュボードの実用性を確認してください

6  指標と目標が一致しないndash  ダッシュボードは大きな目標に接続するとより強力力になります部署内の主な指標が組織全体としての成功に反映しない

ダッシュボードを作成してしまうことのないようにします

7  効果的でないデザインの悪いグラフやチャートを使うndash  グラフやチャートをデザインする際は気をつける必要があります

ndash  たとえば3D チャートで閲覧者の理理解が増すことはありません派手な色が解釈の邪魔になることもあります円グラフは値が6つ以上ある場合は特に効果的とは言えません

ndash  優れたビジュアライゼーションのデザインは「6 Tableau Best Practice」を参照してください

1613

Copyright copy2014 Treasure Data All Rights Reserved

2 Tableauの特徴

1713

p4

ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI 二分に満たしていたためです 4700 人以上の従業員用に

同院では Tableau の超高速処理ビジネス インテリジェンス ソリューションを組織全体 (病院研究施設財団法人) に導入しました

特定の人が適切な時間管理のために病院内にいる必要はありません誰もが時間管理を改善したいと考えていますビジネス ユーザーにも IT 部門にも時間節約のニーズがあります超高速処理 BI を導入すれば大規模な BI プロジェクトでも長引くことはなくなりますビジネス ユーザーが実際に使用できる成果物を得られるまで数か月場合によっては数年かかるような事態に陥ることはなくなりますまたExcel でのレポート作成と共有という不便な環境を強いられることもなくなります

次のいずれかの質問に当てはまる場合既存の BI システムは想定された速度で機能していない bull ビジネス インテリジェンス ソリューションの導入または変更に数週間から数か月かかりますか

bull レポートやダッシュボードの作成または変更に IT 部門への依頼が必要でありIT 部門による対応待ちや未処理の状態になったりしますか

bull BI ソリューションでは新しいユーザーが初めてダッシュボードまたはレポートを作成してパブリッシュできるようになるまでトレーニングに数日または数週間かかりますか

bull BI ソリューションは綿密なスケジュールやシステムの

パフォーマンス低下の場合の回避策に依存していますか

bull 企業のデータ ウェアハウスや高速データベースに多額の投資を行っていてもBI ソリューションによりデータの複製が必要になりますか

bull BI ソリューションでは統合前の特殊な作業を行わないとデータにアクセスできませんか

bull リレーショナル データベース以外に保存されている生データや非構造化データを含め複数のソースからのデータをブレンドできることに制約はありませんか

これまでのビジネス インテリジェンス ソフトウェアは導入に時間がかかります購入に数か月実装に数か月以上かかりますユーザーのトレーニングには数週間かかり高いコストもかかります開発者はビジネス ユーザーに要望を聞きその結果を持ち帰ってレポートを作成します変更の反映には何度かの確認とやり直しを経て数週間かかります2 つのデータ ソースを組み合わせるためにITはそれらの両方を収容する新しいデータ リポジトリを構築する必要がありますその後開発者は再びレポート作成のプログラミングに取り組みますこれでは導入プロセス全体が大幅に停滞しているように感じられます

超高速処理ビジネス インテリジェンスの場合と比べてみましょうこの場合まずトライアル版ソフトウェアをダウンロードしてインストールしますスプレッドシートやリレーショナル データベースからキューブHadoop などに至るまであらゆる種類のデータにアクセスしますこの操作はワンクリックで可能です高速データ ストアにライブ接続するか抽出データを高速データ エンジンにインポートするかを選

図 1 データ ワークフローのあらゆる段階で高速化

これまでのビジネス インテリジェンスと比べて超高速処理分析ではソフトウェアのインストールからデータへのアクセス複雑な情報の

分析インタラクティブなダッシュボードのパブリッシュ組織全体での共有に至るまでワークフローのあらゆる段階でその処理速度は

10 ~ 100 倍高速です

Install Access Analyze Publish Share

10 X 100 TIMES FASTER

p14

ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI

Tableau 超高速処理ビジネス インテリジェンスの背景テクノロジー超高速処理ビジネス インテリジェンスを文字どおり超高速にしている要因は何でしょうかそれは VizQLtrade ですTableau のこの特許取得済みのクエリ言語により簡単なドラッグ アンド ドロップ操作であらゆる規模トピック形式のデータを視覚化できますVizQL はユーザーによる操作をデータベース クエリに変換した後その応答をグラフィカルに表現しますその結果新しいデータベースおよびスプレッドシートのまったく新しい操作方法が生まれました視覚化計算がサポートされているためインタラクティブな質問と回答を通じてデータのさまざまなビューを繰り返し生成することができます

VizQL に続く超高速処理ビジネス インテリジェンスの次の画期的なテクノロジーはTableau のダイレクト接続 amp クエリ機能を使用して既存のデータベースに高速にアクセスして活用できるというものでしたビッグデータを含めほぼすべてのデータ ソースに対して最適化されたコネクタを使用することでTableau では専門知識を必要とせずにライブ データ ソースへのクエリと接続が可能です

ldquoTableau を使用して昨年度は収益が 2 増加しましたこれは 2 億米ドルに相当します航空または運送業界で収益を挙げたいと考えるならばTableau の使用をお勧めしますrdquo

China Eastern Airlines 社ネットワーキングおよび収益部門上級管理

者James Pu 氏

しかしTableau の進化はまだ続きますライブ データ ソースに接続できないときや接続したくないときのためにTableau にはビルトイン データ エンジンを使用して数百万行のデータのアド ホック分析を数秒で実行できる機能が用意されていますTableau のビルトイン データ エンジンは膨大なデータの高速処理が可能であるためビュー間を簡単に切り替えて意味のある傾向や外れ値を検出できますデータ エンジンは PC 上で動作する高性能のインメモリ分析データベースですデータ エンジンにより低速のデータ ソースを高速化できますさらにその速度を活か

して高速のデータ ストアに直接接続することもできますもちろんこれらの 2 つのデータ アクセス方式 (ライブ接続とインメモリ) の間には完全な互換性がありますアクセス方式がライブ接続かインメモリかにかかわらず複数のデータ ソースをブレンドし組み合わせることができます

Databases Cubes Spreadsheets Hadoop amp More

In-Memory Data Live Connection

PC Browser iPad AndroidDesktop

図 10 Tableau アーキテクチャTableau のアーキテクチャには膨大なデータ ソースに対応する

ためにインメモリとライブ接続という 2 つの方法が用意されて

います

最後に 結論企業や公共機関がビジネス インテリジェンスに求めるものには大きな変化が生じていますこれまでの BI の処理は低速で膨大なリソースが必要ですたとえばSeattle Childrenrsquos Hospital に家族が病気の子供を 連れて行くとしましょう家族は一刻も早く子供を診察してもらいたいと思うでしょう速度の重要性は病院に限られることではありません競争の激しい市場では企業は販売促進やコスト削減のために数か月も待つことはできませんたとえばM Financial Group 社は競合他社より勝るペースで北米で最も認知度と評価度の高い保険ブランドの 2000 万米ドルを超える有標製品を発売しましたTableau を使用して私は膨大なデータ セットをドリルダウンしすぐにリレーシ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

uarr 導入から分析共有までのサイクルが10〜~100倍速いです larrあらゆるデータソース(インプット)あらゆる端末(アウトプット)をTableauが繋ぎます darrTableau Desktop で作成したレポートをすぐにパブリックにできます

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒a Tableau Desktop

bull  考える速さで分析するndash  データに接続しコードを1行行も書かずにクエリを実行行できます

ndash  ドラッグアンドドロップを使用したビュー間の直感に沿った移動が可能ですndash  ペタバイト単位または何十億行行ものデータを測定するかどうかに関わらずTableau は可能な限り高速に動作するように構築さ

れています

ndash  Windows Macemsp 両対応(ver 82)

ndash  Tablesu Desktop のインプットソースとして無尽蔵の Treasure ストレージを選択可能ビッグデータをマウスでアドホックに扱えます

1813

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒b Tableau Reader

bull  Tableau Reader はTableau Desktopで作成したビジュアライゼーションを開いて表示できる無料料のデスクトップアプリケーションです

bull  Tableau Reader ではデータを含むTableau Desktopで作成したビジュアライゼーションを開いて操作可能です

bull  作成者の許可の範囲内であればデータをフィルタードリルダウン表示が可能です

bull  作成者によって組み込まれていない場合は操作を編集したり実行行したりすることは不不可能です

bull  Window Mac 両対応

1913

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒c Tableau Server

bull  作成したダッシュボードをWEBアプリ化する事でどこからでもどのデバイスでも分析出来るようになります

bull  データソースへの接続を Tableau Server に集約することによりデータの共有データマートとしての利利用が可能になります

2013

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒d Tableau Public

bull  導入利利用は無料料です

bull  接続出来るデータの種類に制限されます

bull  EXCELテキスト等接続データソースに制限です

bull  利利用出来る行行数データサイズに(100万行行1GB)制約があります

bull  一般公開を前提としたサービスです

2113

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

2213

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2313

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2413

ディメンションbull  定性的な情報やカテゴリ情報を含むフィール

ドを『ディメンション』として扱います

bull  テキストや日付の値を持つフィールドもこれらに含まれます

bull  行行または列列の棚にドラッグドロップをする事でヘッダを生成します

メジャーbull  行行または列列の棚にドラッグドロップを行行う

と『軸』を生成します

bull  デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2513

フィルタ

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2613

マーク gt カラー

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2713

マーク gt サイズ マーク gt ラベル

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  テキストテーブル(text tables)b  ヒートマップ(heat maps)c  ハイライトテーブル(highlight tables)d  記号マップ(symbol maps)e  色塗りマップ(filled maps)f  円グラフ(pie charts)g  水平棒グラフ(horizontal bars)h  積み上げ棒グラフ(stacked bars)i  並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j  ツリーマップ(tree maps)k  円ビュー(circle views)l  並列列円(side-‐‑‒by-‐‑‒side circles)

2813

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  線グラフ連続(lines continuous)b  線グラフ不不連続(lines discrete)c  二重線(dual lines)d  エリアチャート連続(area charts continuous)e  エリアチャート不不連続(area charts discrete)f  2つの組み合わせ(dual combination)g  散布図(scatter plots)h  ヒストグラム(histgram)i  箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j  ガントビュー(gantt view)k  ブレットグラフ(bullet graphs)l  パックバブル(packed bubbles)

2913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒1 Show Me gt 棒グラフ

bull  ひと目で最高値と最低値を見見ることができます

bull  棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます

bull  例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較

bull  応用例例ndash  1つのダッシュボードに複数の棒グラフを使用多数のス

プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります

ndash  棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます

ndash  積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です

ndash  棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます

ndash  バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります

3013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒2 Show Me gt 折れ線グラフ

bull  折れ線グラフは個々の数値データ ポイントを「線」で結びます

bull  それにより値の連続性をわかりやすく視覚化することが可能です

bull  主に一定期間にわたる傾向を表す際に使用します

bull  応用例例ndash  折れ線グラフと棒グラフを組み併せ特定の株価の1日あ

たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます

ndash  線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます

3113

7HFKHDGVampDSLWDO5DLVHGLQ

Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1

$0

$5000

$10000

$15000

$20000

$25000

$30000

$35000

Run

ning

Sum

of O

ffer A

mou

nt (i

n m

il)

7HFKQRORJ

(QHUJ

+HDOWKampDUH

ampRQVXPHU

XVLQHVV6HUYLFHV5HDO(VWDWH

6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV

ampOLFNKHUHWRFOHDUILOWHU

5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒3 Show Me gt 円グラフ

bull  円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです

bull  円グラフは最も誤用されやすいグラフです

bull  データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします

bull  円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように

bull  例例比率率率を表す

bull  応用例ndash  円の扇形を6つまでに制限します比率率率が6つ以上ある場

合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります

ndash  円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします

3213

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒4 Show Me gt マップ

bull  郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります

bull  例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域

bull  応用例例ndash  マップを他の種類のチャートグラフ表のフィルターと

して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます

ndash  マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます

3313

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒5 Show Me gt 散布図

bull  一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます

bull  例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料

bull  応用例 ndash  傾向線最良良適合線を追加します データの相関性に傾向

線を追加すると結果がより明瞭になります

ndash  フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます

ndash  情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります

3413

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒6 Show Me gt ガントチャート

bull  ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です

bull  プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます

bull  応用例ndash  色を追加するガント チャート内のバーの色を変えるこ

とで変数の重要側面をすばやく 伝えることができますndash  マップや他の種類のチャートをガントチャートと組み合わ

せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます

3513

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒7 Show Me gt バブルチャート

bull  バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください

bull  様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す

bull  例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率

bull  応用例ndash  散布図のデータを強調する 各データ ポイントのサイズ

や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます

ndash  マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります

3613

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒8 Show Me gt ヒストグラムbull  ヒストグラムはグループ間でのデータの分散を表示

する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです

bull  データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます

bull  データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます

bull  例例ndash  データのグループ化をテストする データに合ったグ

ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます

ndash  フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります

3713

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒9 Show Me gt ブレットグラフbull  目標がある場合その目標までの進行行状況を追跡するにはブレッ

トグラフが適しています

bull  本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです

bull  ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します

bull  ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)

bull  例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)

bull  応用例例ndash  色を使用して達成のしきい値を示すプライマリメジャーの背景に赤

黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます

ndash  概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます

3813

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒10 Show Me gt ヒートマップ

bull  ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます

bull  例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード

bull  応用例ndash  四角形のサイズを変えますヒート マップでは四角形

のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます

ndash  四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります

3913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒11 Show Me gt ハイライト表

bull  ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます

bull  例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口

bull  応用例例ndash  ハイライト表を他の種類のチャートと組み合わせる たと

えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります

4013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 17: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

2 Tableauの特徴

1713

p4

ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI 二分に満たしていたためです 4700 人以上の従業員用に

同院では Tableau の超高速処理ビジネス インテリジェンス ソリューションを組織全体 (病院研究施設財団法人) に導入しました

特定の人が適切な時間管理のために病院内にいる必要はありません誰もが時間管理を改善したいと考えていますビジネス ユーザーにも IT 部門にも時間節約のニーズがあります超高速処理 BI を導入すれば大規模な BI プロジェクトでも長引くことはなくなりますビジネス ユーザーが実際に使用できる成果物を得られるまで数か月場合によっては数年かかるような事態に陥ることはなくなりますまたExcel でのレポート作成と共有という不便な環境を強いられることもなくなります

次のいずれかの質問に当てはまる場合既存の BI システムは想定された速度で機能していない bull ビジネス インテリジェンス ソリューションの導入または変更に数週間から数か月かかりますか

bull レポートやダッシュボードの作成または変更に IT 部門への依頼が必要でありIT 部門による対応待ちや未処理の状態になったりしますか

bull BI ソリューションでは新しいユーザーが初めてダッシュボードまたはレポートを作成してパブリッシュできるようになるまでトレーニングに数日または数週間かかりますか

bull BI ソリューションは綿密なスケジュールやシステムの

パフォーマンス低下の場合の回避策に依存していますか

bull 企業のデータ ウェアハウスや高速データベースに多額の投資を行っていてもBI ソリューションによりデータの複製が必要になりますか

bull BI ソリューションでは統合前の特殊な作業を行わないとデータにアクセスできませんか

bull リレーショナル データベース以外に保存されている生データや非構造化データを含め複数のソースからのデータをブレンドできることに制約はありませんか

これまでのビジネス インテリジェンス ソフトウェアは導入に時間がかかります購入に数か月実装に数か月以上かかりますユーザーのトレーニングには数週間かかり高いコストもかかります開発者はビジネス ユーザーに要望を聞きその結果を持ち帰ってレポートを作成します変更の反映には何度かの確認とやり直しを経て数週間かかります2 つのデータ ソースを組み合わせるためにITはそれらの両方を収容する新しいデータ リポジトリを構築する必要がありますその後開発者は再びレポート作成のプログラミングに取り組みますこれでは導入プロセス全体が大幅に停滞しているように感じられます

超高速処理ビジネス インテリジェンスの場合と比べてみましょうこの場合まずトライアル版ソフトウェアをダウンロードしてインストールしますスプレッドシートやリレーショナル データベースからキューブHadoop などに至るまであらゆる種類のデータにアクセスしますこの操作はワンクリックで可能です高速データ ストアにライブ接続するか抽出データを高速データ エンジンにインポートするかを選

図 1 データ ワークフローのあらゆる段階で高速化

これまでのビジネス インテリジェンスと比べて超高速処理分析ではソフトウェアのインストールからデータへのアクセス複雑な情報の

分析インタラクティブなダッシュボードのパブリッシュ組織全体での共有に至るまでワークフローのあらゆる段階でその処理速度は

10 ~ 100 倍高速です

Install Access Analyze Publish Share

10 X 100 TIMES FASTER

p14

ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI

Tableau 超高速処理ビジネス インテリジェンスの背景テクノロジー超高速処理ビジネス インテリジェンスを文字どおり超高速にしている要因は何でしょうかそれは VizQLtrade ですTableau のこの特許取得済みのクエリ言語により簡単なドラッグ アンド ドロップ操作であらゆる規模トピック形式のデータを視覚化できますVizQL はユーザーによる操作をデータベース クエリに変換した後その応答をグラフィカルに表現しますその結果新しいデータベースおよびスプレッドシートのまったく新しい操作方法が生まれました視覚化計算がサポートされているためインタラクティブな質問と回答を通じてデータのさまざまなビューを繰り返し生成することができます

VizQL に続く超高速処理ビジネス インテリジェンスの次の画期的なテクノロジーはTableau のダイレクト接続 amp クエリ機能を使用して既存のデータベースに高速にアクセスして活用できるというものでしたビッグデータを含めほぼすべてのデータ ソースに対して最適化されたコネクタを使用することでTableau では専門知識を必要とせずにライブ データ ソースへのクエリと接続が可能です

ldquoTableau を使用して昨年度は収益が 2 増加しましたこれは 2 億米ドルに相当します航空または運送業界で収益を挙げたいと考えるならばTableau の使用をお勧めしますrdquo

China Eastern Airlines 社ネットワーキングおよび収益部門上級管理

者James Pu 氏

しかしTableau の進化はまだ続きますライブ データ ソースに接続できないときや接続したくないときのためにTableau にはビルトイン データ エンジンを使用して数百万行のデータのアド ホック分析を数秒で実行できる機能が用意されていますTableau のビルトイン データ エンジンは膨大なデータの高速処理が可能であるためビュー間を簡単に切り替えて意味のある傾向や外れ値を検出できますデータ エンジンは PC 上で動作する高性能のインメモリ分析データベースですデータ エンジンにより低速のデータ ソースを高速化できますさらにその速度を活か

して高速のデータ ストアに直接接続することもできますもちろんこれらの 2 つのデータ アクセス方式 (ライブ接続とインメモリ) の間には完全な互換性がありますアクセス方式がライブ接続かインメモリかにかかわらず複数のデータ ソースをブレンドし組み合わせることができます

Databases Cubes Spreadsheets Hadoop amp More

In-Memory Data Live Connection

PC Browser iPad AndroidDesktop

図 10 Tableau アーキテクチャTableau のアーキテクチャには膨大なデータ ソースに対応する

ためにインメモリとライブ接続という 2 つの方法が用意されて

います

最後に 結論企業や公共機関がビジネス インテリジェンスに求めるものには大きな変化が生じていますこれまでの BI の処理は低速で膨大なリソースが必要ですたとえばSeattle Childrenrsquos Hospital に家族が病気の子供を 連れて行くとしましょう家族は一刻も早く子供を診察してもらいたいと思うでしょう速度の重要性は病院に限られることではありません競争の激しい市場では企業は販売促進やコスト削減のために数か月も待つことはできませんたとえばM Financial Group 社は競合他社より勝るペースで北米で最も認知度と評価度の高い保険ブランドの 2000 万米ドルを超える有標製品を発売しましたTableau を使用して私は膨大なデータ セットをドリルダウンしすぐにリレーシ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

uarr 導入から分析共有までのサイクルが10〜~100倍速いです larrあらゆるデータソース(インプット)あらゆる端末(アウトプット)をTableauが繋ぎます darrTableau Desktop で作成したレポートをすぐにパブリックにできます

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒a Tableau Desktop

bull  考える速さで分析するndash  データに接続しコードを1行行も書かずにクエリを実行行できます

ndash  ドラッグアンドドロップを使用したビュー間の直感に沿った移動が可能ですndash  ペタバイト単位または何十億行行ものデータを測定するかどうかに関わらずTableau は可能な限り高速に動作するように構築さ

れています

ndash  Windows Macemsp 両対応(ver 82)

ndash  Tablesu Desktop のインプットソースとして無尽蔵の Treasure ストレージを選択可能ビッグデータをマウスでアドホックに扱えます

1813

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒b Tableau Reader

bull  Tableau Reader はTableau Desktopで作成したビジュアライゼーションを開いて表示できる無料料のデスクトップアプリケーションです

bull  Tableau Reader ではデータを含むTableau Desktopで作成したビジュアライゼーションを開いて操作可能です

bull  作成者の許可の範囲内であればデータをフィルタードリルダウン表示が可能です

bull  作成者によって組み込まれていない場合は操作を編集したり実行行したりすることは不不可能です

bull  Window Mac 両対応

1913

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒c Tableau Server

bull  作成したダッシュボードをWEBアプリ化する事でどこからでもどのデバイスでも分析出来るようになります

bull  データソースへの接続を Tableau Server に集約することによりデータの共有データマートとしての利利用が可能になります

2013

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒d Tableau Public

bull  導入利利用は無料料です

bull  接続出来るデータの種類に制限されます

bull  EXCELテキスト等接続データソースに制限です

bull  利利用出来る行行数データサイズに(100万行行1GB)制約があります

bull  一般公開を前提としたサービスです

2113

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

2213

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2313

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2413

ディメンションbull  定性的な情報やカテゴリ情報を含むフィール

ドを『ディメンション』として扱います

bull  テキストや日付の値を持つフィールドもこれらに含まれます

bull  行行または列列の棚にドラッグドロップをする事でヘッダを生成します

メジャーbull  行行または列列の棚にドラッグドロップを行行う

と『軸』を生成します

bull  デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2513

フィルタ

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2613

マーク gt カラー

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2713

マーク gt サイズ マーク gt ラベル

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  テキストテーブル(text tables)b  ヒートマップ(heat maps)c  ハイライトテーブル(highlight tables)d  記号マップ(symbol maps)e  色塗りマップ(filled maps)f  円グラフ(pie charts)g  水平棒グラフ(horizontal bars)h  積み上げ棒グラフ(stacked bars)i  並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j  ツリーマップ(tree maps)k  円ビュー(circle views)l  並列列円(side-‐‑‒by-‐‑‒side circles)

2813

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  線グラフ連続(lines continuous)b  線グラフ不不連続(lines discrete)c  二重線(dual lines)d  エリアチャート連続(area charts continuous)e  エリアチャート不不連続(area charts discrete)f  2つの組み合わせ(dual combination)g  散布図(scatter plots)h  ヒストグラム(histgram)i  箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j  ガントビュー(gantt view)k  ブレットグラフ(bullet graphs)l  パックバブル(packed bubbles)

2913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒1 Show Me gt 棒グラフ

bull  ひと目で最高値と最低値を見見ることができます

bull  棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます

bull  例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較

bull  応用例例ndash  1つのダッシュボードに複数の棒グラフを使用多数のス

プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります

ndash  棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます

ndash  積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です

ndash  棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます

ndash  バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります

3013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒2 Show Me gt 折れ線グラフ

bull  折れ線グラフは個々の数値データ ポイントを「線」で結びます

bull  それにより値の連続性をわかりやすく視覚化することが可能です

bull  主に一定期間にわたる傾向を表す際に使用します

bull  応用例例ndash  折れ線グラフと棒グラフを組み併せ特定の株価の1日あ

たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます

ndash  線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます

3113

7HFKHDGVampDSLWDO5DLVHGLQ

Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1

$0

$5000

$10000

$15000

$20000

$25000

$30000

$35000

Run

ning

Sum

of O

ffer A

mou

nt (i

n m

il)

7HFKQRORJ

(QHUJ

+HDOWKampDUH

ampRQVXPHU

XVLQHVV6HUYLFHV5HDO(VWDWH

6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV

ampOLFNKHUHWRFOHDUILOWHU

5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒3 Show Me gt 円グラフ

bull  円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです

bull  円グラフは最も誤用されやすいグラフです

bull  データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします

bull  円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように

bull  例例比率率率を表す

bull  応用例ndash  円の扇形を6つまでに制限します比率率率が6つ以上ある場

合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります

ndash  円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします

3213

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒4 Show Me gt マップ

bull  郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります

bull  例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域

bull  応用例例ndash  マップを他の種類のチャートグラフ表のフィルターと

して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます

ndash  マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます

3313

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒5 Show Me gt 散布図

bull  一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます

bull  例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料

bull  応用例 ndash  傾向線最良良適合線を追加します データの相関性に傾向

線を追加すると結果がより明瞭になります

ndash  フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます

ndash  情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります

3413

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒6 Show Me gt ガントチャート

bull  ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です

bull  プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます

bull  応用例ndash  色を追加するガント チャート内のバーの色を変えるこ

とで変数の重要側面をすばやく 伝えることができますndash  マップや他の種類のチャートをガントチャートと組み合わ

せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます

3513

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒7 Show Me gt バブルチャート

bull  バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください

bull  様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す

bull  例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率

bull  応用例ndash  散布図のデータを強調する 各データ ポイントのサイズ

や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます

ndash  マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります

3613

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒8 Show Me gt ヒストグラムbull  ヒストグラムはグループ間でのデータの分散を表示

する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです

bull  データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます

bull  データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます

bull  例例ndash  データのグループ化をテストする データに合ったグ

ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます

ndash  フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります

3713

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒9 Show Me gt ブレットグラフbull  目標がある場合その目標までの進行行状況を追跡するにはブレッ

トグラフが適しています

bull  本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです

bull  ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します

bull  ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)

bull  例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)

bull  応用例例ndash  色を使用して達成のしきい値を示すプライマリメジャーの背景に赤

黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます

ndash  概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます

3813

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒10 Show Me gt ヒートマップ

bull  ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます

bull  例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード

bull  応用例ndash  四角形のサイズを変えますヒート マップでは四角形

のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます

ndash  四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります

3913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒11 Show Me gt ハイライト表

bull  ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます

bull  例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口

bull  応用例例ndash  ハイライト表を他の種類のチャートと組み合わせる たと

えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります

4013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 18: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒a Tableau Desktop

bull  考える速さで分析するndash  データに接続しコードを1行行も書かずにクエリを実行行できます

ndash  ドラッグアンドドロップを使用したビュー間の直感に沿った移動が可能ですndash  ペタバイト単位または何十億行行ものデータを測定するかどうかに関わらずTableau は可能な限り高速に動作するように構築さ

れています

ndash  Windows Macemsp 両対応(ver 82)

ndash  Tablesu Desktop のインプットソースとして無尽蔵の Treasure ストレージを選択可能ビッグデータをマウスでアドホックに扱えます

1813

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒b Tableau Reader

bull  Tableau Reader はTableau Desktopで作成したビジュアライゼーションを開いて表示できる無料料のデスクトップアプリケーションです

bull  Tableau Reader ではデータを含むTableau Desktopで作成したビジュアライゼーションを開いて操作可能です

bull  作成者の許可の範囲内であればデータをフィルタードリルダウン表示が可能です

bull  作成者によって組み込まれていない場合は操作を編集したり実行行したりすることは不不可能です

bull  Window Mac 両対応

1913

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒c Tableau Server

bull  作成したダッシュボードをWEBアプリ化する事でどこからでもどのデバイスでも分析出来るようになります

bull  データソースへの接続を Tableau Server に集約することによりデータの共有データマートとしての利利用が可能になります

2013

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒d Tableau Public

bull  導入利利用は無料料です

bull  接続出来るデータの種類に制限されます

bull  EXCELテキスト等接続データソースに制限です

bull  利利用出来る行行数データサイズに(100万行行1GB)制約があります

bull  一般公開を前提としたサービスです

2113

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

2213

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2313

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2413

ディメンションbull  定性的な情報やカテゴリ情報を含むフィール

ドを『ディメンション』として扱います

bull  テキストや日付の値を持つフィールドもこれらに含まれます

bull  行行または列列の棚にドラッグドロップをする事でヘッダを生成します

メジャーbull  行行または列列の棚にドラッグドロップを行行う

と『軸』を生成します

bull  デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2513

フィルタ

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2613

マーク gt カラー

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2713

マーク gt サイズ マーク gt ラベル

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  テキストテーブル(text tables)b  ヒートマップ(heat maps)c  ハイライトテーブル(highlight tables)d  記号マップ(symbol maps)e  色塗りマップ(filled maps)f  円グラフ(pie charts)g  水平棒グラフ(horizontal bars)h  積み上げ棒グラフ(stacked bars)i  並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j  ツリーマップ(tree maps)k  円ビュー(circle views)l  並列列円(side-‐‑‒by-‐‑‒side circles)

2813

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  線グラフ連続(lines continuous)b  線グラフ不不連続(lines discrete)c  二重線(dual lines)d  エリアチャート連続(area charts continuous)e  エリアチャート不不連続(area charts discrete)f  2つの組み合わせ(dual combination)g  散布図(scatter plots)h  ヒストグラム(histgram)i  箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j  ガントビュー(gantt view)k  ブレットグラフ(bullet graphs)l  パックバブル(packed bubbles)

2913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒1 Show Me gt 棒グラフ

bull  ひと目で最高値と最低値を見見ることができます

bull  棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます

bull  例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較

bull  応用例例ndash  1つのダッシュボードに複数の棒グラフを使用多数のス

プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります

ndash  棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます

ndash  積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です

ndash  棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます

ndash  バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります

3013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒2 Show Me gt 折れ線グラフ

bull  折れ線グラフは個々の数値データ ポイントを「線」で結びます

bull  それにより値の連続性をわかりやすく視覚化することが可能です

bull  主に一定期間にわたる傾向を表す際に使用します

bull  応用例例ndash  折れ線グラフと棒グラフを組み併せ特定の株価の1日あ

たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます

ndash  線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます

3113

7HFKHDGVampDSLWDO5DLVHGLQ

Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1

$0

$5000

$10000

$15000

$20000

$25000

$30000

$35000

Run

ning

Sum

of O

ffer A

mou

nt (i

n m

il)

7HFKQRORJ

(QHUJ

+HDOWKampDUH

ampRQVXPHU

XVLQHVV6HUYLFHV5HDO(VWDWH

6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV

ampOLFNKHUHWRFOHDUILOWHU

5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒3 Show Me gt 円グラフ

bull  円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです

bull  円グラフは最も誤用されやすいグラフです

bull  データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします

bull  円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように

bull  例例比率率率を表す

bull  応用例ndash  円の扇形を6つまでに制限します比率率率が6つ以上ある場

合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります

ndash  円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします

3213

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒4 Show Me gt マップ

bull  郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります

bull  例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域

bull  応用例例ndash  マップを他の種類のチャートグラフ表のフィルターと

して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます

ndash  マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます

3313

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒5 Show Me gt 散布図

bull  一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます

bull  例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料

bull  応用例 ndash  傾向線最良良適合線を追加します データの相関性に傾向

線を追加すると結果がより明瞭になります

ndash  フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます

ndash  情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります

3413

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒6 Show Me gt ガントチャート

bull  ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です

bull  プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます

bull  応用例ndash  色を追加するガント チャート内のバーの色を変えるこ

とで変数の重要側面をすばやく 伝えることができますndash  マップや他の種類のチャートをガントチャートと組み合わ

せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます

3513

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒7 Show Me gt バブルチャート

bull  バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください

bull  様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す

bull  例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率

bull  応用例ndash  散布図のデータを強調する 各データ ポイントのサイズ

や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます

ndash  マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります

3613

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒8 Show Me gt ヒストグラムbull  ヒストグラムはグループ間でのデータの分散を表示

する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです

bull  データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます

bull  データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます

bull  例例ndash  データのグループ化をテストする データに合ったグ

ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます

ndash  フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります

3713

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒9 Show Me gt ブレットグラフbull  目標がある場合その目標までの進行行状況を追跡するにはブレッ

トグラフが適しています

bull  本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです

bull  ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します

bull  ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)

bull  例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)

bull  応用例例ndash  色を使用して達成のしきい値を示すプライマリメジャーの背景に赤

黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます

ndash  概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます

3813

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒10 Show Me gt ヒートマップ

bull  ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます

bull  例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード

bull  応用例ndash  四角形のサイズを変えますヒート マップでは四角形

のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます

ndash  四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります

3913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒11 Show Me gt ハイライト表

bull  ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます

bull  例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口

bull  応用例例ndash  ハイライト表を他の種類のチャートと組み合わせる たと

えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります

4013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 19: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒b Tableau Reader

bull  Tableau Reader はTableau Desktopで作成したビジュアライゼーションを開いて表示できる無料料のデスクトップアプリケーションです

bull  Tableau Reader ではデータを含むTableau Desktopで作成したビジュアライゼーションを開いて操作可能です

bull  作成者の許可の範囲内であればデータをフィルタードリルダウン表示が可能です

bull  作成者によって組み込まれていない場合は操作を編集したり実行行したりすることは不不可能です

bull  Window Mac 両対応

1913

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒c Tableau Server

bull  作成したダッシュボードをWEBアプリ化する事でどこからでもどのデバイスでも分析出来るようになります

bull  データソースへの接続を Tableau Server に集約することによりデータの共有データマートとしての利利用が可能になります

2013

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒d Tableau Public

bull  導入利利用は無料料です

bull  接続出来るデータの種類に制限されます

bull  EXCELテキスト等接続データソースに制限です

bull  利利用出来る行行数データサイズに(100万行行1GB)制約があります

bull  一般公開を前提としたサービスです

2113

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

2213

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2313

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2413

ディメンションbull  定性的な情報やカテゴリ情報を含むフィール

ドを『ディメンション』として扱います

bull  テキストや日付の値を持つフィールドもこれらに含まれます

bull  行行または列列の棚にドラッグドロップをする事でヘッダを生成します

メジャーbull  行行または列列の棚にドラッグドロップを行行う

と『軸』を生成します

bull  デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2513

フィルタ

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2613

マーク gt カラー

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2713

マーク gt サイズ マーク gt ラベル

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  テキストテーブル(text tables)b  ヒートマップ(heat maps)c  ハイライトテーブル(highlight tables)d  記号マップ(symbol maps)e  色塗りマップ(filled maps)f  円グラフ(pie charts)g  水平棒グラフ(horizontal bars)h  積み上げ棒グラフ(stacked bars)i  並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j  ツリーマップ(tree maps)k  円ビュー(circle views)l  並列列円(side-‐‑‒by-‐‑‒side circles)

2813

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  線グラフ連続(lines continuous)b  線グラフ不不連続(lines discrete)c  二重線(dual lines)d  エリアチャート連続(area charts continuous)e  エリアチャート不不連続(area charts discrete)f  2つの組み合わせ(dual combination)g  散布図(scatter plots)h  ヒストグラム(histgram)i  箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j  ガントビュー(gantt view)k  ブレットグラフ(bullet graphs)l  パックバブル(packed bubbles)

2913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒1 Show Me gt 棒グラフ

bull  ひと目で最高値と最低値を見見ることができます

bull  棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます

bull  例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較

bull  応用例例ndash  1つのダッシュボードに複数の棒グラフを使用多数のス

プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります

ndash  棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます

ndash  積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です

ndash  棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます

ndash  バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります

3013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒2 Show Me gt 折れ線グラフ

bull  折れ線グラフは個々の数値データ ポイントを「線」で結びます

bull  それにより値の連続性をわかりやすく視覚化することが可能です

bull  主に一定期間にわたる傾向を表す際に使用します

bull  応用例例ndash  折れ線グラフと棒グラフを組み併せ特定の株価の1日あ

たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます

ndash  線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます

3113

7HFKHDGVampDSLWDO5DLVHGLQ

Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1

$0

$5000

$10000

$15000

$20000

$25000

$30000

$35000

Run

ning

Sum

of O

ffer A

mou

nt (i

n m

il)

7HFKQRORJ

(QHUJ

+HDOWKampDUH

ampRQVXPHU

XVLQHVV6HUYLFHV5HDO(VWDWH

6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV

ampOLFNKHUHWRFOHDUILOWHU

5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒3 Show Me gt 円グラフ

bull  円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです

bull  円グラフは最も誤用されやすいグラフです

bull  データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします

bull  円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように

bull  例例比率率率を表す

bull  応用例ndash  円の扇形を6つまでに制限します比率率率が6つ以上ある場

合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります

ndash  円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします

3213

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒4 Show Me gt マップ

bull  郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります

bull  例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域

bull  応用例例ndash  マップを他の種類のチャートグラフ表のフィルターと

して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます

ndash  マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます

3313

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒5 Show Me gt 散布図

bull  一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます

bull  例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料

bull  応用例 ndash  傾向線最良良適合線を追加します データの相関性に傾向

線を追加すると結果がより明瞭になります

ndash  フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます

ndash  情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります

3413

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒6 Show Me gt ガントチャート

bull  ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です

bull  プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます

bull  応用例ndash  色を追加するガント チャート内のバーの色を変えるこ

とで変数の重要側面をすばやく 伝えることができますndash  マップや他の種類のチャートをガントチャートと組み合わ

せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます

3513

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒7 Show Me gt バブルチャート

bull  バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください

bull  様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す

bull  例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率

bull  応用例ndash  散布図のデータを強調する 各データ ポイントのサイズ

や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます

ndash  マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります

3613

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒8 Show Me gt ヒストグラムbull  ヒストグラムはグループ間でのデータの分散を表示

する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです

bull  データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます

bull  データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます

bull  例例ndash  データのグループ化をテストする データに合ったグ

ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます

ndash  フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります

3713

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒9 Show Me gt ブレットグラフbull  目標がある場合その目標までの進行行状況を追跡するにはブレッ

トグラフが適しています

bull  本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです

bull  ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します

bull  ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)

bull  例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)

bull  応用例例ndash  色を使用して達成のしきい値を示すプライマリメジャーの背景に赤

黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます

ndash  概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます

3813

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒10 Show Me gt ヒートマップ

bull  ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます

bull  例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード

bull  応用例ndash  四角形のサイズを変えますヒート マップでは四角形

のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます

ndash  四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります

3913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒11 Show Me gt ハイライト表

bull  ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます

bull  例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口

bull  応用例例ndash  ハイライト表を他の種類のチャートと組み合わせる たと

えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります

4013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 20: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒c Tableau Server

bull  作成したダッシュボードをWEBアプリ化する事でどこからでもどのデバイスでも分析出来るようになります

bull  データソースへの接続を Tableau Server に集約することによりデータの共有データマートとしての利利用が可能になります

2013

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒d Tableau Public

bull  導入利利用は無料料です

bull  接続出来るデータの種類に制限されます

bull  EXCELテキスト等接続データソースに制限です

bull  利利用出来る行行数データサイズに(100万行行1GB)制約があります

bull  一般公開を前提としたサービスです

2113

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

2213

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2313

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2413

ディメンションbull  定性的な情報やカテゴリ情報を含むフィール

ドを『ディメンション』として扱います

bull  テキストや日付の値を持つフィールドもこれらに含まれます

bull  行行または列列の棚にドラッグドロップをする事でヘッダを生成します

メジャーbull  行行または列列の棚にドラッグドロップを行行う

と『軸』を生成します

bull  デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2513

フィルタ

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2613

マーク gt カラー

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2713

マーク gt サイズ マーク gt ラベル

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  テキストテーブル(text tables)b  ヒートマップ(heat maps)c  ハイライトテーブル(highlight tables)d  記号マップ(symbol maps)e  色塗りマップ(filled maps)f  円グラフ(pie charts)g  水平棒グラフ(horizontal bars)h  積み上げ棒グラフ(stacked bars)i  並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j  ツリーマップ(tree maps)k  円ビュー(circle views)l  並列列円(side-‐‑‒by-‐‑‒side circles)

2813

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  線グラフ連続(lines continuous)b  線グラフ不不連続(lines discrete)c  二重線(dual lines)d  エリアチャート連続(area charts continuous)e  エリアチャート不不連続(area charts discrete)f  2つの組み合わせ(dual combination)g  散布図(scatter plots)h  ヒストグラム(histgram)i  箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j  ガントビュー(gantt view)k  ブレットグラフ(bullet graphs)l  パックバブル(packed bubbles)

2913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒1 Show Me gt 棒グラフ

bull  ひと目で最高値と最低値を見見ることができます

bull  棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます

bull  例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較

bull  応用例例ndash  1つのダッシュボードに複数の棒グラフを使用多数のス

プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります

ndash  棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます

ndash  積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です

ndash  棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます

ndash  バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります

3013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒2 Show Me gt 折れ線グラフ

bull  折れ線グラフは個々の数値データ ポイントを「線」で結びます

bull  それにより値の連続性をわかりやすく視覚化することが可能です

bull  主に一定期間にわたる傾向を表す際に使用します

bull  応用例例ndash  折れ線グラフと棒グラフを組み併せ特定の株価の1日あ

たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます

ndash  線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます

3113

7HFKHDGVampDSLWDO5DLVHGLQ

Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1

$0

$5000

$10000

$15000

$20000

$25000

$30000

$35000

Run

ning

Sum

of O

ffer A

mou

nt (i

n m

il)

7HFKQRORJ

(QHUJ

+HDOWKampDUH

ampRQVXPHU

XVLQHVV6HUYLFHV5HDO(VWDWH

6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV

ampOLFNKHUHWRFOHDUILOWHU

5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒3 Show Me gt 円グラフ

bull  円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです

bull  円グラフは最も誤用されやすいグラフです

bull  データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします

bull  円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように

bull  例例比率率率を表す

bull  応用例ndash  円の扇形を6つまでに制限します比率率率が6つ以上ある場

合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります

ndash  円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします

3213

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒4 Show Me gt マップ

bull  郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります

bull  例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域

bull  応用例例ndash  マップを他の種類のチャートグラフ表のフィルターと

して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます

ndash  マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます

3313

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒5 Show Me gt 散布図

bull  一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます

bull  例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料

bull  応用例 ndash  傾向線最良良適合線を追加します データの相関性に傾向

線を追加すると結果がより明瞭になります

ndash  フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます

ndash  情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります

3413

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒6 Show Me gt ガントチャート

bull  ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です

bull  プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます

bull  応用例ndash  色を追加するガント チャート内のバーの色を変えるこ

とで変数の重要側面をすばやく 伝えることができますndash  マップや他の種類のチャートをガントチャートと組み合わ

せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます

3513

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒7 Show Me gt バブルチャート

bull  バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください

bull  様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す

bull  例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率

bull  応用例ndash  散布図のデータを強調する 各データ ポイントのサイズ

や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます

ndash  マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります

3613

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒8 Show Me gt ヒストグラムbull  ヒストグラムはグループ間でのデータの分散を表示

する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです

bull  データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます

bull  データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます

bull  例例ndash  データのグループ化をテストする データに合ったグ

ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます

ndash  フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります

3713

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒9 Show Me gt ブレットグラフbull  目標がある場合その目標までの進行行状況を追跡するにはブレッ

トグラフが適しています

bull  本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです

bull  ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します

bull  ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)

bull  例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)

bull  応用例例ndash  色を使用して達成のしきい値を示すプライマリメジャーの背景に赤

黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます

ndash  概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます

3813

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒10 Show Me gt ヒートマップ

bull  ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます

bull  例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード

bull  応用例ndash  四角形のサイズを変えますヒート マップでは四角形

のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます

ndash  四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります

3913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒11 Show Me gt ハイライト表

bull  ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます

bull  例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口

bull  応用例例ndash  ハイライト表を他の種類のチャートと組み合わせる たと

えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります

4013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 21: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

2-‐‑‒d Tableau Public

bull  導入利利用は無料料です

bull  接続出来るデータの種類に制限されます

bull  EXCELテキスト等接続データソースに制限です

bull  利利用出来る行行数データサイズに(100万行行1GB)制約があります

bull  一般公開を前提としたサービスです

2113

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

2213

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2313

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2413

ディメンションbull  定性的な情報やカテゴリ情報を含むフィール

ドを『ディメンション』として扱います

bull  テキストや日付の値を持つフィールドもこれらに含まれます

bull  行行または列列の棚にドラッグドロップをする事でヘッダを生成します

メジャーbull  行行または列列の棚にドラッグドロップを行行う

と『軸』を生成します

bull  デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2513

フィルタ

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2613

マーク gt カラー

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2713

マーク gt サイズ マーク gt ラベル

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  テキストテーブル(text tables)b  ヒートマップ(heat maps)c  ハイライトテーブル(highlight tables)d  記号マップ(symbol maps)e  色塗りマップ(filled maps)f  円グラフ(pie charts)g  水平棒グラフ(horizontal bars)h  積み上げ棒グラフ(stacked bars)i  並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j  ツリーマップ(tree maps)k  円ビュー(circle views)l  並列列円(side-‐‑‒by-‐‑‒side circles)

2813

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  線グラフ連続(lines continuous)b  線グラフ不不連続(lines discrete)c  二重線(dual lines)d  エリアチャート連続(area charts continuous)e  エリアチャート不不連続(area charts discrete)f  2つの組み合わせ(dual combination)g  散布図(scatter plots)h  ヒストグラム(histgram)i  箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j  ガントビュー(gantt view)k  ブレットグラフ(bullet graphs)l  パックバブル(packed bubbles)

2913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒1 Show Me gt 棒グラフ

bull  ひと目で最高値と最低値を見見ることができます

bull  棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます

bull  例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較

bull  応用例例ndash  1つのダッシュボードに複数の棒グラフを使用多数のス

プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります

ndash  棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます

ndash  積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です

ndash  棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます

ndash  バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります

3013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒2 Show Me gt 折れ線グラフ

bull  折れ線グラフは個々の数値データ ポイントを「線」で結びます

bull  それにより値の連続性をわかりやすく視覚化することが可能です

bull  主に一定期間にわたる傾向を表す際に使用します

bull  応用例例ndash  折れ線グラフと棒グラフを組み併せ特定の株価の1日あ

たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます

ndash  線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます

3113

7HFKHDGVampDSLWDO5DLVHGLQ

Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1

$0

$5000

$10000

$15000

$20000

$25000

$30000

$35000

Run

ning

Sum

of O

ffer A

mou

nt (i

n m

il)

7HFKQRORJ

(QHUJ

+HDOWKampDUH

ampRQVXPHU

XVLQHVV6HUYLFHV5HDO(VWDWH

6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV

ampOLFNKHUHWRFOHDUILOWHU

5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒3 Show Me gt 円グラフ

bull  円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです

bull  円グラフは最も誤用されやすいグラフです

bull  データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします

bull  円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように

bull  例例比率率率を表す

bull  応用例ndash  円の扇形を6つまでに制限します比率率率が6つ以上ある場

合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります

ndash  円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします

3213

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒4 Show Me gt マップ

bull  郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります

bull  例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域

bull  応用例例ndash  マップを他の種類のチャートグラフ表のフィルターと

して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます

ndash  マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます

3313

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒5 Show Me gt 散布図

bull  一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます

bull  例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料

bull  応用例 ndash  傾向線最良良適合線を追加します データの相関性に傾向

線を追加すると結果がより明瞭になります

ndash  フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます

ndash  情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります

3413

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒6 Show Me gt ガントチャート

bull  ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です

bull  プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます

bull  応用例ndash  色を追加するガント チャート内のバーの色を変えるこ

とで変数の重要側面をすばやく 伝えることができますndash  マップや他の種類のチャートをガントチャートと組み合わ

せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます

3513

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒7 Show Me gt バブルチャート

bull  バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください

bull  様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す

bull  例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率

bull  応用例ndash  散布図のデータを強調する 各データ ポイントのサイズ

や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます

ndash  マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります

3613

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒8 Show Me gt ヒストグラムbull  ヒストグラムはグループ間でのデータの分散を表示

する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです

bull  データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます

bull  データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます

bull  例例ndash  データのグループ化をテストする データに合ったグ

ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます

ndash  フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります

3713

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒9 Show Me gt ブレットグラフbull  目標がある場合その目標までの進行行状況を追跡するにはブレッ

トグラフが適しています

bull  本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです

bull  ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します

bull  ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)

bull  例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)

bull  応用例例ndash  色を使用して達成のしきい値を示すプライマリメジャーの背景に赤

黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます

ndash  概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます

3813

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒10 Show Me gt ヒートマップ

bull  ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます

bull  例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード

bull  応用例ndash  四角形のサイズを変えますヒート マップでは四角形

のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます

ndash  四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります

3913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒11 Show Me gt ハイライト表

bull  ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます

bull  例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口

bull  応用例例ndash  ハイライト表を他の種類のチャートと組み合わせる たと

えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります

4013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 22: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

2213

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2313

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2413

ディメンションbull  定性的な情報やカテゴリ情報を含むフィール

ドを『ディメンション』として扱います

bull  テキストや日付の値を持つフィールドもこれらに含まれます

bull  行行または列列の棚にドラッグドロップをする事でヘッダを生成します

メジャーbull  行行または列列の棚にドラッグドロップを行行う

と『軸』を生成します

bull  デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2513

フィルタ

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2613

マーク gt カラー

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2713

マーク gt サイズ マーク gt ラベル

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  テキストテーブル(text tables)b  ヒートマップ(heat maps)c  ハイライトテーブル(highlight tables)d  記号マップ(symbol maps)e  色塗りマップ(filled maps)f  円グラフ(pie charts)g  水平棒グラフ(horizontal bars)h  積み上げ棒グラフ(stacked bars)i  並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j  ツリーマップ(tree maps)k  円ビュー(circle views)l  並列列円(side-‐‑‒by-‐‑‒side circles)

2813

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  線グラフ連続(lines continuous)b  線グラフ不不連続(lines discrete)c  二重線(dual lines)d  エリアチャート連続(area charts continuous)e  エリアチャート不不連続(area charts discrete)f  2つの組み合わせ(dual combination)g  散布図(scatter plots)h  ヒストグラム(histgram)i  箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j  ガントビュー(gantt view)k  ブレットグラフ(bullet graphs)l  パックバブル(packed bubbles)

2913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒1 Show Me gt 棒グラフ

bull  ひと目で最高値と最低値を見見ることができます

bull  棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます

bull  例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較

bull  応用例例ndash  1つのダッシュボードに複数の棒グラフを使用多数のス

プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります

ndash  棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます

ndash  積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です

ndash  棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます

ndash  バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります

3013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒2 Show Me gt 折れ線グラフ

bull  折れ線グラフは個々の数値データ ポイントを「線」で結びます

bull  それにより値の連続性をわかりやすく視覚化することが可能です

bull  主に一定期間にわたる傾向を表す際に使用します

bull  応用例例ndash  折れ線グラフと棒グラフを組み併せ特定の株価の1日あ

たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます

ndash  線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます

3113

7HFKHDGVampDSLWDO5DLVHGLQ

Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1

$0

$5000

$10000

$15000

$20000

$25000

$30000

$35000

Run

ning

Sum

of O

ffer A

mou

nt (i

n m

il)

7HFKQRORJ

(QHUJ

+HDOWKampDUH

ampRQVXPHU

XVLQHVV6HUYLFHV5HDO(VWDWH

6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV

ampOLFNKHUHWRFOHDUILOWHU

5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒3 Show Me gt 円グラフ

bull  円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです

bull  円グラフは最も誤用されやすいグラフです

bull  データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします

bull  円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように

bull  例例比率率率を表す

bull  応用例ndash  円の扇形を6つまでに制限します比率率率が6つ以上ある場

合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります

ndash  円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします

3213

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒4 Show Me gt マップ

bull  郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります

bull  例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域

bull  応用例例ndash  マップを他の種類のチャートグラフ表のフィルターと

して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます

ndash  マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます

3313

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒5 Show Me gt 散布図

bull  一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます

bull  例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料

bull  応用例 ndash  傾向線最良良適合線を追加します データの相関性に傾向

線を追加すると結果がより明瞭になります

ndash  フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます

ndash  情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります

3413

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒6 Show Me gt ガントチャート

bull  ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です

bull  プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます

bull  応用例ndash  色を追加するガント チャート内のバーの色を変えるこ

とで変数の重要側面をすばやく 伝えることができますndash  マップや他の種類のチャートをガントチャートと組み合わ

せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます

3513

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒7 Show Me gt バブルチャート

bull  バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください

bull  様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す

bull  例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率

bull  応用例ndash  散布図のデータを強調する 各データ ポイントのサイズ

や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます

ndash  マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります

3613

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒8 Show Me gt ヒストグラムbull  ヒストグラムはグループ間でのデータの分散を表示

する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです

bull  データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます

bull  データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます

bull  例例ndash  データのグループ化をテストする データに合ったグ

ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます

ndash  フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります

3713

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒9 Show Me gt ブレットグラフbull  目標がある場合その目標までの進行行状況を追跡するにはブレッ

トグラフが適しています

bull  本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです

bull  ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します

bull  ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)

bull  例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)

bull  応用例例ndash  色を使用して達成のしきい値を示すプライマリメジャーの背景に赤

黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます

ndash  概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます

3813

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒10 Show Me gt ヒートマップ

bull  ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます

bull  例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード

bull  応用例ndash  四角形のサイズを変えますヒート マップでは四角形

のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます

ndash  四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります

3913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒11 Show Me gt ハイライト表

bull  ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます

bull  例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口

bull  応用例例ndash  ハイライト表を他の種類のチャートと組み合わせる たと

えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります

4013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 23: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2313

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2413

ディメンションbull  定性的な情報やカテゴリ情報を含むフィール

ドを『ディメンション』として扱います

bull  テキストや日付の値を持つフィールドもこれらに含まれます

bull  行行または列列の棚にドラッグドロップをする事でヘッダを生成します

メジャーbull  行行または列列の棚にドラッグドロップを行行う

と『軸』を生成します

bull  デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2513

フィルタ

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2613

マーク gt カラー

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2713

マーク gt サイズ マーク gt ラベル

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  テキストテーブル(text tables)b  ヒートマップ(heat maps)c  ハイライトテーブル(highlight tables)d  記号マップ(symbol maps)e  色塗りマップ(filled maps)f  円グラフ(pie charts)g  水平棒グラフ(horizontal bars)h  積み上げ棒グラフ(stacked bars)i  並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j  ツリーマップ(tree maps)k  円ビュー(circle views)l  並列列円(side-‐‑‒by-‐‑‒side circles)

2813

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  線グラフ連続(lines continuous)b  線グラフ不不連続(lines discrete)c  二重線(dual lines)d  エリアチャート連続(area charts continuous)e  エリアチャート不不連続(area charts discrete)f  2つの組み合わせ(dual combination)g  散布図(scatter plots)h  ヒストグラム(histgram)i  箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j  ガントビュー(gantt view)k  ブレットグラフ(bullet graphs)l  パックバブル(packed bubbles)

2913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒1 Show Me gt 棒グラフ

bull  ひと目で最高値と最低値を見見ることができます

bull  棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます

bull  例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較

bull  応用例例ndash  1つのダッシュボードに複数の棒グラフを使用多数のス

プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります

ndash  棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます

ndash  積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です

ndash  棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます

ndash  バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります

3013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒2 Show Me gt 折れ線グラフ

bull  折れ線グラフは個々の数値データ ポイントを「線」で結びます

bull  それにより値の連続性をわかりやすく視覚化することが可能です

bull  主に一定期間にわたる傾向を表す際に使用します

bull  応用例例ndash  折れ線グラフと棒グラフを組み併せ特定の株価の1日あ

たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます

ndash  線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます

3113

7HFKHDGVampDSLWDO5DLVHGLQ

Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1

$0

$5000

$10000

$15000

$20000

$25000

$30000

$35000

Run

ning

Sum

of O

ffer A

mou

nt (i

n m

il)

7HFKQRORJ

(QHUJ

+HDOWKampDUH

ampRQVXPHU

XVLQHVV6HUYLFHV5HDO(VWDWH

6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV

ampOLFNKHUHWRFOHDUILOWHU

5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒3 Show Me gt 円グラフ

bull  円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです

bull  円グラフは最も誤用されやすいグラフです

bull  データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします

bull  円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように

bull  例例比率率率を表す

bull  応用例ndash  円の扇形を6つまでに制限します比率率率が6つ以上ある場

合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります

ndash  円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします

3213

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒4 Show Me gt マップ

bull  郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります

bull  例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域

bull  応用例例ndash  マップを他の種類のチャートグラフ表のフィルターと

して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます

ndash  マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます

3313

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒5 Show Me gt 散布図

bull  一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます

bull  例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料

bull  応用例 ndash  傾向線最良良適合線を追加します データの相関性に傾向

線を追加すると結果がより明瞭になります

ndash  フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます

ndash  情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります

3413

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒6 Show Me gt ガントチャート

bull  ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です

bull  プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます

bull  応用例ndash  色を追加するガント チャート内のバーの色を変えるこ

とで変数の重要側面をすばやく 伝えることができますndash  マップや他の種類のチャートをガントチャートと組み合わ

せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます

3513

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒7 Show Me gt バブルチャート

bull  バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください

bull  様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す

bull  例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率

bull  応用例ndash  散布図のデータを強調する 各データ ポイントのサイズ

や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます

ndash  マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります

3613

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒8 Show Me gt ヒストグラムbull  ヒストグラムはグループ間でのデータの分散を表示

する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです

bull  データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます

bull  データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます

bull  例例ndash  データのグループ化をテストする データに合ったグ

ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます

ndash  フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります

3713

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒9 Show Me gt ブレットグラフbull  目標がある場合その目標までの進行行状況を追跡するにはブレッ

トグラフが適しています

bull  本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです

bull  ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します

bull  ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)

bull  例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)

bull  応用例例ndash  色を使用して達成のしきい値を示すプライマリメジャーの背景に赤

黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます

ndash  概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます

3813

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒10 Show Me gt ヒートマップ

bull  ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます

bull  例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード

bull  応用例ndash  四角形のサイズを変えますヒート マップでは四角形

のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます

ndash  四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります

3913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒11 Show Me gt ハイライト表

bull  ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます

bull  例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口

bull  応用例例ndash  ハイライト表を他の種類のチャートと組み合わせる たと

えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります

4013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 24: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2413

ディメンションbull  定性的な情報やカテゴリ情報を含むフィール

ドを『ディメンション』として扱います

bull  テキストや日付の値を持つフィールドもこれらに含まれます

bull  行行または列列の棚にドラッグドロップをする事でヘッダを生成します

メジャーbull  行行または列列の棚にドラッグドロップを行行う

と『軸』を生成します

bull  デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2513

フィルタ

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2613

マーク gt カラー

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2713

マーク gt サイズ マーク gt ラベル

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  テキストテーブル(text tables)b  ヒートマップ(heat maps)c  ハイライトテーブル(highlight tables)d  記号マップ(symbol maps)e  色塗りマップ(filled maps)f  円グラフ(pie charts)g  水平棒グラフ(horizontal bars)h  積み上げ棒グラフ(stacked bars)i  並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j  ツリーマップ(tree maps)k  円ビュー(circle views)l  並列列円(side-‐‑‒by-‐‑‒side circles)

2813

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  線グラフ連続(lines continuous)b  線グラフ不不連続(lines discrete)c  二重線(dual lines)d  エリアチャート連続(area charts continuous)e  エリアチャート不不連続(area charts discrete)f  2つの組み合わせ(dual combination)g  散布図(scatter plots)h  ヒストグラム(histgram)i  箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j  ガントビュー(gantt view)k  ブレットグラフ(bullet graphs)l  パックバブル(packed bubbles)

2913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒1 Show Me gt 棒グラフ

bull  ひと目で最高値と最低値を見見ることができます

bull  棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます

bull  例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較

bull  応用例例ndash  1つのダッシュボードに複数の棒グラフを使用多数のス

プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります

ndash  棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます

ndash  積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です

ndash  棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます

ndash  バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります

3013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒2 Show Me gt 折れ線グラフ

bull  折れ線グラフは個々の数値データ ポイントを「線」で結びます

bull  それにより値の連続性をわかりやすく視覚化することが可能です

bull  主に一定期間にわたる傾向を表す際に使用します

bull  応用例例ndash  折れ線グラフと棒グラフを組み併せ特定の株価の1日あ

たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます

ndash  線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます

3113

7HFKHDGVampDSLWDO5DLVHGLQ

Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1

$0

$5000

$10000

$15000

$20000

$25000

$30000

$35000

Run

ning

Sum

of O

ffer A

mou

nt (i

n m

il)

7HFKQRORJ

(QHUJ

+HDOWKampDUH

ampRQVXPHU

XVLQHVV6HUYLFHV5HDO(VWDWH

6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV

ampOLFNKHUHWRFOHDUILOWHU

5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒3 Show Me gt 円グラフ

bull  円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです

bull  円グラフは最も誤用されやすいグラフです

bull  データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします

bull  円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように

bull  例例比率率率を表す

bull  応用例ndash  円の扇形を6つまでに制限します比率率率が6つ以上ある場

合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります

ndash  円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします

3213

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒4 Show Me gt マップ

bull  郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります

bull  例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域

bull  応用例例ndash  マップを他の種類のチャートグラフ表のフィルターと

して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます

ndash  マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます

3313

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒5 Show Me gt 散布図

bull  一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます

bull  例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料

bull  応用例 ndash  傾向線最良良適合線を追加します データの相関性に傾向

線を追加すると結果がより明瞭になります

ndash  フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます

ndash  情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります

3413

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒6 Show Me gt ガントチャート

bull  ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です

bull  プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます

bull  応用例ndash  色を追加するガント チャート内のバーの色を変えるこ

とで変数の重要側面をすばやく 伝えることができますndash  マップや他の種類のチャートをガントチャートと組み合わ

せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます

3513

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒7 Show Me gt バブルチャート

bull  バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください

bull  様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す

bull  例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率

bull  応用例ndash  散布図のデータを強調する 各データ ポイントのサイズ

や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます

ndash  マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります

3613

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒8 Show Me gt ヒストグラムbull  ヒストグラムはグループ間でのデータの分散を表示

する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです

bull  データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます

bull  データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます

bull  例例ndash  データのグループ化をテストする データに合ったグ

ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます

ndash  フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります

3713

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒9 Show Me gt ブレットグラフbull  目標がある場合その目標までの進行行状況を追跡するにはブレッ

トグラフが適しています

bull  本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです

bull  ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します

bull  ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)

bull  例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)

bull  応用例例ndash  色を使用して達成のしきい値を示すプライマリメジャーの背景に赤

黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます

ndash  概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます

3813

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒10 Show Me gt ヒートマップ

bull  ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます

bull  例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード

bull  応用例ndash  四角形のサイズを変えますヒート マップでは四角形

のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます

ndash  四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります

3913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒11 Show Me gt ハイライト表

bull  ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます

bull  例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口

bull  応用例例ndash  ハイライト表を他の種類のチャートと組み合わせる たと

えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります

4013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 25: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2513

フィルタ

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2613

マーク gt カラー

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2713

マーク gt サイズ マーク gt ラベル

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  テキストテーブル(text tables)b  ヒートマップ(heat maps)c  ハイライトテーブル(highlight tables)d  記号マップ(symbol maps)e  色塗りマップ(filled maps)f  円グラフ(pie charts)g  水平棒グラフ(horizontal bars)h  積み上げ棒グラフ(stacked bars)i  並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j  ツリーマップ(tree maps)k  円ビュー(circle views)l  並列列円(side-‐‑‒by-‐‑‒side circles)

2813

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  線グラフ連続(lines continuous)b  線グラフ不不連続(lines discrete)c  二重線(dual lines)d  エリアチャート連続(area charts continuous)e  エリアチャート不不連続(area charts discrete)f  2つの組み合わせ(dual combination)g  散布図(scatter plots)h  ヒストグラム(histgram)i  箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j  ガントビュー(gantt view)k  ブレットグラフ(bullet graphs)l  パックバブル(packed bubbles)

2913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒1 Show Me gt 棒グラフ

bull  ひと目で最高値と最低値を見見ることができます

bull  棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます

bull  例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較

bull  応用例例ndash  1つのダッシュボードに複数の棒グラフを使用多数のス

プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります

ndash  棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます

ndash  積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です

ndash  棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます

ndash  バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります

3013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒2 Show Me gt 折れ線グラフ

bull  折れ線グラフは個々の数値データ ポイントを「線」で結びます

bull  それにより値の連続性をわかりやすく視覚化することが可能です

bull  主に一定期間にわたる傾向を表す際に使用します

bull  応用例例ndash  折れ線グラフと棒グラフを組み併せ特定の株価の1日あ

たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます

ndash  線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます

3113

7HFKHDGVampDSLWDO5DLVHGLQ

Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1

$0

$5000

$10000

$15000

$20000

$25000

$30000

$35000

Run

ning

Sum

of O

ffer A

mou

nt (i

n m

il)

7HFKQRORJ

(QHUJ

+HDOWKampDUH

ampRQVXPHU

XVLQHVV6HUYLFHV5HDO(VWDWH

6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV

ampOLFNKHUHWRFOHDUILOWHU

5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒3 Show Me gt 円グラフ

bull  円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです

bull  円グラフは最も誤用されやすいグラフです

bull  データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします

bull  円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように

bull  例例比率率率を表す

bull  応用例ndash  円の扇形を6つまでに制限します比率率率が6つ以上ある場

合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります

ndash  円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします

3213

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒4 Show Me gt マップ

bull  郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります

bull  例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域

bull  応用例例ndash  マップを他の種類のチャートグラフ表のフィルターと

して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます

ndash  マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます

3313

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒5 Show Me gt 散布図

bull  一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます

bull  例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料

bull  応用例 ndash  傾向線最良良適合線を追加します データの相関性に傾向

線を追加すると結果がより明瞭になります

ndash  フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます

ndash  情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります

3413

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒6 Show Me gt ガントチャート

bull  ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です

bull  プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます

bull  応用例ndash  色を追加するガント チャート内のバーの色を変えるこ

とで変数の重要側面をすばやく 伝えることができますndash  マップや他の種類のチャートをガントチャートと組み合わ

せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます

3513

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒7 Show Me gt バブルチャート

bull  バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください

bull  様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す

bull  例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率

bull  応用例ndash  散布図のデータを強調する 各データ ポイントのサイズ

や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます

ndash  マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります

3613

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒8 Show Me gt ヒストグラムbull  ヒストグラムはグループ間でのデータの分散を表示

する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです

bull  データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます

bull  データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます

bull  例例ndash  データのグループ化をテストする データに合ったグ

ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます

ndash  フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります

3713

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒9 Show Me gt ブレットグラフbull  目標がある場合その目標までの進行行状況を追跡するにはブレッ

トグラフが適しています

bull  本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです

bull  ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します

bull  ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)

bull  例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)

bull  応用例例ndash  色を使用して達成のしきい値を示すプライマリメジャーの背景に赤

黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます

ndash  概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます

3813

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒10 Show Me gt ヒートマップ

bull  ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます

bull  例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード

bull  応用例ndash  四角形のサイズを変えますヒート マップでは四角形

のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます

ndash  四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります

3913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒11 Show Me gt ハイライト表

bull  ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます

bull  例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口

bull  応用例例ndash  ハイライト表を他の種類のチャートと組み合わせる たと

えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります

4013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 26: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2613

マーク gt カラー

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2713

マーク gt サイズ マーク gt ラベル

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  テキストテーブル(text tables)b  ヒートマップ(heat maps)c  ハイライトテーブル(highlight tables)d  記号マップ(symbol maps)e  色塗りマップ(filled maps)f  円グラフ(pie charts)g  水平棒グラフ(horizontal bars)h  積み上げ棒グラフ(stacked bars)i  並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j  ツリーマップ(tree maps)k  円ビュー(circle views)l  並列列円(side-‐‑‒by-‐‑‒side circles)

2813

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  線グラフ連続(lines continuous)b  線グラフ不不連続(lines discrete)c  二重線(dual lines)d  エリアチャート連続(area charts continuous)e  エリアチャート不不連続(area charts discrete)f  2つの組み合わせ(dual combination)g  散布図(scatter plots)h  ヒストグラム(histgram)i  箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j  ガントビュー(gantt view)k  ブレットグラフ(bullet graphs)l  パックバブル(packed bubbles)

2913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒1 Show Me gt 棒グラフ

bull  ひと目で最高値と最低値を見見ることができます

bull  棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます

bull  例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較

bull  応用例例ndash  1つのダッシュボードに複数の棒グラフを使用多数のス

プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります

ndash  棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます

ndash  積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です

ndash  棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます

ndash  バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります

3013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒2 Show Me gt 折れ線グラフ

bull  折れ線グラフは個々の数値データ ポイントを「線」で結びます

bull  それにより値の連続性をわかりやすく視覚化することが可能です

bull  主に一定期間にわたる傾向を表す際に使用します

bull  応用例例ndash  折れ線グラフと棒グラフを組み併せ特定の株価の1日あ

たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます

ndash  線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます

3113

7HFKHDGVampDSLWDO5DLVHGLQ

Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1

$0

$5000

$10000

$15000

$20000

$25000

$30000

$35000

Run

ning

Sum

of O

ffer A

mou

nt (i

n m

il)

7HFKQRORJ

(QHUJ

+HDOWKampDUH

ampRQVXPHU

XVLQHVV6HUYLFHV5HDO(VWDWH

6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV

ampOLFNKHUHWRFOHDUILOWHU

5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒3 Show Me gt 円グラフ

bull  円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです

bull  円グラフは最も誤用されやすいグラフです

bull  データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします

bull  円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように

bull  例例比率率率を表す

bull  応用例ndash  円の扇形を6つまでに制限します比率率率が6つ以上ある場

合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります

ndash  円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします

3213

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒4 Show Me gt マップ

bull  郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります

bull  例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域

bull  応用例例ndash  マップを他の種類のチャートグラフ表のフィルターと

して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます

ndash  マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます

3313

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒5 Show Me gt 散布図

bull  一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます

bull  例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料

bull  応用例 ndash  傾向線最良良適合線を追加します データの相関性に傾向

線を追加すると結果がより明瞭になります

ndash  フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます

ndash  情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります

3413

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒6 Show Me gt ガントチャート

bull  ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です

bull  プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます

bull  応用例ndash  色を追加するガント チャート内のバーの色を変えるこ

とで変数の重要側面をすばやく 伝えることができますndash  マップや他の種類のチャートをガントチャートと組み合わ

せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます

3513

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒7 Show Me gt バブルチャート

bull  バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください

bull  様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す

bull  例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率

bull  応用例ndash  散布図のデータを強調する 各データ ポイントのサイズ

や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます

ndash  マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります

3613

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒8 Show Me gt ヒストグラムbull  ヒストグラムはグループ間でのデータの分散を表示

する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです

bull  データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます

bull  データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます

bull  例例ndash  データのグループ化をテストする データに合ったグ

ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます

ndash  フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります

3713

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒9 Show Me gt ブレットグラフbull  目標がある場合その目標までの進行行状況を追跡するにはブレッ

トグラフが適しています

bull  本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです

bull  ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します

bull  ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)

bull  例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)

bull  応用例例ndash  色を使用して達成のしきい値を示すプライマリメジャーの背景に赤

黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます

ndash  概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます

3813

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒10 Show Me gt ヒートマップ

bull  ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます

bull  例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード

bull  応用例ndash  四角形のサイズを変えますヒート マップでは四角形

のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます

ndash  四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります

3913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒11 Show Me gt ハイライト表

bull  ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます

bull  例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口

bull  応用例例ndash  ハイライト表を他の種類のチャートと組み合わせる たと

えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります

4013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 27: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

3 画面構成

2713

マーク gt サイズ マーク gt ラベル

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  テキストテーブル(text tables)b  ヒートマップ(heat maps)c  ハイライトテーブル(highlight tables)d  記号マップ(symbol maps)e  色塗りマップ(filled maps)f  円グラフ(pie charts)g  水平棒グラフ(horizontal bars)h  積み上げ棒グラフ(stacked bars)i  並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j  ツリーマップ(tree maps)k  円ビュー(circle views)l  並列列円(side-‐‑‒by-‐‑‒side circles)

2813

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  線グラフ連続(lines continuous)b  線グラフ不不連続(lines discrete)c  二重線(dual lines)d  エリアチャート連続(area charts continuous)e  エリアチャート不不連続(area charts discrete)f  2つの組み合わせ(dual combination)g  散布図(scatter plots)h  ヒストグラム(histgram)i  箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j  ガントビュー(gantt view)k  ブレットグラフ(bullet graphs)l  パックバブル(packed bubbles)

2913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒1 Show Me gt 棒グラフ

bull  ひと目で最高値と最低値を見見ることができます

bull  棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます

bull  例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較

bull  応用例例ndash  1つのダッシュボードに複数の棒グラフを使用多数のス

プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります

ndash  棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます

ndash  積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です

ndash  棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます

ndash  バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります

3013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒2 Show Me gt 折れ線グラフ

bull  折れ線グラフは個々の数値データ ポイントを「線」で結びます

bull  それにより値の連続性をわかりやすく視覚化することが可能です

bull  主に一定期間にわたる傾向を表す際に使用します

bull  応用例例ndash  折れ線グラフと棒グラフを組み併せ特定の株価の1日あ

たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます

ndash  線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます

3113

7HFKHDGVampDSLWDO5DLVHGLQ

Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1

$0

$5000

$10000

$15000

$20000

$25000

$30000

$35000

Run

ning

Sum

of O

ffer A

mou

nt (i

n m

il)

7HFKQRORJ

(QHUJ

+HDOWKampDUH

ampRQVXPHU

XVLQHVV6HUYLFHV5HDO(VWDWH

6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV

ampOLFNKHUHWRFOHDUILOWHU

5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒3 Show Me gt 円グラフ

bull  円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです

bull  円グラフは最も誤用されやすいグラフです

bull  データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします

bull  円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように

bull  例例比率率率を表す

bull  応用例ndash  円の扇形を6つまでに制限します比率率率が6つ以上ある場

合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります

ndash  円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします

3213

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒4 Show Me gt マップ

bull  郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります

bull  例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域

bull  応用例例ndash  マップを他の種類のチャートグラフ表のフィルターと

して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます

ndash  マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます

3313

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒5 Show Me gt 散布図

bull  一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます

bull  例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料

bull  応用例 ndash  傾向線最良良適合線を追加します データの相関性に傾向

線を追加すると結果がより明瞭になります

ndash  フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます

ndash  情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります

3413

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒6 Show Me gt ガントチャート

bull  ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です

bull  プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます

bull  応用例ndash  色を追加するガント チャート内のバーの色を変えるこ

とで変数の重要側面をすばやく 伝えることができますndash  マップや他の種類のチャートをガントチャートと組み合わ

せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます

3513

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒7 Show Me gt バブルチャート

bull  バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください

bull  様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す

bull  例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率

bull  応用例ndash  散布図のデータを強調する 各データ ポイントのサイズ

や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます

ndash  マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります

3613

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒8 Show Me gt ヒストグラムbull  ヒストグラムはグループ間でのデータの分散を表示

する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです

bull  データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます

bull  データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます

bull  例例ndash  データのグループ化をテストする データに合ったグ

ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます

ndash  フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります

3713

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒9 Show Me gt ブレットグラフbull  目標がある場合その目標までの進行行状況を追跡するにはブレッ

トグラフが適しています

bull  本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです

bull  ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します

bull  ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)

bull  例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)

bull  応用例例ndash  色を使用して達成のしきい値を示すプライマリメジャーの背景に赤

黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます

ndash  概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます

3813

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒10 Show Me gt ヒートマップ

bull  ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます

bull  例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード

bull  応用例ndash  四角形のサイズを変えますヒート マップでは四角形

のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます

ndash  四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります

3913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒11 Show Me gt ハイライト表

bull  ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます

bull  例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口

bull  応用例例ndash  ハイライト表を他の種類のチャートと組み合わせる たと

えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります

4013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 28: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  テキストテーブル(text tables)b  ヒートマップ(heat maps)c  ハイライトテーブル(highlight tables)d  記号マップ(symbol maps)e  色塗りマップ(filled maps)f  円グラフ(pie charts)g  水平棒グラフ(horizontal bars)h  積み上げ棒グラフ(stacked bars)i  並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j  ツリーマップ(tree maps)k  円ビュー(circle views)l  並列列円(side-‐‑‒by-‐‑‒side circles)

2813

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  線グラフ連続(lines continuous)b  線グラフ不不連続(lines discrete)c  二重線(dual lines)d  エリアチャート連続(area charts continuous)e  エリアチャート不不連続(area charts discrete)f  2つの組み合わせ(dual combination)g  散布図(scatter plots)h  ヒストグラム(histgram)i  箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j  ガントビュー(gantt view)k  ブレットグラフ(bullet graphs)l  パックバブル(packed bubbles)

2913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒1 Show Me gt 棒グラフ

bull  ひと目で最高値と最低値を見見ることができます

bull  棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます

bull  例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較

bull  応用例例ndash  1つのダッシュボードに複数の棒グラフを使用多数のス

プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります

ndash  棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます

ndash  積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です

ndash  棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます

ndash  バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります

3013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒2 Show Me gt 折れ線グラフ

bull  折れ線グラフは個々の数値データ ポイントを「線」で結びます

bull  それにより値の連続性をわかりやすく視覚化することが可能です

bull  主に一定期間にわたる傾向を表す際に使用します

bull  応用例例ndash  折れ線グラフと棒グラフを組み併せ特定の株価の1日あ

たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます

ndash  線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます

3113

7HFKHDGVampDSLWDO5DLVHGLQ

Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1

$0

$5000

$10000

$15000

$20000

$25000

$30000

$35000

Run

ning

Sum

of O

ffer A

mou

nt (i

n m

il)

7HFKQRORJ

(QHUJ

+HDOWKampDUH

ampRQVXPHU

XVLQHVV6HUYLFHV5HDO(VWDWH

6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV

ampOLFNKHUHWRFOHDUILOWHU

5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒3 Show Me gt 円グラフ

bull  円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです

bull  円グラフは最も誤用されやすいグラフです

bull  データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします

bull  円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように

bull  例例比率率率を表す

bull  応用例ndash  円の扇形を6つまでに制限します比率率率が6つ以上ある場

合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります

ndash  円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします

3213

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒4 Show Me gt マップ

bull  郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります

bull  例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域

bull  応用例例ndash  マップを他の種類のチャートグラフ表のフィルターと

して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます

ndash  マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます

3313

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒5 Show Me gt 散布図

bull  一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます

bull  例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料

bull  応用例 ndash  傾向線最良良適合線を追加します データの相関性に傾向

線を追加すると結果がより明瞭になります

ndash  フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます

ndash  情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります

3413

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒6 Show Me gt ガントチャート

bull  ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です

bull  プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます

bull  応用例ndash  色を追加するガント チャート内のバーの色を変えるこ

とで変数の重要側面をすばやく 伝えることができますndash  マップや他の種類のチャートをガントチャートと組み合わ

せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます

3513

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒7 Show Me gt バブルチャート

bull  バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください

bull  様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す

bull  例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率

bull  応用例ndash  散布図のデータを強調する 各データ ポイントのサイズ

や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます

ndash  マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります

3613

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒8 Show Me gt ヒストグラムbull  ヒストグラムはグループ間でのデータの分散を表示

する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです

bull  データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます

bull  データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます

bull  例例ndash  データのグループ化をテストする データに合ったグ

ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます

ndash  フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります

3713

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒9 Show Me gt ブレットグラフbull  目標がある場合その目標までの進行行状況を追跡するにはブレッ

トグラフが適しています

bull  本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです

bull  ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します

bull  ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)

bull  例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)

bull  応用例例ndash  色を使用して達成のしきい値を示すプライマリメジャーの背景に赤

黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます

ndash  概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます

3813

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒10 Show Me gt ヒートマップ

bull  ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます

bull  例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード

bull  応用例ndash  四角形のサイズを変えますヒート マップでは四角形

のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます

ndash  四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります

3913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒11 Show Me gt ハイライト表

bull  ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます

bull  例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口

bull  応用例例ndash  ハイライト表を他の種類のチャートと組み合わせる たと

えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります

4013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 29: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

3 Show Me(表示形式)

a  線グラフ連続(lines continuous)b  線グラフ不不連続(lines discrete)c  二重線(dual lines)d  エリアチャート連続(area charts continuous)e  エリアチャート不不連続(area charts discrete)f  2つの組み合わせ(dual combination)g  散布図(scatter plots)h  ヒストグラム(histgram)i  箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j  ガントビュー(gantt view)k  ブレットグラフ(bullet graphs)l  パックバブル(packed bubbles)

2913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒1 Show Me gt 棒グラフ

bull  ひと目で最高値と最低値を見見ることができます

bull  棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます

bull  例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較

bull  応用例例ndash  1つのダッシュボードに複数の棒グラフを使用多数のス

プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります

ndash  棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます

ndash  積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です

ndash  棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます

ndash  バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります

3013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒2 Show Me gt 折れ線グラフ

bull  折れ線グラフは個々の数値データ ポイントを「線」で結びます

bull  それにより値の連続性をわかりやすく視覚化することが可能です

bull  主に一定期間にわたる傾向を表す際に使用します

bull  応用例例ndash  折れ線グラフと棒グラフを組み併せ特定の株価の1日あ

たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます

ndash  線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます

3113

7HFKHDGVampDSLWDO5DLVHGLQ

Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1

$0

$5000

$10000

$15000

$20000

$25000

$30000

$35000

Run

ning

Sum

of O

ffer A

mou

nt (i

n m

il)

7HFKQRORJ

(QHUJ

+HDOWKampDUH

ampRQVXPHU

XVLQHVV6HUYLFHV5HDO(VWDWH

6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV

ampOLFNKHUHWRFOHDUILOWHU

5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒3 Show Me gt 円グラフ

bull  円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです

bull  円グラフは最も誤用されやすいグラフです

bull  データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします

bull  円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように

bull  例例比率率率を表す

bull  応用例ndash  円の扇形を6つまでに制限します比率率率が6つ以上ある場

合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります

ndash  円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします

3213

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒4 Show Me gt マップ

bull  郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります

bull  例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域

bull  応用例例ndash  マップを他の種類のチャートグラフ表のフィルターと

して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます

ndash  マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます

3313

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒5 Show Me gt 散布図

bull  一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます

bull  例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料

bull  応用例 ndash  傾向線最良良適合線を追加します データの相関性に傾向

線を追加すると結果がより明瞭になります

ndash  フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます

ndash  情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります

3413

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒6 Show Me gt ガントチャート

bull  ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です

bull  プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます

bull  応用例ndash  色を追加するガント チャート内のバーの色を変えるこ

とで変数の重要側面をすばやく 伝えることができますndash  マップや他の種類のチャートをガントチャートと組み合わ

せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます

3513

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒7 Show Me gt バブルチャート

bull  バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください

bull  様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す

bull  例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率

bull  応用例ndash  散布図のデータを強調する 各データ ポイントのサイズ

や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます

ndash  マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります

3613

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒8 Show Me gt ヒストグラムbull  ヒストグラムはグループ間でのデータの分散を表示

する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです

bull  データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます

bull  データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます

bull  例例ndash  データのグループ化をテストする データに合ったグ

ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます

ndash  フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります

3713

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒9 Show Me gt ブレットグラフbull  目標がある場合その目標までの進行行状況を追跡するにはブレッ

トグラフが適しています

bull  本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです

bull  ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します

bull  ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)

bull  例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)

bull  応用例例ndash  色を使用して達成のしきい値を示すプライマリメジャーの背景に赤

黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます

ndash  概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます

3813

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒10 Show Me gt ヒートマップ

bull  ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます

bull  例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード

bull  応用例ndash  四角形のサイズを変えますヒート マップでは四角形

のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます

ndash  四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります

3913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒11 Show Me gt ハイライト表

bull  ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます

bull  例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口

bull  応用例例ndash  ハイライト表を他の種類のチャートと組み合わせる たと

えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります

4013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 30: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒1 Show Me gt 棒グラフ

bull  ひと目で最高値と最低値を見見ることができます

bull  棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます

bull  例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較

bull  応用例例ndash  1つのダッシュボードに複数の棒グラフを使用多数のス

プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります

ndash  棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます

ndash  積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です

ndash  棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます

ndash  バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります

3013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒2 Show Me gt 折れ線グラフ

bull  折れ線グラフは個々の数値データ ポイントを「線」で結びます

bull  それにより値の連続性をわかりやすく視覚化することが可能です

bull  主に一定期間にわたる傾向を表す際に使用します

bull  応用例例ndash  折れ線グラフと棒グラフを組み併せ特定の株価の1日あ

たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます

ndash  線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます

3113

7HFKHDGVampDSLWDO5DLVHGLQ

Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1

$0

$5000

$10000

$15000

$20000

$25000

$30000

$35000

Run

ning

Sum

of O

ffer A

mou

nt (i

n m

il)

7HFKQRORJ

(QHUJ

+HDOWKampDUH

ampRQVXPHU

XVLQHVV6HUYLFHV5HDO(VWDWH

6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV

ampOLFNKHUHWRFOHDUILOWHU

5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒3 Show Me gt 円グラフ

bull  円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです

bull  円グラフは最も誤用されやすいグラフです

bull  データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします

bull  円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように

bull  例例比率率率を表す

bull  応用例ndash  円の扇形を6つまでに制限します比率率率が6つ以上ある場

合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります

ndash  円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします

3213

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒4 Show Me gt マップ

bull  郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります

bull  例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域

bull  応用例例ndash  マップを他の種類のチャートグラフ表のフィルターと

して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます

ndash  マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます

3313

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒5 Show Me gt 散布図

bull  一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます

bull  例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料

bull  応用例 ndash  傾向線最良良適合線を追加します データの相関性に傾向

線を追加すると結果がより明瞭になります

ndash  フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます

ndash  情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります

3413

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒6 Show Me gt ガントチャート

bull  ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です

bull  プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます

bull  応用例ndash  色を追加するガント チャート内のバーの色を変えるこ

とで変数の重要側面をすばやく 伝えることができますndash  マップや他の種類のチャートをガントチャートと組み合わ

せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます

3513

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒7 Show Me gt バブルチャート

bull  バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください

bull  様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す

bull  例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率

bull  応用例ndash  散布図のデータを強調する 各データ ポイントのサイズ

や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます

ndash  マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります

3613

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒8 Show Me gt ヒストグラムbull  ヒストグラムはグループ間でのデータの分散を表示

する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです

bull  データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます

bull  データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます

bull  例例ndash  データのグループ化をテストする データに合ったグ

ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます

ndash  フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります

3713

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒9 Show Me gt ブレットグラフbull  目標がある場合その目標までの進行行状況を追跡するにはブレッ

トグラフが適しています

bull  本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです

bull  ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します

bull  ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)

bull  例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)

bull  応用例例ndash  色を使用して達成のしきい値を示すプライマリメジャーの背景に赤

黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます

ndash  概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます

3813

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒10 Show Me gt ヒートマップ

bull  ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます

bull  例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード

bull  応用例ndash  四角形のサイズを変えますヒート マップでは四角形

のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます

ndash  四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります

3913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒11 Show Me gt ハイライト表

bull  ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます

bull  例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口

bull  応用例例ndash  ハイライト表を他の種類のチャートと組み合わせる たと

えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります

4013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 31: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒2 Show Me gt 折れ線グラフ

bull  折れ線グラフは個々の数値データ ポイントを「線」で結びます

bull  それにより値の連続性をわかりやすく視覚化することが可能です

bull  主に一定期間にわたる傾向を表す際に使用します

bull  応用例例ndash  折れ線グラフと棒グラフを組み併せ特定の株価の1日あ

たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます

ndash  線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます

3113

7HFKHDGVampDSLWDO5DLVHGLQ

Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1

$0

$5000

$10000

$15000

$20000

$25000

$30000

$35000

Run

ning

Sum

of O

ffer A

mou

nt (i

n m

il)

7HFKQRORJ

(QHUJ

+HDOWKampDUH

ampRQVXPHU

XVLQHVV6HUYLFHV5HDO(VWDWH

6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV

ampOLFNKHUHWRFOHDUILOWHU

5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒3 Show Me gt 円グラフ

bull  円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです

bull  円グラフは最も誤用されやすいグラフです

bull  データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします

bull  円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように

bull  例例比率率率を表す

bull  応用例ndash  円の扇形を6つまでに制限します比率率率が6つ以上ある場

合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります

ndash  円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします

3213

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒4 Show Me gt マップ

bull  郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります

bull  例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域

bull  応用例例ndash  マップを他の種類のチャートグラフ表のフィルターと

して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます

ndash  マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます

3313

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒5 Show Me gt 散布図

bull  一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます

bull  例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料

bull  応用例 ndash  傾向線最良良適合線を追加します データの相関性に傾向

線を追加すると結果がより明瞭になります

ndash  フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます

ndash  情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります

3413

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒6 Show Me gt ガントチャート

bull  ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です

bull  プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます

bull  応用例ndash  色を追加するガント チャート内のバーの色を変えるこ

とで変数の重要側面をすばやく 伝えることができますndash  マップや他の種類のチャートをガントチャートと組み合わ

せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます

3513

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒7 Show Me gt バブルチャート

bull  バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください

bull  様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す

bull  例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率

bull  応用例ndash  散布図のデータを強調する 各データ ポイントのサイズ

や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます

ndash  マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります

3613

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒8 Show Me gt ヒストグラムbull  ヒストグラムはグループ間でのデータの分散を表示

する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです

bull  データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます

bull  データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます

bull  例例ndash  データのグループ化をテストする データに合ったグ

ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます

ndash  フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります

3713

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒9 Show Me gt ブレットグラフbull  目標がある場合その目標までの進行行状況を追跡するにはブレッ

トグラフが適しています

bull  本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです

bull  ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します

bull  ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)

bull  例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)

bull  応用例例ndash  色を使用して達成のしきい値を示すプライマリメジャーの背景に赤

黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます

ndash  概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます

3813

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒10 Show Me gt ヒートマップ

bull  ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます

bull  例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード

bull  応用例ndash  四角形のサイズを変えますヒート マップでは四角形

のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます

ndash  四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります

3913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒11 Show Me gt ハイライト表

bull  ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます

bull  例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口

bull  応用例例ndash  ハイライト表を他の種類のチャートと組み合わせる たと

えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります

4013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 32: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒3 Show Me gt 円グラフ

bull  円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです

bull  円グラフは最も誤用されやすいグラフです

bull  データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします

bull  円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように

bull  例例比率率率を表す

bull  応用例ndash  円の扇形を6つまでに制限します比率率率が6つ以上ある場

合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります

ndash  円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします

3213

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒4 Show Me gt マップ

bull  郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります

bull  例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域

bull  応用例例ndash  マップを他の種類のチャートグラフ表のフィルターと

して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます

ndash  マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます

3313

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒5 Show Me gt 散布図

bull  一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます

bull  例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料

bull  応用例 ndash  傾向線最良良適合線を追加します データの相関性に傾向

線を追加すると結果がより明瞭になります

ndash  フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます

ndash  情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります

3413

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒6 Show Me gt ガントチャート

bull  ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です

bull  プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます

bull  応用例ndash  色を追加するガント チャート内のバーの色を変えるこ

とで変数の重要側面をすばやく 伝えることができますndash  マップや他の種類のチャートをガントチャートと組み合わ

せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます

3513

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒7 Show Me gt バブルチャート

bull  バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください

bull  様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す

bull  例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率

bull  応用例ndash  散布図のデータを強調する 各データ ポイントのサイズ

や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます

ndash  マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります

3613

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒8 Show Me gt ヒストグラムbull  ヒストグラムはグループ間でのデータの分散を表示

する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです

bull  データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます

bull  データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます

bull  例例ndash  データのグループ化をテストする データに合ったグ

ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます

ndash  フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります

3713

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒9 Show Me gt ブレットグラフbull  目標がある場合その目標までの進行行状況を追跡するにはブレッ

トグラフが適しています

bull  本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです

bull  ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します

bull  ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)

bull  例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)

bull  応用例例ndash  色を使用して達成のしきい値を示すプライマリメジャーの背景に赤

黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます

ndash  概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます

3813

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒10 Show Me gt ヒートマップ

bull  ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます

bull  例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード

bull  応用例ndash  四角形のサイズを変えますヒート マップでは四角形

のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます

ndash  四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります

3913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒11 Show Me gt ハイライト表

bull  ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます

bull  例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口

bull  応用例例ndash  ハイライト表を他の種類のチャートと組み合わせる たと

えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります

4013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 33: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒4 Show Me gt マップ

bull  郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります

bull  例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域

bull  応用例例ndash  マップを他の種類のチャートグラフ表のフィルターと

して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます

ndash  マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます

3313

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒5 Show Me gt 散布図

bull  一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます

bull  例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料

bull  応用例 ndash  傾向線最良良適合線を追加します データの相関性に傾向

線を追加すると結果がより明瞭になります

ndash  フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます

ndash  情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります

3413

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒6 Show Me gt ガントチャート

bull  ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です

bull  プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます

bull  応用例ndash  色を追加するガント チャート内のバーの色を変えるこ

とで変数の重要側面をすばやく 伝えることができますndash  マップや他の種類のチャートをガントチャートと組み合わ

せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます

3513

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒7 Show Me gt バブルチャート

bull  バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください

bull  様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す

bull  例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率

bull  応用例ndash  散布図のデータを強調する 各データ ポイントのサイズ

や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます

ndash  マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります

3613

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒8 Show Me gt ヒストグラムbull  ヒストグラムはグループ間でのデータの分散を表示

する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです

bull  データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます

bull  データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます

bull  例例ndash  データのグループ化をテストする データに合ったグ

ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます

ndash  フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります

3713

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒9 Show Me gt ブレットグラフbull  目標がある場合その目標までの進行行状況を追跡するにはブレッ

トグラフが適しています

bull  本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです

bull  ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します

bull  ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)

bull  例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)

bull  応用例例ndash  色を使用して達成のしきい値を示すプライマリメジャーの背景に赤

黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます

ndash  概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます

3813

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒10 Show Me gt ヒートマップ

bull  ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます

bull  例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード

bull  応用例ndash  四角形のサイズを変えますヒート マップでは四角形

のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます

ndash  四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります

3913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒11 Show Me gt ハイライト表

bull  ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます

bull  例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口

bull  応用例例ndash  ハイライト表を他の種類のチャートと組み合わせる たと

えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります

4013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 34: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒5 Show Me gt 散布図

bull  一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます

bull  例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料

bull  応用例 ndash  傾向線最良良適合線を追加します データの相関性に傾向

線を追加すると結果がより明瞭になります

ndash  フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます

ndash  情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります

3413

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒6 Show Me gt ガントチャート

bull  ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です

bull  プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます

bull  応用例ndash  色を追加するガント チャート内のバーの色を変えるこ

とで変数の重要側面をすばやく 伝えることができますndash  マップや他の種類のチャートをガントチャートと組み合わ

せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます

3513

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒7 Show Me gt バブルチャート

bull  バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください

bull  様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す

bull  例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率

bull  応用例ndash  散布図のデータを強調する 各データ ポイントのサイズ

や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます

ndash  マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります

3613

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒8 Show Me gt ヒストグラムbull  ヒストグラムはグループ間でのデータの分散を表示

する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです

bull  データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます

bull  データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます

bull  例例ndash  データのグループ化をテストする データに合ったグ

ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます

ndash  フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります

3713

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒9 Show Me gt ブレットグラフbull  目標がある場合その目標までの進行行状況を追跡するにはブレッ

トグラフが適しています

bull  本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです

bull  ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します

bull  ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)

bull  例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)

bull  応用例例ndash  色を使用して達成のしきい値を示すプライマリメジャーの背景に赤

黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます

ndash  概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます

3813

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒10 Show Me gt ヒートマップ

bull  ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます

bull  例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード

bull  応用例ndash  四角形のサイズを変えますヒート マップでは四角形

のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます

ndash  四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります

3913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒11 Show Me gt ハイライト表

bull  ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます

bull  例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口

bull  応用例例ndash  ハイライト表を他の種類のチャートと組み合わせる たと

えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります

4013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 35: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒6 Show Me gt ガントチャート

bull  ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です

bull  プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます

bull  応用例ndash  色を追加するガント チャート内のバーの色を変えるこ

とで変数の重要側面をすばやく 伝えることができますndash  マップや他の種類のチャートをガントチャートと組み合わ

せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます

3513

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒7 Show Me gt バブルチャート

bull  バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください

bull  様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す

bull  例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率

bull  応用例ndash  散布図のデータを強調する 各データ ポイントのサイズ

や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます

ndash  マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります

3613

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒8 Show Me gt ヒストグラムbull  ヒストグラムはグループ間でのデータの分散を表示

する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです

bull  データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます

bull  データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます

bull  例例ndash  データのグループ化をテストする データに合ったグ

ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます

ndash  フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります

3713

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒9 Show Me gt ブレットグラフbull  目標がある場合その目標までの進行行状況を追跡するにはブレッ

トグラフが適しています

bull  本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです

bull  ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します

bull  ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)

bull  例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)

bull  応用例例ndash  色を使用して達成のしきい値を示すプライマリメジャーの背景に赤

黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます

ndash  概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます

3813

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒10 Show Me gt ヒートマップ

bull  ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます

bull  例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード

bull  応用例ndash  四角形のサイズを変えますヒート マップでは四角形

のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます

ndash  四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります

3913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒11 Show Me gt ハイライト表

bull  ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます

bull  例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口

bull  応用例例ndash  ハイライト表を他の種類のチャートと組み合わせる たと

えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります

4013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 36: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒7 Show Me gt バブルチャート

bull  バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください

bull  様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す

bull  例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率

bull  応用例ndash  散布図のデータを強調する 各データ ポイントのサイズ

や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます

ndash  マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります

3613

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒8 Show Me gt ヒストグラムbull  ヒストグラムはグループ間でのデータの分散を表示

する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです

bull  データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます

bull  データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます

bull  例例ndash  データのグループ化をテストする データに合ったグ

ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます

ndash  フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります

3713

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒9 Show Me gt ブレットグラフbull  目標がある場合その目標までの進行行状況を追跡するにはブレッ

トグラフが適しています

bull  本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです

bull  ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します

bull  ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)

bull  例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)

bull  応用例例ndash  色を使用して達成のしきい値を示すプライマリメジャーの背景に赤

黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます

ndash  概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます

3813

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒10 Show Me gt ヒートマップ

bull  ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます

bull  例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード

bull  応用例ndash  四角形のサイズを変えますヒート マップでは四角形

のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます

ndash  四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります

3913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒11 Show Me gt ハイライト表

bull  ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます

bull  例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口

bull  応用例例ndash  ハイライト表を他の種類のチャートと組み合わせる たと

えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります

4013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 37: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒8 Show Me gt ヒストグラムbull  ヒストグラムはグループ間でのデータの分散を表示

する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです

bull  データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます

bull  データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます

bull  例例ndash  データのグループ化をテストする データに合ったグ

ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます

ndash  フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります

3713

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒9 Show Me gt ブレットグラフbull  目標がある場合その目標までの進行行状況を追跡するにはブレッ

トグラフが適しています

bull  本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです

bull  ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します

bull  ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)

bull  例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)

bull  応用例例ndash  色を使用して達成のしきい値を示すプライマリメジャーの背景に赤

黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます

ndash  概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます

3813

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒10 Show Me gt ヒートマップ

bull  ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます

bull  例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード

bull  応用例ndash  四角形のサイズを変えますヒート マップでは四角形

のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます

ndash  四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります

3913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒11 Show Me gt ハイライト表

bull  ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます

bull  例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口

bull  応用例例ndash  ハイライト表を他の種類のチャートと組み合わせる たと

えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります

4013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 38: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒9 Show Me gt ブレットグラフbull  目標がある場合その目標までの進行行状況を追跡するにはブレッ

トグラフが適しています

bull  本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです

bull  ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します

bull  ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)

bull  例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)

bull  応用例例ndash  色を使用して達成のしきい値を示すプライマリメジャーの背景に赤

黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます

ndash  概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます

3813

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒10 Show Me gt ヒートマップ

bull  ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます

bull  例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード

bull  応用例ndash  四角形のサイズを変えますヒート マップでは四角形

のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます

ndash  四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります

3913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒11 Show Me gt ハイライト表

bull  ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます

bull  例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口

bull  応用例例ndash  ハイライト表を他の種類のチャートと組み合わせる たと

えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります

4013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 39: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒10 Show Me gt ヒートマップ

bull  ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます

bull  例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード

bull  応用例ndash  四角形のサイズを変えますヒート マップでは四角形

のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます

ndash  四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります

3913

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒11 Show Me gt ハイライト表

bull  ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます

bull  例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口

bull  応用例例ndash  ハイライト表を他の種類のチャートと組み合わせる たと

えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります

4013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 40: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒11 Show Me gt ハイライト表

bull  ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます

bull  例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口

bull  応用例例ndash  ハイライト表を他の種類のチャートと組み合わせる たと

えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります

4013

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 41: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒12 Show Me gt ツリーマップbull  データを見見て全体と各要素との関係をひと目で知りたい場合は

ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します

bull  チャートの名前にもあるようにデータを木のように関連するものとみなします

bull  それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます

bull  四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます

bull  またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます

bull  例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較

bull  応用例ndash  カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて

いるか表示する

ndash  ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます

4113

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 42: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

3-‐‑‒13 Show Me gt 箱ひげ図

bull  箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します

bull  また髭はデータの最大および最小ポイントを示す際にも使用できます

bull  例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する

bull  応用例ndash  ボックス内のポイントを非表示にする これにより外れ

値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します

ndash  ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です

4213

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 43: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

4313

a  一般ユーザー向け画面

b  管理理者向け画面

c  データ更更新方法

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 44: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step1 Sign In

4413

bull  一般ユーザーの Tableau Server へのアクセス

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 45: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step2View

4513

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 46: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step3Workbook

4613

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 47: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

4 User Step4Contents

4713

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 48: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

4 Admin Server Status

4813

bull  管理理ユーザーはサーバーのステータスなどの情報を参照できます

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 49: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Pull)

4913

bull  Tableau Server 側からの抽出(Pull)ndash  指定したデータソース(Treasure Data Redshift RDShellip)

から定期的にデータを抽出します

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 50: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5013

bull  Tableau Desktop 側からのパブリッシュndash  Tableau Desktop よりワークシートをパブリッシュ

Create Publish

Tableau Desktop Tableau Server

PC Browser Android

iPad

Access amp Edit

Desktop

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 51: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

4 抽出とスケジュール(Push)

5113

bull  Treasure Service からのリザルト書き出しndash  Tableau Console よりジョブの結果を Tableau Server に

プッシュできます

Scheduled Query

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 52: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

5213

1  Treasure バッチクエリ times Tableau Server

2  Treasure アドホッククエリ times Tableau Desktop

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 53: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

5Treasure times Tableau

5313

(分析のPDCAに必要な2つの分析エンジンを両方とも提供)

Check(効果測定)

Plan(施策設計)

Do(施策実行行)

Act(原因探索索)

バッチ型分析

KPIダッシュボード

チューニング済Hadoop大量量データが得意

KPI

定義済指標の最新データ表示メンバー全員で共有

アドホック型分析

BIツール 統計ツール

Treasure Query Accelerator非常に高速

任意の軸でアドホックに分析原因の可視化

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 54: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

5バッチクエリ times Tableau Server

5413

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

c Direct TableauServer

全件データ

バッチ Result Push

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Tableau Server 上のソースデータを更更新

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 55: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

5アドホッククエリ times Tableau Desktop

5513

小さい CSVTSV

CRM

ERP

RDBMS

POS

センサー

WebログAppログ

スマフォAppログ

Treasure Agent

iOS Android SDK

TD Toolbelt

Web Browser

Streaming

Mobile

Legacy

Trial

データ収集 データ分析 データ保管

Direct BIツール等

Tableau

全件データ

データマート バッチ アドホック JDBCODBC

REST API

アドホック

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 56: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

アジェンダ

1  BI Data Visualization に関するトレンド

2  Tableau 製品群紹介

3  Tableau Desktop 紹介

4  Tableau Server 紹介

5  Tableau times Treasure Data

6  Tableau テクニック集

5613

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 57: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

6 Tableau テクニック集

1  質問に答えるグラフを描く2  経時的な傾向3  比較とランク付け4  相関性5  分布6  一部と全体の関係7  最重要データの強調8  読みやすいビューの作成9  ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限

5713

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 58: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒1 質問に答えるグラフを描く

5813

bull  例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします

bull  「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう

bull  このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります

bull  しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています

bull  このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します

bull  このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります

bull  emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull  emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません

bull  これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 59: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒2 経時的な傾向

5913

bull  データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう

bull  今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです

bull  また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます

bull  まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします

bull  このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります

bull  また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか

bull  答えは No です折れ線グラフにはその機能はありません bull  その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます

bull  これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています

bull  しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 60: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒3 比較とランク付け

6013

bull  データ分析の別の手法に比較とランク付けがありますbull  国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります

bull  多くの場合これで方向性や業績などがわかりますbull  棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 61: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒4 相関性

6113

bull  世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです

bull  喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか

bull  メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります

bull  ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します

bull  データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX

軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます

bull  図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです

bull  これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります

bull  ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね

bull  また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 62: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒5 分布

6213

bull  分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです

bull  たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです

bull  箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます

bull  この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです

bull  その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか

bull  分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します

bull  このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 63: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒6 一部と全体との関係

6313

bull  一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません

bull  1) 人の視覚系はパイの見見積もりに不不向きでありbull  2) すぐ隣隣りのパイ同士としか比較できないからですbull  たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか

bull  このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています

bull  こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 64: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒7 最重要データの強調

6413

bull  グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます

bull  メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です

bull  右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか

bull  このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう

bull  販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 65: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒8 読みやすいビューの作成

6513

bull  ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください

bull  このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています

bull  縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください

bull  ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます

bull  同じビューで方向を縦から横に変えた例例を以下に示します bull  このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 66: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒9 ビューの整理理

6613

bull  営業チームのメンバーを売上高とノルマで比較して評価するとします bull  とりあえず2 つのメジャーを横に並べてみますbull  その結果のグラフは右のとおりですbull  しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull  ノルマは達成しているようですがどれほどノルマを上回っているか正確

にはわかりませんbull  横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく

くなっているのですbull  では次のグラフはどうでしょうか売上高とノルマのデータを列列では

なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります

bull  このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります

bull  しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです

bull  このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります

bull  この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します

bull  営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 67: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒10 ビューへの過剰な負荷の回避

6713

bull  データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください

bull  インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです

bull  国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです

bull  次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 68: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

6-‐‑‒11 1つのビューで使用する色と形状の数を制限

6813

bull  色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります

bull  右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です

bull  さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています

bull  国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね

bull  1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります

2010 2011 2012 2013 2014

0

500

1000

1500

2000

Ord

er Q

uant

ity

Alge

Arg

Aus

Aus

Bra

Can

Chi

Egy

Eth

Fiji

Fra

Ger

Gre

Algeria

Argentina

Australia

Austria

Brazil

Canada

Chile

Egypt

Ethiopia

Fiji

France

Germany

Greece

Hong Kong

India

Iraq

Ireland

Israel

Italy

Japan

Kenya

Mexico

Peru

Turkey

2010 2011 2012 2013 2014

0K

1K

2KO

rder

Qua

ntity

HSDUWPHQWFurniture

Office Supplies

Technology

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913

Page 69: Tableauが魅せる Data Visualization の世界

Copyright copy2014 Treasure Data All Rights Reserved

Q and A

6913