Top Banner
データをわかりやすく可視化する「データビジュアライゼーション」勉強会 2014/06/27 (金) 19:00 - 21:30 https://www.facebook.com/events/645728912170926/ 矢崎 裕一 実際に形にするために 考え方のポイントとリソース紹介
53

6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

Dec 13, 2014

Download

Data & Analytics

【6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料】
https://www.facebook.com/events/645728912170926/

オープンデータやビックデータなどの言葉を最近目に、耳にする機会が増えました。

LOCAL GOOD YOKOHAMAでは「データを公開する・つかう・つくる」など私たちの身の回りにあふれてきた、そしてこれからもっと近くにやってくるだろう「データ」と、組織や個人としてどのように付き合っていくか考えていきたいとおもいます。

今回は、LOCAL GOOD YOKOHAMAのサイト内「データを見る」でコンテンツのひとつともなっている『データをわかりやすく可視化するデータビジュアライゼーション』に関する勉強会を開催します。
この勉強会を経て、7月20日の「データビジュアライズソン」を開催します。

どれだけ詳細で有用なデータでも、わかりやすい見せ方ができないと人には伝わりません。ゲスト2名をお招きし、そもそも「データビジュアライズの意味とは」から「データをどのように選定するか」「どのようにテーマをもたせるのか」、そして「実際にどのようにつくるか」までデータビジュアライズについて、みんなで理解を深め、勉強する機会としたいと思います。


また、イベント最後には7月以降に統計情報・GIS情報のオープン化を実施する横浜市から、どのような基盤になるのかなど、情報が提供されます。

日時:6月27日(金) 19:00~21:30
会場:さくらWORKS<関内>
対象:データビジュアライズに興味があり実際につくりたいひと、データビジュアライズをつかって表現したいデータをもつひと
参加費:3000円(学生1000円)

タイムテーブル(予定)
19:00-19:10 会の趣旨説明、お二人の紹介

19:10-20:40
第1部 データビジュアライズとは 小林巌生さん
ーオープンデータとデータビジュアライズの関係
ーデータビジュアライズのもつ効果について

20:45-21:15 
第2部 実際に形にするために〜考え方のポイントとリソース紹介 矢崎裕一さん
ーデータをどのように選定するか
ーどのようにテーマをもたせるのか
ー実際にどのようにつくるか
考え方のポイントとリソースを紹介していただきます。

21:15-21:30  質疑応答、閉会

主催:LOCAL GOOD YOKOHAMA(NPO法人 横浜コミュニティデザイン・ラボ)
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

データをわかりやすく可視化する「データビジュアライゼーション」勉強会

2014/06/27 (金) 19:00 - 21:30https://www.facebook.com/events/645728912170926/

矢崎 裕一

実際に形にするために 考え方のポイントとリソース紹介

Page 2: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料
Page 3: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料
Page 4: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料
Page 5: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料
Page 6: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

インフォメーション・グラフィックと データ・ビジュアライゼーション

Page 7: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料
Page 8: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

http://elections.nytimes.com/2012/results/president

Page 9: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

• 人が手作業かグラフィックアプリケーションで描いている。

• 手元にあるデータの特性を作者が理解し、その特徴を最大化するために表現が選ばれる。

• そのため、別のデータを使用して再作成するのが容易ではない。

• 表示についてのルールとその例外ルールについて、作者以外の外部から、すべてを推測することが難しい。

• 参照したデータとの関連性の証明が難しい。

• インタラクションがないものが多い。

インフォメーション・グラフィック

http://visualizing.jp/infograph_vs_dataviz/

Page 10: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

データ・ビジュアライゼーション

• あるデータセットが、予め用意されたアルゴリズムを用いて、コンピュータによって描画されること。

• その描画によってデータセットを眺めているだけではわからない傾向や特徴が明らかになっていること。

• アルゴリズムはコーディングによって定義され、チャートやグラフとして発達してきた表示形式を用い、形式知化/可視化されていること。

• ソート、フィルター、トグルなどのインタラクションが可能で、その場でその結果がすぐ得られること。

• 利用しているデータセットが可視化されていること。

http://visualizing.jp/infograph_vs_dataviz/

Page 11: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

データのビジュアライズ

Page 12: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

step1.データを情報に変換する 人間の認知能力に合わせて抽象化して、理解できるものにする

• データセットそのものから特徴や性質を掴むことが困難

• 特徴を理解できる • 他のデータセットと組み合わせられる

Page 13: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

なるほど!

step2.「なるほど!」と思って共感する 単なる理解から共感へ結びつける

• 自分ごとと関連づけて、共感できる

Page 14: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

ワークフロー

Page 15: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

「ビジュアライジング・データ」 によるワークフロー

• 手軽で強力なプログラミング環境「Processing」を用いた情報視覚化技術についての解説書。

• 地図情報・階層ファイルシステム・リスト・グラフ構造・時系列データなど、さまざまなデータの収集・解析手法から対話的な視覚化手法・プログラミングテクニックまでを豊富な実例を用いて詳しく解説している。(出版元サイトより)

http://www.oreilly.co.jp/books/9784873113784/

Page 16: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

「Data Journalism Handbook」 によるワークフロー

• ロンドンで開かれた MozFest 2011での48時間ワークショップの集大成

• BBC、シカゴトリビューン、ガーディアン、フィナンシャルタイムズ、ニューヨークタイムズ、ワシントンポスト、テキサストリビューンなどが参加。

• データ・ジャーナリズムの知識共有や実例集。

http://datajournalismhandbook.org/

Page 17: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

データ→情報→インサイト

データを見つけ、 下ごしらえする

データを情報(ここではチャートを指す)に変換し、分析/検証する

情報からインサイトを見つける

なるほど!

Page 18: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

データをどのように選定するか

Page 19: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

• 1stパーティをまずはあたる • メタデータ(誰がどのように集めたデータなのか)が重要

• 専門家に聞くのはとても有益な手段

データをどのように選定するのか

Page 20: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

• 各国のデータカタログサイト • 国際機関(国連、世銀)のデータサイト • Wikipedia • SNS • 各種ウェブサイト • 専門家に聞く • 書籍 etc…

データはどこにある?

Page 21: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

「データは街に溢れている」http://portal.nifty.com/2007/08/01/a/

Page 22: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

自分のアクティビティ・データ

Quantified Self

Moves app アクティビティ・データ・サービスにおける

Twitterのようなサービス

Page 23: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

データを下ごしらえする

Google Refine

Page 24: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

OpenRefine

•コラムごとのデータ形式の変換

•データ形式が間違っているものを検出(数値のコラムに文字列があるなど)

•データの重複を探し出す

•表記揺れの解消

•エラー値の検出と処理

•空白の検出と処理

http://openrefine.org/

Page 25: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

データを情報に変換し、分析/検証する

RAW / Tableau / ManyEyes / MatLab

データセットとビジュアル表現を選択するだけの比較的お手軽なもの

R / Pythonデータ分析

Page 26: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

http://raw.densitydesign.org/http://raw.visualizing.jp/#/

Raw

- ブラウザ上で動く - データセットとビジュアル表現を選ぶだけ - 結果の出力フォーマットも多様

Page 27: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

http://www.tableausoftware.com/products/desktop

TableauDesktop edition。Mac版も先日リリース。

- 単体アプリ - データセットとビジュアル表現を選ぶだけ - 約10万円

Page 28: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

http://www-958.ibm.com/software/analytics/labs/manyeyes/#create

ManyEyes

- ブラウザ上で動く(Java) - データセットとビジュアル表現を選ぶだけ

Page 29: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

http://www.mathworks.co.jp/products/statistics/

MatLabMatLab+Statistics Toolbox

Page 30: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

R

- オープンソース - 統計解析のためのプログラミング言語

http://www.r-project.org/

Page 31: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

Python

-「データ分析」と「最終プロダクト」を一つの言語で。 - Python as Glue 2.0

http://pydata.org/ https://www.packtpub.com/python-data-visualization-cookbook/book

http://www.oreilly.co.jp/books/9784873116556/

NumPy + pandas

Page 32: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

情報からインサイトを見つける

Page 33: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

探索型 物語型

データの探索をユーザーが出来るようにする。 作り手としてのインサイトは押し付けない。

作り手としてのインサイトを最大限に 伝える方法を考える。

誰がインサイトを見つけるのか

ユーザーに委ねる 作り手が仕上げる

Page 34: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

実例紹介

Page 35: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

インサイトを自分ごとに

Page 36: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

http://www.extremepresentation.com/design/charts/

自分ごとに巻き込むためのForm/UI

別な切り口

位置情報(地図)

Form/UI

Page 37: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

ビジュアライズツール

Page 38: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

http://www.extremepresentation.com/design/charts/

「示したいこと」と「チャート」の対応表

Page 39: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

1つのデータセットを 複数の切り口でビジュアライズする

別な切り口

位置情報(地図)

あるデータセット

Page 40: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

地図系ツールの紹介

• D3.js • Leaflet.js

Page 41: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

D3.js

Page 42: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

Show Reel

Page 43: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

D3.jsの主な特徴や機能

選択、アニメーション、タイマー、補間、配列操作、ランダム、外部リソースの読み込み、テキスト/CSV整形、カラーユーティリティ、スケール、タイマー、レイアウト(Layout)、地理(Geography)、地図投影法(Map Projection)、幾何(Geometry)

• 統計学上必要な計算を賄ってくれる • 地図投影法が多数用意されている • 細かいスタイリングがすべて指定できる • ウェブ標準に則っている

Page 44: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

unemployment rates from 2008 by Mike Bostock

http://bl.ocks.org/mbostock/4060606

Chropleth Maps 地形の色で値を表現する

Page 45: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

http://leafletjs.com/

Leaflet.jsの主な特徴や機能

• タイル型地図 • 表示する地図を選べる • 動作が軽量/軽快 • D3と連携可能

Page 46: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

http://leaflet-extras.github.io/leaflet-providers/preview/

Page 47: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

醒めた目でもう一度みてみると…

ドーナツチャート割合を示す角度がすっぽり 表示から抜けている

http://www.telerik.com/help/windows-8-html/chart-donut-series.html

パイチャート項目が多すぎて 比較が困難

http://eagereyes.org/techniques/pie-charts

GoogleMaps項目が多すぎて よくわからない

http://mrare.ca/blog/visualizing-our-calgary-transit-iphone-app-next-stops-usage

Page 48: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

データビジュアライズで 大事なこと

Page 49: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

ヴィジュアライズ=ものの見方

Page 50: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

ギリシャ…熊 日本…柄杓中国…雲の上に座っている王朝

北斗七星

Page 51: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

客観的 vs 主観的

• データヴィジュアライゼーションは可視化されたデータに基づくものなのだが、それでも主観的な考えは入ってくる。

• 主観的な考えを完璧に排除することは難しいが、多面的な視座を提供すること、元データをユーザー自身も検証できるようにすることで、解釈する余地や幅を持たせてあげることが肝要。

Page 52: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料

杉浦康平 - 時間軸変形地図

多視点なものの見方を提供する視点のある場所によって、見える景色が変わる

Page 53: 6月27日 データをわかりやすく可視化する「データビジュアライゼーション」勉強会 矢崎裕一さんプレゼン資料