DEIM Forum 2015 E2-4 ヒートマップによる高次元可視化のためのクラスタリング手法の比較 熊谷 沙津希 † 伊藤 貴之 † 本橋 洋介 ‡ †お茶の水女子大学 理学部 情報科学科 〒112-0012 東京文京区大塚 2-1-1 ‡日本電気株式会社情報・ナレッジ研究所 〒211-8666 神奈川県川崎市中原区下沼部 1753 E-mail: †{satsuki, itot}@itolab.is.ocha.ac.jp, ‡[email protected]あらまし 本報告では,高次元データの観察のためにヒートマップを適用した可視化手法を紹介するとともに,ヒ ートマップの視認性を向上するために実装した2種類のクラスタリング手法を比較する.本手法では高次元データを 構成する次元間の距離を相関係数にもとづいて定義し,その定義によって算出される距離行列を用いて次元群をク ラスタリングする.現時点の我々の実装ではクラスタリング手法に階層型クラスタリングと非階層型クラスタリン グ(k-medoids法)を採用している.本報告では, 2種類のクラスタリング結果がもたらす可視化結果を比較し,それぞ れの手法の特徴と操作性について議論する.さらに,被験者実験による主観比較評価を実施した結果から,両者の 利点や課題を議論する. キーワード ヒートマップ,可視化,クラスタリング Comparison of clustering method for high-dimensional visualization by heat map Satsuki KUMATANI † Takayuki ITOH † and Yosuke HASHIMOTO ‡ †Department of Information Sciences, Faculty of Science, Ochanomizu University 2-1-1 Otsuka, Bunkyo-ku, Tokyo, 112-0012 Japan ‡Knowledge Discovery Research Laboratorys, NEC Corporation 1753, Shimonumabe, Nakahara-ku, Kawasaki, Kanagawa 211-8666, Japan E-mail: †{satsuki, itot}@itolab.is.ocha.ac.jp, ‡[email protected]Abstract This paper introduces about analyzing of high-dimensional data by heatmap, and comparison of the two clustering methods from the visualization results. Now, this paper adapts the heatmap as a visualization technique, and analyzes the correlation between dimensions as the analysis of high-dimensional data. Next, this paper classifies the dimensions each other, and makes a trend analysis between clustered variables. In addition, this paper compares hierarchical and non-hierarchical clustering method by using two heatmaps that display those clustering results. and characteristics of each approach. We do users questionnaire, compare the two clustering methods by heat map, and discuss about the advantage and disadvantage of those clustering methods. Keyword Heatmap,Visualization,Clustering 1. 概要 我々の日常生活や日常業務には非常に多種の高次 元データが存在し,その観察には可視化が有用である. 高次元データのための可視化手法は従来から多く発表 されているが,我々はその中でもヒートマップを用い た可視化に注目している.ヒートマップは値の大きさ を色で表現する手法である.ヒートマップを用いた可 視化には,数値の大小や範囲に画面領域が左右されな い,数値を表現する点や線が画面上で絡み合わずに可 視化できるので視認性が低下しにくい,などの利点が ある. 高次元データの分析過程における重要な点に次元 間の相関がある.高次元データの可視化においても, 相関にもとづいて次元群にクラスタリングを適用し, クラスタを単位とした視覚表現を適用することで,相 関のある次元どうしの類似性や差異に注目することが 容易になる. 本報告では 2 種類のクラスタリング手法を高次元デ
6
Embed
ヒートマップによる高次元可視化のためのクラスタリング手 …DEIM Forum 2015 E2-4 ヒートマップによる高次元可視化のためのクラスタリング手法の比較
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Abstract This paper introduces about analyzing of high-dimensional data by heatmap, and comparison of the two clustering methods from the visualization results. Now, this paper adapts the heatmap as a visualization technique, and analyzes the correlation between dimensions as the analysis of high-dimensional data. Next, this paper classifies the dimensions each other, and makes a trend analysis between clustered variables. In addition, this paper compares hierarchical and non-hierarchical clustering method by using two heatmaps that display those clustering results. and characteristics of each approach. We do users questionnaire, compare the two clustering methods by heat map, and discuss about the advantage and disadvantage of those clustering methods.
参 考 文 献 [1] D. J. Lehmann, G. Albuquerque, M. Eisenmann, M.
Magnor, H. Theisel, Selectiong Coherent and Relevant Plots in Large Scatterplot Matrices, Computer Graphics Forum, 31(6, 1895-1908, 2012.
[2] Y. Zheng, H. Suematsu, T. Itoh, R. Fujimaki, S. Morinaga, Y. Kawahara, Scatterplot layout for high-dimensional data visualization, Journal of Visualization, 10.1007/s12650-014-0230-5, 2014.
[3] S. Yagi, Y. Uchida, T. Itoh, A Polyline-Based Visualization Technique for Tagged Time-Varying Data, 16th International Conference on Information Visualisation (IV2012), pp. 106-111, 2012.
[4] A. Hayashi, T. Itoh, S. Nakamura, A Visual Analytics Tool for System Logs Adopting Variable
Recommendation and Feature-Based Filtering, 17th International Conference on Information Visualisation (IV2013), pp. 1-10, 2013.
[5] H. Suematsu, S. Yagi, T. Itoh, Y. Motohashi, K. Aoki, S. Morinaga, A Heatmap-Based Time-Varying Multi-Variate Data Visualization Unifying Numeric and Categorical Variables, 18th International Conference on Information Visualisation (IV2014), pp. 84-87, 2014.