Top Banner
HADOOPの標準GUI HUE最新情報 Tatsuo Kawasaki [email protected] Hadoop User Conference 2014, Jul 8, 2014
43

Hadoopの標準GUI HUEの最新情報

Dec 22, 2014

Download

Technology

Cloudera Japan

Hadoop User Conference 2014のHueのセッション資料です
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Hadoopの標準GUI HUEの最新情報

HADOOPの標準GUI HUEの 最新情報

Tatsuo Kawasaki [email protected] Hadoop User Conference 2014, Jul 8, 2014

Page 2: Hadoopの標準GUI HUEの最新情報

HUE以前 基本的な操作はコマンドラインから エンジニア、パワーユーザー以外には敷居が高い

Page 3: Hadoopの標準GUI HUEの最新情報

HUE以後

Hadoop用のGUI ブラウザから操作 ・Windowsでも ・Macでも ・Linuxでも その気になれば、タブレットやスマホでも!

Page 4: Hadoopの標準GUI HUEの最新情報

HUEの目標 APACHE HADOOPで データを分析するための ウェブインタフェース

シンプル&統合 無料&オープンソース ̶> ビッグデータを多くの人に

Page 5: Hadoopの標準GUI HUEの最新情報

おおまかな概要

Hadoop Web Server あなた、同僚、 IE9を使っている友人でさえも ;)

Page 6: Hadoopの標準GUI HUEの最新情報

オープンソース

~3350 のコミット 38 人のコントリビュータ 698 のスター 245 のフォーク github.com/cloudera/hue

Page 7: Hadoopの標準GUI HUEの最新情報

開発コアチーム

Join  us  at  team.gethue.com  

Romain  Rigaux   Enrico  Ber5  Chang   Abraham  Elmahrek  Amstel  

Page 8: Hadoopの標準GUI HUEの最新情報

トーク ミートアップとイベント:    NYC,  Paris,  LA,  Tokyo,  SF,  Stockholm,  Vienna,  San  Jose,  Singapore,  Budapest…  近日予定:  London,  West  coast  

AROUNDTHE WORLD

避暑 Nov  13  Koh  Chang,  Thailand  May  14  Curaçao,  Netherlands  An5lles  Nov  14  Goa,  India  

Page 9: Hadoopの標準GUI HUEの最新情報

トレンド: 成長

gethue.com  

Page 10: Hadoopの標準GUI HUEの最新情報

HISTORY HUE 1

ブラウザ内でデスクトップのような機能を実現していたが、かなり遅く、メモリリークもあり、IEには適していなかった。 しかし、その当時 (2009-2010)は明らかに先進的だった。

Page 11: Hadoopの標準GUI HUEの最新情報

HISTORY HUE 2

いたるところがTwitterのブートストラップによる最初のフラット構造な実装 HUE 2.5

自動補完とドラッグ&ドロップのような新しい良い機能を追加し、ユーザーエクスペリエンスを改善した新しいアプリ

Page 12: Hadoopの標準GUI HUEの最新情報

HISTORY HUE 3 ALPHA

提案されたデザイン。 うまくいかなかった

Page 13: Hadoopの標準GUI HUEの最新情報

HISTORY HUE 3.5 新しいUI、いくつかの新しいアプリ、これまでで最もユーザーフレンドリーな機能  

Page 14: Hadoopの標準GUI HUEの最新情報

HISTORY HUE 3.6+

そして今… データを検索、探索するための全く新しい方法

Page 15: Hadoopの標準GUI HUEの最新情報

どちらのバージョンを使うべきか?

その後の2500以上のコミット、新しいUI、インタラクティブな検索、SQL、ダッシュボード…

1~2年古いバージョンで、Hive0.12以前に依存している場合にのみ使用する

HUE 2.X HUE 3.X

Page 16: Hadoopの標準GUI HUEの最新情報

どのディストリビューションを使うべきか?

先進的なプレビュー版 最も安定し、コンポーネント間での確認もなされている

非常に新しい GITHUB CDH / CM TARBALL

ハッカー 先進的なユーザー 一般ユーザー

Page 17: Hadoopの標準GUI HUEの最新情報

どこにHUEを配置するべきか? 1台のマシン

Page 18: Hadoopの標準GUI HUEの最新情報

どこにHUEを配置するべきか? クラスタの外

Page 19: Hadoopの標準GUI HUEの最新情報

どこにHUEを配置するべきか? クラスタの内側

Page 20: Hadoopの標準GUI HUEの最新情報

Python 2.4 2.6 パッケージを使用する場合。ソースからビルドする場合はその他の packagesが必要

SERVER CLIENT ウェブブラウザ IE 9+, FF 10+, Chrome, Safari

必要なものは?

Hi  there,  I’m  “just”  a  web  server.  

Page 21: Hadoopの標準GUI HUEの最新情報

HUEのサービスは?

ページ、および静的コンテンツも提供するプロセス

1 SERVER 1 DB クッキー、保存したクエリ、ワークフロー用

Hi  there,  I’m  “just”  a  web  server.  

Page 22: Hadoopの標準GUI HUEの最新情報

HUEの設定方法 HUE.INI

core-site.xmlに似ているが、.INI形式の構文 場所?

/etc/hue/conf/hue.ini または $HUE_HOME/desktop/conf/pseudo-distributed.ini

[desktop] [[database]] # Database engine is typically one of: # postgresql_psycopg2, mysql, or sqlite3 engine=sqlite3 ## host= ## port= ## user= ## password= name=desktop/desktop.db

Page 23: Hadoopの標準GUI HUEの最新情報

認証

データベース (SQLite, MySQL, …)にLogin/Passwordを管理

SIMPLE ENTERPRISE LDAP (最も使用されている), OAuth, OpenID, SAML

Page 24: Hadoopの標準GUI HUEの最新情報

DBバックエンド

Page 25: Hadoopの標準GUI HUEの最新情報

LDAPバックエンド

Integrate  your  employees:  LDAP  How  to  guide  

Page 26: Hadoopの標準GUI HUEの最新情報

ユーザー

ユーザーまたはユーザーのグループに、権限を付与、破棄できる

管理者 ユーザー 標準ユーザー + 権限

Page 27: Hadoopの標準GUI HUEの最新情報

グループのリストと権限 権限ができること: - アプリ(例: Hiveエディタ)へのアクセスを許可

- アプリからデータを修正 (例: HiveテーブルのDROPや、HBaseブラウザでセルを編集)

設定 ‒ アプリケーションと権限

A  list  of  permissions  

Page 28: Hadoopの標準GUI HUEの最新情報

実行中の権限 「test」ユーザーは「hive」権限のみを持つ「hiveonly」グループに属している

設定 ‒ アプリケーションと権限

Page 29: Hadoopの標準GUI HUEの最新情報

どのようにHUEはHADOOPとやり取りするのか

YARN

JobTracker

Oozie

Hue Plugins

LDAP SAML

Pig

HDFS HiveServer2

Hive Metastore

Cloudera Impala

Solr

HBase

Sqoop2

Zookeeper

Page 30: Hadoopの標準GUI HUEの最新情報

RPC CALL 全てのHADOOPコンポーネントに HDFSの例

WebHDFS REST

DN

DN

DN

DN

NN

h\p://localhost:50070/webhdfs/v1/<PATH>?op=LISTSTATUS  

Page 31: Hadoopの標準GUI HUEの最新情報

HOW hue.iniにHadoop APIの全てのホストとポートをリスト HBaseとHiveの例

Full  list  

[hbase] # Comma-separated list of HBase Thrift servers for # clusters in the format of '(name|host:port)'. hbase_clusters=(Cluster|localhost:9090) [beeswax] hive_server_host=host-abc hive_server_port=10000

RPC CALL 全てのHADOOPコンポーネントに

Page 32: Hadoopの標準GUI HUEの最新情報

HTTPS SSL DB SSL WITH HIVESERVER2

さらに多く … AUDITING

セキュリティ

KERBEROS

Page 33: Hadoopの標準GUI HUEの最新情報

2つのHueインスタンス HA proxy Multi DB パフォーマンス: ウェブサイトのようにほとんどがRPCコール

高可用性 HOW

Page 34: Hadoopの標準GUI HUEの最新情報

Impala, Hiveの統合, Spark (Shark も) 対話的なSQLエディタ MapReduce、メタストア、HDFSを統合

SQL WHAT

Page 35: Hadoopの標準GUI HUEの最新情報

Solr&Cloudを統合 カスタムできる対話的なダッシュボード ドラッグ&ドロップウィジェット (チャート、タイムライン…)

SEARCH(検索) WHAT

Page 36: Hadoopの標準GUI HUEの最新情報

シンプルなカスタムクエリ言語 HBaseフィルタ言語をサポート 選択、コピー&ペースト 自動補完のヘルプメニュー

HBASEブラウザ WHAT

Page 37: Hadoopの標準GUI HUEの最新情報

DEMO TIME

Page 38: Hadoopの標準GUI HUEの最新情報

まとめ

HueでプロキシーユーザーとしてHadoop Service APIを有効化

各サービスAPIを示すようにhue.iniを設定

@gethue や hue-user

マシンにHueを インストール

LDAPバックエンドを使用

インストール 設定 有効化

ヘルプ LDAP

Page 39: Hadoopの標準GUI HUEの最新情報

次の6ヶ月のロードマップ Sentry Search, Spark, SQL 多くのダッシュボード!Oozie v2 内部コンポーネントの統合 (HBase <-> Search, インデックス作成ウィザード、ドキュメントの権限), Hadoop Web apps SDK あなたのアイデアは?

WHAT

Page 40: Hadoopの標準GUI HUEの最新情報

…GIVE CLOUDERA MANAGER A TRY!

vimeo.com/91805055  

設定が難しい…

Page 41: Hadoopの標準GUI HUEの最新情報

何か間違っている?

learn.gethue.com  

Page 42: Hadoopの標準GUI HUEの最新情報

インストールせずに試してみる

demo.gethue.com  

Page 43: Hadoopの標準GUI HUEの最新情報

TWITTER

@gethue  

USER GROUP hue-­‐user@  

WEBSITE

h\p://gethue.com  LEARN

h\p://learn.gethue.com  

THANK YOU!

翻訳版ブログ公開中  h\p://gethue.com/blog/?lang=ja