Top Banner
広広広広広広広広広広広広広広広広広広広広広広広 広広広広広広広広広広広広広広 広広広広広広広広広広広広広広広広広広広広広広 広広広広 広広広広 広広広広広広広広 広広広広広広広広広広広広広広広 広広広広広広広広広広広広広広広広広広広広 広広広 / 広広 StarBED 広広広広広広
23

Advnet2011 ruo ando

Aug 21, 2015

Download

Engineering

Ruo Ando
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Advnet2011 ruo ando

広域アプリケーションレイヤネットワーク観測解析のための大規模クラスタの構築

~ クラウドの要素技術とテストベッドの特長の検討~

安藤類央 三輪信介情報通信研究機構

ネットワークセキュリティ研究所

情報通信研究機構ネットワークセキュリティ研究所 / 北陸 StarBED 技術センター

Page 2: Advnet2011 ruo ando

概要 

WEBやP2P上にSNSなどのアプリケーションが構築されるに伴い、広域で観測された大規模なデータを処理するケースが増加している。

これらのアプリケーションレイヤで構築されるネットワークを扱うため際に、大規模データと、加えて複雑な文字列解析を行う必要が生じている。

これらの新しいネットワーク観測・解析問題を解決するために、 JGN-X 上に多数のノードを仮想化し集約することで大規模なトラフィックデータを格納転送可能にし、 HDFS 上にスケール

アウト可能な解析系クラスタを starBED 上に構築し、頻度集計やノード規模測定などの解析を行う。

HDFS 上に Map Reduce を基本フレームワークとする分散 key value store 型のデータ処理機構を構築する場合、クラスタは同期やスケジューリングなどを行う name node と、並列分散処理を行う data node に分けられ、 Data node のスケールアウトは高い効果をもたらす。

また観測解析には巨大データの頻繁な移動が必要であり、広域高帯域な JGN-X が高い効果をもたらす。また、 StarBED では数十台~数百台規模のサーバの設定が可能であり、従来のクラスタ構築処理環境では不可能なデータ処理速度を達成することを検証する。

Page 3: Advnet2011 ruo ando

広域・高粒度化する L7/L8 ネットワーク

●Facebook

●Twitter

●bitTorrent, クライアント側(仮想ネットワーク ) Linux, BSD 配布に DHT を利用 全世界で(潜在)10000万台以上

●Skype の普及 2011年1月 IS03 「禁断のアプリ」 Skype のダウンロード率は 30 %

ネットゲーム関連での SKYPE の普及率が急増

●P2P communication between botNets

Recently, botNet such as conficker (3 million nodes over the world) applies public key and P2P communication

Page 4: Advnet2011 ruo ando

インターネットの社会的インパクトの増大情報漏洩の国際化など

●EU 忘れ去れる権利をユーザにクラウドコンピューティング、 P2P ネットワーク上で記録されたファイルは半永久的に消えない。情報漏洩や、不正ファイル(著作権侵害、ウィルス)が放流されると永遠に流通し続けるため、欧州委員会は、消す権利を保障する「忘れられる権利」のプライバシー規定案を公式説明。

●Limewireの裁判2010 年 5 月 11日、ニューヨーク州南部地区連邦地裁は、 LimeWire の親会社 Limewire Group とその設立者マーク・ゴートンが LimeWire によって著作権侵害およびその幇助、

さらに不正競争に関与したことを認める略式判決を下した。

●WIKILEAKSへの捜査要請 ロバート・ゲーツ国防長官 FBIに捜査協力を要請。

国防総省のモレル報道官は「ウィキリークスが法律に背いて情報を流出させるように個人に働きかけ、傲慢に機密情報を世界と共有することを遺憾に思う」とコメント。

●エジプトでのデモエジプト政府、エジプトで反政府デモを抑えるために実施されたインターネット利用制限(スパムメールまでも遮断された)Google のマーケティング マネージャーであり、当局に逮捕された後に抗議・

 運動の顔になった Wael Ghonim

Page 5: Advnet2011 ruo ando

クラウド環境上の security: "Data lives forever" problem

●Wiki Leaks

WikiLeaks is an international organization that publishes submissions of

otherwise unavailable documents from anonymous sources and leaks.

On July 25, 2010, WikiLeaks released to The Guardian, The New York

Times, and Der Spiegel over 92,000 documentsrelated to the war in

Afghanistan between 2004 and the end of 2009.

●“Right to forget and delete”   EU  クラウド上での忘れられる権利を立法化

European Commission sets out strategy to strengthen EU data protection

rules Nov 2010.

“Controlling your information, having access to your data, being able to

modify or delete it – these are essential rights that have to be guaranteed

in today's digital world. “

Page 6: Advnet2011 ruo ando

先行研究1 VANISH: self destructing dataファイル消去可能な P2P ネットワーク

Roxana Geambasu, Tadayoshi Kohno, Amit Levy, Henry M. Levy. Vanish: Increasing Data Privacy with Self-Destructing Data. In Proceedings of the USENIX Security Symposium, Montreal, Canada, August 2009.

Technology: Secret sharing protocol and DHT

In vanish system, shared file is disappeared from network in a fixed interval.

Bob sends {C,L} to Alice. VANISH is implemented for Vuse DHT.

RANDOM INDEXES (L)

Data, timeout

K1

K2

KN

C=Ek(data)

Data, timeout

RANDOM INDEXES (L)

data=Dk(C)

{C,L}

Page 7: Advnet2011 ruo ando

先行研究2 UNVANISH: reconstructing dataクローリング(広域観測)による消去無効化

Defeating Vanish with Low-Cost Sybil Attacks Against Large DHTsScott Wolchok, Owen S. Hofmann, Nadia Heninger, Edward W. Felten, J. Alex Halderman, Christopher J. Rossbach, Brent Waters, and Emmett Witchel, Network and IT Security Conference: NDSS 2010

UNVANISH mounts sybil nodes into DHT to replicate Ek hash to reconstruct data.

RANDOM INDEXES (L)

Data, timeout

K1

K2

KN

C=Ek(data)

Data, timeout

RANDOM INDEXES (L)

data=Dk(C)

{C,L}

UNVANISH

Page 8: Advnet2011 ruo ando

広域アプリケーションレイヤネットワーク観測解析

Page 9: Advnet2011 ruo ando

観測システムの構築と運用①解析・モニタの構築逆アセンブル/解析

②運用・仮想化技術の利用Xen, KVM(Linux), VMWare ESX の試用

③データ集計・可視化Hadoop, NOSQL(TokyoTyrant, MongoDB) の利用

④処理結果の出力Google Maps, Google App Engine等の利用

Page 10: Advnet2011 ruo ando

観測技術デバッガー、開発環境によるプロトコル解析

アプリケーションデバッガ、カーネルデバッガを用いて P2P アプリケーションの挙動を解析。修正 DLL (ライブラリ)を inject する。

Page 11: Advnet2011 ruo ando

観測システムの運用VMI による観測仮想マシンの集約

NICT独自の仮想マシン観測技術( Virtual Machine Introspection) により観測システム(クローラ)を集約し、観測データに応じたプロビジョニングを可能に。

複数 OS 、複数アプリケーションを仮想化し、観測データをホスト OS に集約、一元管理する。

Linux KVM ベースの仮想観測系

XEN ベースの仮想観測系

Page 12: Advnet2011 ruo ando

観測システムの運用

北陸リサーチセンターstarBED

NICT白山CoreLab

PlanetLab(全世界)

NICT けいはんな仮想インフラストラクチャ、グリッドの構築

NICT の観測網とテストベッド、クラスタを利用して観測網の広域化とデータ処理の高速化を目指したが。。

数十台~数百台のサーバによる大規模クラスタの構築

観測網の広域化

Page 13: Advnet2011 ruo ando

データ解析・可視化Hadoop / HIVE に大規模データ処理クラスタ

広域トラフィック観測データを KVS ( key value store) 用のファイルシステムに格納

HIVE による SQL ライクな検索インターフェイスの構築

機械学習アルゴリズム、LSH などによるデータの圧縮と格納

Page 14: Advnet2011 ruo ando

出力 :googleEarth による可視化

ネットワーク上のノード、ファイル分布状況を解析し、集約した情報を、色別して GoogleEarth 上に表示

これにより、スーパーノードや、地域別の流通の特徴などを可視化

KML 生成の parsing 、 XML 生成に時間がかかる。

東京都内にあるスーパーノードの表示例

Page 15: Advnet2011 ruo ando

観測システム 2007 - 2011

①解析・モニタの構築

2007 2008 2009

2010

2011

②運用・仮想化技術の利用

③データ集計・可視化

④処理結果の出力

Page 16: Advnet2011 ruo ando

観測システム 2007 – 2011観測ノード数

2007 2008 2009

2010

2011

2万から10万ノード

200万から300万ノード

1000万ノード

2011/03 – 2011/05

Page 17: Advnet2011 ruo ando

観測システム 2007 – 2011要素技術

2007 2008 2009

2010

2011

2万から10万ノード

200万から300万ノード

1000万ノード

2011/03 – 2011/05

Page 18: Advnet2011 ruo ando

観測システム 2007 – 2011観測ノード数

2007 2008 2009

2010

2011

2万から10万ノード

200万から300万ノード

1000万ノード

2011/03 – 2011/05

Page 19: Advnet2011 ruo ando

Event Handler / Shared Memory

Log File

Hypervisor / virtual machine monitor

Sequence / Strings

更なる処理能力の強化~観測サーバ24台説~

Map Map Map

Shuffle User Space

Injected LibDecoder

Kernel Space

Filter Driver

JGN-X 上での配置・スケールアウト

Application Layer Network

StarBED 上での配置・スケールアウト

User Space

Injected LibDecoder

Kernel Space

Filter Driver

User Space

Injected LibDecoder

Kernel Space

Filter Driver

Page 20: Advnet2011 ruo ando

要素技術と課題仮想化システム

• Xen と KVM はオープンソースの仮想化ソフトウェアであり、 KVM は Linux のドライバとして稼動する一方、 Xen はブートローダやスケジューラを持ったハイパーバイザーである。

GUI やデバイスドライバの違いはあるが、 libvirt などにより 両者の違いを吸収してに管理することが可能である。

一日数万セッションを仮想化された OS 上の MySQL で処理するとI/O のエラーがでる。

  オープンソースの仮想化ソフトウェアが観測量が増加すると性能がついていかなくなる

• VMWare ESX は商用のハイパーバイザーである。オー プンソースではないため観測粒度やライセンスの面で問題がある

が、管理インターフェースは Xen や KVM と比較して充実している。

  特に仮想マシンへのインジェクトが必要ない場合、   VMWare ESX が安定稼動、低コスト運用に向いてしている。

Page 21: Advnet2011 ruo ando

要素技術と課題:クラスタシステム

• Tokyo Tyrant24時間で1000万ノード規模の観測を行う場合、 MySQL な

どの RDB では性能が追いつかない。 NOSQL でないと観測スピードに対応できない。導入済み。

• Mongo DB

アメーバピグで使われている。MapReduce 、 Sharding が使える。

ドキュメント指向:非標準 P2P プロトコルアプリケーションは亜種

が多い。スキーマレスで JSON を使って格納できる。

Page 22: Advnet2011 ruo ando

要素技術と課題クラスタシステム

• Hadoop & MapReduce

現在、 wordcount 、 ranking で利用中。

テストベッド上で利用する場合、Hadoop 用の kickStart, PXEブートの仕組み

を利用する必要がある。(可能なら今年度中に)

Page 23: Advnet2011 ruo ando

まとめと今後の課題 現在、クラウドコンピューティング、モバイル端末、高速ネットワークの普及により、ア

プリケーションレイヤでのネットワーク観測データが爆発的に増加している。

これらのアプリケーションレイヤで構築されるネットワークを扱うため際に、大規模データと、加えて複雑な文字列解析を行う必要が生じている。

これらの新しいネットワーク観測・解析問題を解決するために、 JGN-X 上に多数のノードを仮想化し集約することで大規模なトラフィックデータを格納転送可能にし、HDFS 上にスケールアウト可能な解析系クラスタを starBED 上に構築し、頻度集計やノード規模測定などの解析を行うための検討を行った。

Amazon EC は運用面でこのタイプの研究では柔軟性を欠き、また大規模データの移動や処理にはコストが高いことを示した。

現在、データ処理系に対して、2009年度後半から、観測系が極度に発達しており、これに対応するためのスケールアウトや sharding が可能な大規模クラスタシステムの構築が急務である。