Top Banner
わんくま同盟 東京勉強会 #46 複雑ネットワークとP2Pネットワーク コンプレクッスネットワークテクノロ ジー @kimtea 荒浪一城
24

複雑ネットワークとP2Pネットワーク

Jul 05, 2015

Download

Technology

Kazuki Aranami

複雑ネットワークとP2Pネットワークの作りかけの資料です。
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: 複雑ネットワークとP2Pネットワーク

わんくま同盟 東京勉強会 #46

複雑ネットワークとP2Pネットワーク

コンプレクッスネットワークテクノロジー

@kimtea

荒浪一城

Page 2: 複雑ネットワークとP2Pネットワーク

わんくま同盟 東京勉強会 #46

自己紹介

• コンプレクッスネットワークテクノロジー

– 個人事業主として、2010年10月に開業しました

– そういえば、はじめてホームページを持ったのは15年前の1995年10月です

• 荒浪一城

– 1983年11月24日生まれ、静岡県島田市出身

– 地元の高校を卒業後、2002年に専修大学ネッ

トワーク情報学部に入学、丸山先生の開設した稚内北星学園大学東京サテライト校(秋葉原ダイビル)の魅力に引かれて編入学し、卒業

Page 3: 複雑ネットワークとP2Pネットワーク

わんくま同盟 東京勉強会 #46

複雑ネットワークとは

• 複雑ネットワーク(complex networks)とは、ニューラルネットワーク、タンパク質の化学反応、伝染病の伝播、食物連鎖などの生態系、友人関係、マーケティング、インターネットなど数学・生物学・経済学・情報学など様々な学問をひとつの基盤としている。あらゆる相互作用(interaction)が影響する複雑系のひとつである。

Page 4: 複雑ネットワークとP2Pネットワーク

わんくま同盟 東京勉強会 #46

伝染病における実例

• 14世紀のヨーロッパで大流行した黒死病(ペスト)は有名であり、伝染病の伝播モデルには「SIRモデル」がある

• 2002年、中国南部の広東省で発生したSARSは、香港まで広がりを見せると、世界中に広まった。既存のモデルでは説明できない

• 2009年、メキシコ東部のベラクルス州で新型インフルエンザが発生し、WHO(世界保健機関)がパンデミックを宣言

Page 5: 複雑ネットワークとP2Pネットワーク

わんくま同盟 東京勉強会 #46

複雑ネットワークの数学的解法

• 偏微分方程式

– 空間構造を考慮した微分方程式

– 伝染病における黒死病は解析できるが、SARS

のような事例になると「平均場近似」と呼ばれる手法を用いる必要が生じる

• グラフ理論

– 空間構造を特に考慮せずに、平面のみで考える

– 現実世界のグラフの場合、従来のグラフ理論では扱えないことも多いが、現実世界をシミュレーションするなど、応用することが可能である

Page 6: 複雑ネットワークとP2Pネットワーク

わんくま同盟 東京勉強会 #46

グラフと次数

• グラフGは、頂点の集合V={v1,v2,…,vn}と枝(紐帯または弦)の集合E={e1,e2,…,em}からなる

• 頂点viの次数kiとは、頂点viから出ている枝の本数である。図1において次数kiは、それぞれk1=2、k2=2、k3=3、k4=3である

V1

V4

V3

V2

図1

Page 7: 複雑ネットワークとP2Pネットワーク

わんくま同盟 東京勉強会 #46

グラフにおける次数の計算

• 一本の枝の両端には、必ず1つずつ頂点がつながっている。この性質を利用すると、一本の枝があれば、次数の総和は2だけ上がる

• よって、グラフGの枝の総本数を|E|とすると

• が、どのグラフに対しても成り立つ

Ekn

i

i 21

Page 8: 複雑ネットワークとP2Pネットワーク

わんくま同盟 東京勉強会 #46

次数の確率密度

• また、次数が以下のような、確率密度に従って分布している場合を考える

• 確率密度の定義より

• が成立している。つまり、全体のn個の頂点のうち、平均 個が次数kを持つことになる

.),...2(),1(),0()( pppkp

0

1)(,1)(0k

kpkp

)( kpn

Page 9: 複雑ネットワークとP2Pネットワーク

わんくま同盟 東京勉強会 #46

図1における次数の確率密度

• 図1の例では、

) (k, p(k) ) p() , p( ) p() p( 402

132010

V1

V4

V3

V2

図1

.),...2(),1(),0()( pppkp

0

1)(,1)(0k

kpkp

Page 10: 複雑ネットワークとP2Pネットワーク

わんくま同盟 東京勉強会 #46

スケールフリー(ベキ則の次数分布)

• ベキ則の次数分布は、

• 複雑ネットワークの世界では、ベキ則のことを「スケールフリー」とも呼ぶ

• 一般に次数{p(k)}の形について、図2

(A)のようにある平均値の近くに偏って分布していると思われるが、ベキ則の次数{p(k)}は図2(B)のように分布している

rkkp )(

Page 11: 複雑ネットワークとP2Pネットワーク

わんくま同盟 東京勉強会 #46

頂点の次数分布{p(k)}

• 現実のデータからも、次数 {p(k)}は図2

(A)の分布ではなく、図2(B)の分布により近い

Page 12: 複雑ネットワークとP2Pネットワーク

わんくま同盟 東京勉強会 #46

ベキ指数

• ベキ則の次数分布は、

• また、rは「ベキ指数」と呼ばれ、実際のデータから得られたベキ指数を、表1に示す

ネットワーク ベキ指数W W W(ワールド・ワイド・ウェブ) 1.9 - 2.7

インターネット 2.1 - 2.5映画俳優の共演ネットワーク 2.3 - 3.1性的関係のネットワーク 3.2 - 3.4

タンパク質の反応ネットワーク 2.4 - 2.5

rkkp )(

Page 13: 複雑ネットワークとP2Pネットワーク

わんくま同盟 東京勉強会 #46

平均頂点間距離

• 2頂点viとvjの「距離」とは、viからvjに到達するまでに、通過しなければならない枝の最小の本数のことである

• 例えば、図1のグラフではv1とv2間の距離だけは2で、残りの頂点対の距離は1である。頂点がn個あるとき、頂点2つの対の選び方はn(n-1)/2通りある

• 平均頂点間距離Lは、2点間距離のn(n-1)/2

ペア全体にわたる平均である

Page 14: 複雑ネットワークとP2Pネットワーク

わんくま同盟 東京勉強会 #46

6次の隔たり

• 平均頂点間距離Lは、図1ではn = 4、n(n-

1)/2 = 6であり

• となる。

• 実際のネットワークでは、頂点nが大きくなっても、平均頂点間距離Lはあまり大きくならない。n=1000でL=3、n=10000でL=4、n=100000としてもL=5である。これが億単位でもL=6であり、所謂「6次の隔たり」と呼ばれるものである

6

7

6

12

6

51L

Page 15: 複雑ネットワークとP2Pネットワーク

わんくま同盟 東京勉強会 #46

クラスター係数

Page 16: 複雑ネットワークとP2Pネットワーク

わんくま同盟 東京勉強会 #46

ランダムグラフ

• 1959年、エルデシュとレニィーは「On

random graphs」によって、初めて体系的にランダムグラフを導入した。

• エルデシュは、その生涯に約1500もの論文を記したことでも有名であるが、同時に多くの研究者とつながりがあった。

Page 17: 複雑ネットワークとP2Pネットワーク

わんくま同盟 東京勉強会 #46

ハブ

• 彼自身を複雑ネットワークの対象とすると、研究者ひとりひとりを頂点、一緒に論文を書いたという関係を枝と置き換えると、彼は非常に多くの研究者とつながっている「ハブ」であることがわかる。彼との共著であれば、距離が1となるが研究者の数はより膨大になる。

Page 18: 複雑ネットワークとP2Pネットワーク

わんくま同盟 東京勉強会 #46

エルデシュ数

• しかし、ここで興味深いことは、ほとんどの研究者は彼からの距離(最短の枝の本数)が5または6であったことである。これを「エルデシュ数」と呼び、六次の隔たりとも一致する。

Page 19: 複雑ネットワークとP2Pネットワーク

わんくま同盟 東京勉強会 #46

スモールワールド・ネットワーク(WSモデル)

• 1998年、ダンカン・ワッツとスティーヴン・ストロガッツが、米国の科学雑誌ネイチャーに「Collective dynamics of 'small-

world' networks」を発表し、「スモールワールドモデル」(ワッツ=ストロガッツモデル、WSモデル)を提唱した。

Page 20: 複雑ネットワークとP2Pネットワーク

わんくま同盟 東京勉強会 #46

弱い紐帯

• WSモデルに対しては、ショートカットが適用できる。これは、1973年にマーク・グラノヴェッターが提案した「The

strength of weak ties」における「弱い紐帯」にも関連する。P2Pネットワーク理論における、Consistent Hashingに酷似する。紐帯(ちゅうたい)とは、グラフの枝のこと。

Page 21: 複雑ネットワークとP2Pネットワーク

わんくま同盟 東京勉強会 #46

• 弱い紐帯とは、購買の意思決定など実際の行動に移すような価値ある情報の伝達や伝搬においては、家族・友人・同僚などの日頃の結びつきの強い、クラスター性の高いネットワーク(強い紐帯)よりも、実際には知人の知り合い程度のような比較的クラスター性の弱いネットワーク(弱い紐帯)からの情報の方がが、未知の情報が多く、それらの情報源を人はより信頼し、満足度の高く、意思決定の際に重要視する理論のこと

Page 22: 複雑ネットワークとP2Pネットワーク

わんくま同盟 東京勉強会 #46

クリーク

• グラフ理論におけるクリークは、ネットワークの中で、特に密に結びついた部分を形づくる、内輪づきあいやクラスター性の高い部分と直感的に対応する。社会学的な意味でのクリークは、内集団に相当し、複雑ネットワーク理論の言葉を用いれば、クラスター性が高い部分ということになる

Page 23: 複雑ネットワークとP2Pネットワーク

わんくま同盟 東京勉強会 #46

「バラバシ=アルバートモデル」(BAモデル)

• WSモデルは、次数分布の冪則を導き出すことができなかった。しかし1999年、アルバート=ラズロ・バラバシとレカ・アルバートは、サイエンスに「Emergence of

scaling in random networks」を発表し、スケールフリー性を持つ、グラフである「バラバシ=アルバートモデル」(BAモデル)を提唱した。

Page 24: 複雑ネットワークとP2Pネットワーク

わんくま同盟 東京勉強会 #46

BAモデルの重要な要素

• BAモデルの重要な要素は、2つある。

– 一つ目は、インターネットのネットワークのように、ネットワーク自体が「成長」していくことである。これは、これまでの頂点の総数が固定されていたグラフとは異なる

– 二つ目は、「優先的選択」である。これは、接続する相手先が既にたくさんの枝を持つ次数の高い頂点を優先的に選択し、次数の高い頂点を作りやすいようにした点である。つまりは、パレートの法則(80対20)に基づく「ハブ」の形成である