JNNS-DEX-SMI- 玉川　公開講座「交換モンテカルロ法とその応用」

JNNS-DEX-SMI-玉川　公開講座

「交換モンテカルロ法とその応用」

東京工業大学大学院　総合理工学研究科知能システム科学専攻　博士課程 2年永田賢二

交換モンテカルロ法とは？

•マルコフ連鎖モンテカルロ法（MCMC法）のひとつ•乱数を用いて、確率分布を再現するための一群の手法

•正規分布など、性質のわかっている分布だけでなく、離散・連続を問わず、　様々な分布に適用できる。汎用性が高い。

•交換モンテカルロ法は、従来のMCMC法の改良アルゴリズム [Hukushima,96]

＜MCMC法の主な目的＞

)(wp確率分布

•サンプリング •期待値計算

dwwpwgwgm

tt )()()(

MCMC法の応用例

＜ベイズ統計＞

データ　　が与えられたもとでのパラメータ　　の条件付き確率（事後分布）

wpwXpXwp

)()|()|( dwwpwXpZ )()|(

)|( wxp )(wp：確率モデル：パラメータの事前分布

＜統計物理＞ギブス分布・カノニカル分布における期待値計算

))(exp()(

dwwEZ ))(exp()(

)(wE ：エネルギー関数：温度の逆数（逆温度）

Outline

マルコフ連鎖モンテカルロ法メトロポリス法マルコフ連鎖の原理

交換モンテカルロ法遅い緩和の問題交換モンテカルロ法の原理

交換モンテカルロ法の設計に関する理論温度パラメータの設定平均交換率の理論解析

Outline

マルコフ連鎖モンテカルロ法

d次元空間上の点　　が従う確率分布　　　　が与えられているとする。

また、点　　の各成分は連続値をとるものとする。

　　　１．確率分布　　　　に従う点をサンプリング

　　　２．　の関数　　　　の確率分布　　　　についての期待値の計算　　　　

w )(wp

w )(wp)(wg

)()2()1()( ,, mt wwww

mdwwpwgwg

1)( )(

1)()()](E[

１．　　の初期値　　　　を設定する。２．　現在の点　　　から、以下の式で候補　　を生成する。３．　密度の比較により、次の点　　　　を決める。

メトロポリス法

（例）以下の確率分布　　　　に従うサンプル生成

w )0(w

)(tw w

)(tww : 平均 0の一様乱数、正規乱数など

)1( tw

)( )0(wp

)()( )( wpwp t ww t )1(

)(wp )( )1(wp

)()( )( wpwp t 確率　　で確率　　　　で

ww t )1(

)()1( tt ww )(

メトロポリス法

（例）以下の確率分布　　　　に従うサンプル生成

)0(w w

ww t )1(

)()1( tt ww )(

３．　密度の比較により、次の点　　　　を決める。)1( tw

メトロポリス法のアルゴリズム

１．　　の初期値　　　を適当に設定する。

２．現在の点　　　から、以下の式で候補　　　を生成する。

３．密度の比較により、次の状態　　　　を決める。

４．ステップ２に戻り、繰り返す。

w )0(w

)1( tw

: 平均 0の一様乱数、正規乱数など

)()( )( wpwp t ww t )1(

ww t )1(

)()1( tt ww )(

＜確率分布　　　　に従うサンプリング・アルゴリズム＞)(wp

ステップサイズ

ステップサイズ：候補を選ぶ際の範囲の大きさ

（例）以下の２次元の確率分布からのサンプリング

・大きすぎると、ほとんどの候補が採択されなくなる。・小さすぎると、一回の更新が少ないため、遠くに行きにくい。・大きすぎると・・・・小さすぎると・・・

ステップサイズ

(例 )右の目標分布から 1000個のサンプルを生成

ステップサイズ： 0.05 ステップサイズ： 0.5 ステップサイズ :5

・実際には、採択される割合が 40%～ 60%程度になるように設定

・要素ごとに更新するのも一つの手。

:２次元の一様分布からランダムに選ぶ。

「メトロポリス法」のまとめ

確率的に「候補」を選んで、それを採用するかどうかを、確率的に決定する。

目標分布の情報は、密度の比のみしか用いないため、密度さえ計算できれば、どんな分布にも適用できる。規格化されていなくても大丈夫。

ステップサイズの設定は、アルゴリズムの効率アップのために、重要。大きすぎず、小さすぎず。要素ごとの更新を考えてもいいかも。

Outline

マルコフ連鎖

マルコフ連鎖：直前の点　　　　のみに依存して、次の点　　　を決定する。)1( tw )(tw

)1()()1( ttt www

)( ww ・遷移確率　　　　　　　　：点　　から点　　に移る確率w w

（メトロポリス法の場合）

:[-D,D]の範囲の一様分布からランダムに選ぶ。

)(wpCase1:

Case2:

Case3:

0)( ww

マルコフ連鎖の原理

１．詳細つりあい条件 )()()()( wwwpwwwp

＜遷移確率　　　　　　　　が満たすべき条件＞)( ww

確率分布　　　　に従う点がたくさんある状況を考える。)(wp

)(wp)(wp

それぞれの点を更新

（左辺）：　　から　　　に移る個数w w

（右辺）：　　から　　　に移る個数ww

任意の２つの位置での「流入」と「流出」がつりあっている。

「確率分布　　　　を不変にする」)(wp

マルコフ連鎖の原理＜遷移確率　　　　　　　　が満たすべき条件＞)( ww

２．エルゴード性任意の 2つの点　　と　　の間の遷移確率がゼロでないか、有限個のゼロでない遷移確率の積で表すことができる。

・何回かの更新で、どこへでも到達することが可能である。

・どんな初期値から始めても唯一の分布に収束する。

メトロポリス法における詳細つりあい条件

)()( wpwp ２．　　　　　　　　　　　の場合

)()()()( wwwpwwwp

（先のメトロポリス法の場合）

:[-D,D]の範囲の一様乱数

Dww １．　　　　　　　　　の場合

0)()( wwww

MCMC法のアルゴリズム

遷移確率の満たすべき条件は緩くて、一意に決定できない。詳細つりあい条件エルゴード性

MCMC法のアルゴリズムは、たくさん存在する。（例）

メトロポリス法メトロポリス・ヘイスティングス法ギブスサンプラー、熱浴法独立サンプラーハミルトニアン・モンテカルロ法

「マルコフ連鎖の原理」のまとめマルコフ連鎖

直前の状態にのみ依存して、次の状態が決まる系列遷移確率で特徴づけられる。

マルコフ連鎖の基本原理詳細つりあい条件

任意の２つの位置での「流入」と「流出」がつりあっている。エルゴード性

有限回のステップで、任意の２点間を行き来できる。

条件は緩く、いろいろなアルゴリズムが存在する。

Outline

遅い緩和の問題

メトロポリス法の基本は、「少し変えて、選ぶかどうかを確率的に決める。」

（例１）密度の高い領域が、いくつもあり、互いに離れている場合（多峰性のある確率分布）

・ある領域から、他の領域に到達するには、密度の低い領域を通る必要がある。

　　　　⇒サンプリング効率の悪化

ある確率分布に対しては、ものすごく効率が悪くなってしまう。

遅い緩和の問題

（例１）基底状態が一点ではなく、次元を持った集合になっている。（ベイズ学習でみられる問題）

))(exp()(

基底状態：エネルギー関数　　　　　を最小にする点　　のこと)(wE w

＜一点の例＞＜集合の例＞

拡張アンサンブル法

確率分布によっては、遷移確率が著しく小さくなる。

サンプリング精度が悪くなり、期待値の評価に影響を与えてしまう。

＜実質的なエルゴード性の破れ・遅い緩和の問題＞

＜拡張アンサンブル法＞　上記の問題を解決する一群の手法

確率分布を拡張したり、混合したものを考える。　　・マルチカノニカル法

　　・シミュレーテッド・テンパリング法

　　・交換モンテカルロ法　 [Hukushima-Nemoto,96]

交換モンテカルロ法のアイデア（温度の導入）

・確率分布　　　　に対して、

＜高温状態＞＜低温状態＞

・エネルギーの低い点は探せない・大域的に行き渡れる

・常にエネルギーの低い点にいる・局所領域に留まりやすい

サンプリング中に温度を上げ下げする。

＜問題＞　　・温度を上げ下げする過程で、詳細つりあい条件を破ることになるので、　　　目標分布からのサンプリングの保証がなくなる！

)(wp )()( wpwp

ギブス分布の場合： ))(exp()( wEwp

交換モンテカルロ法 [Hukushima,96]

目標分布： )(exp1

)( wEZ

拡張された確率分布　　　　　 }{wp

lll wE

)(exp)(

},,{}{ 1 Lwww

　　１．（通常の更新）それぞれの確率分布について、状態の更新

　　２．隣り合った分布間で、状態の交換を行う。

llll wwww ,, 11

＜アルゴリズム＞

（　　 : 逆温度）

交換モンテカルロ法の詳細つりあい条件

＜詳細つりあい条件＞

},,,{},,,{},,,{

llllll

wwwwwwp

))()()((exp

},{},{

<Case1> :小

<Case2> :大

<Case3>

交換の採択確率

1.メトロポリス型

122. 熱浴型

),1min(1 ru

))()()((exp)()(

)()(11

llllllll

llll wEwEwpwp

交換前交換後

必ず交換する。(1)

交換前交換後

確率　　で交換する。(2)

（交換前）（交換後）

１．（通常の更新）　　メトロポリス法により、状態の更新

２．（状態の交換）　　隣り合った分布間で、状態の交換

＜交換の採択確率＞

llll wwww ,, 11

))()()((exp

),1min(

llll wEwEr

交換モンテカルロ法のイメージ

< 交換モンテカルロ法>

)( 11 wp

)( 22 wp

)( 33 wp

)( 44 wp

< メトロポリス法>

交換モンテカルロ法の挙動（イメージ）

＜前に出した例では・・・＞

高温低温

・低温での点が、高温に移ることで、大域的なサンプリングが可能に。

・詳細つりあいを満たしているので、サンプリングの保証つき。

交換モンテカルロ法の実験結果の例

メトロポリス法交換モンテカルロ法

右の確率分布から 10000個のサンプルを生成

ベイズ学習での交換モンテカルロ法

＜混合正規分布モデルにおけるベイズ学習＞

推定

<学習データ >　　 1000個の 3次元データを生成

<正規分布の数 >　　　　　データ生成 : 4個　　学習モデル : 　 10個　　

汎化誤差：真の構造と予測結果の相違

アルゴリズム汎化誤差

Gibbs 　 sampler

交換法

理論値 (上限 )

003249.0011188.0

002989.0009809.0

010500.0

その他の応用例

ポリマーの構造推定

タンパク質の立体構造推定

スピングラス・シミュレーション

組み合わせ最適化問題

(1999). Sandelin, E. ck,aIrb A. 110hys.J. Chem. P

(2001). Okamoto, Y. Sugita, Y. Mitsutake, A. 60Biopolymer

(1996). Nemoto, K. Hukushima, K. 65oc. Jpn.J. Phys. S

(1998). wski, WieczerkoC. Pinn, K. 9 Cd. Phys.Int. J. Mo(2002). Hukushima, K. 147. Comm.Comp. Phys

「交換モンテカルロ法」のまとめ

遅い緩和の問題密度の高い領域が複数存在し、互いに離れている場合エネルギーの基底状態が、次元をもった集合になっている場合

交換モンテカルロ法の原理温度パラメータを導入することで、大域的なサンプリングが可能に

同時分布の詳細つりあい条件を考える

Outline

交換法が有効に働くには・・・

＜交換が、ある程度の確率で行われている。＞

交換が行われないと、通常のメトロポリス法を行っているのと同じ。

))()()((exp 11 llll wEwEr ＜　　　　のヒストグラム＞

高温

低温

温度パラメータの値によって交換の頻度が決まる。

＜温度パラメータの設定＞　　・各　　の間隔は？　　・温度パラメータの総数は？

温度パラメータ設定の際の基準例

＜平均交換率＞　

　　各温度間で、交換が行われた頻度

・もし、各温度で定常分布に収束していると、平均交換率は、２つの温度パラメータによって定まる関数。

))()()((exp 11 llll wEwEr

平均交換率の理論解析

)()(ˆexp)(

)(ˆ wE

：　ある点　　において、最小値　　　　　をもつ関数

：　任意の確率分布

0w )(ˆ0wE

＜低温同士での平均交換率＞　　　　がある程度大きい状況

平均交換率の理論解析

typebathheatfor12 r

typeMetropolisfor),1min(1 ru

))(ˆ)(ˆ)((exp 2112 wEwEr

21221111 )()(: typeMetropolis dwdwwpwpuJ

21221122 )()(:bath typeheat dwdwwpwpuJ

＜交換に関する採択確率＞

＜平均交換率＞

　　　平均交換率　　は、　　　　　　　　において以下の式に収束する。1J 21,＜定理１＞ [Nagata, 2008]

メトロポリス型における平均交換率

熱浴型における平均交換率

　　　平均交換率　　は、　　　　　　　　において以下の式に収束する。2J 21,

11210 0 1221 1expexp

1tanh,

sssasssadsdsaB

＜定理２＞ [Nagata, 2008]

平均交換率の挙動

221: typeMetropolis

1:bath typeheat

0.5 0.21

平均交換率は、　　　　　　　　　　　と　　　の関数 112 /

平均交換率

平均交換率と温度パラメータ

平均交換率は、　　　　　　　　　　　の関数 112 /

1各温度で　　　　　　　　が一定ならば、平均交換率は同じ値になる。

1 4 52 3

11 1 l

l このとき、温度パラメータの値は、

指数的に区切れば、平均交換率が一定の値になる。

　　ってなに？

).(loglog

)()(ˆexplog)(log)(

dwwwEZF

「自由エネルギー」・「周辺対数尤度」・「確率的複雑さ」

w・任意の　　において　　　　のヘッセ行列が正定値

wE )(ˆ2

ヘッセ行列：

＜正則なケース＞

・　　の値は、主に　　　　の性質によって定まる。 )(ˆ wE

)(ˆ wE

　　ってなに？

・ヘッセ行列が縮退する　　が存在する場合

＜特異なケース＞

右の例では、

・特異なケースでの　　の解析法　　　　の極を調べる。)(z

dwwwEzz

)()(ˆ)( zRe

代数幾何学の手法である特異点解消を行えば求められる。

ベイズ学習での　　の性質

様々な学習モデルにおいて、　　の値を求める研究がなされている。

)|(||)( nn XxpxqKLXG ：真の構造と予測分布のカルバック距離

　　予測の精度を示す尺度の一つ

nXGnG n

漸近形：

＜汎化誤差 [Watanabe, 2001]＞

＜厳密解＞・ニューラルネットワーク　　　　　　　・縮小ランク回帰モデル・隠れマルコフモデル　　　　　　　　・混合二項分布モデル

＜上限値＞・一般混合分布モデル　　　　　　　　・ベイジアンネットワーク・確率文脈自由文法

平均交換率の理論値の検証

＜縮小ランク回帰モデル（線形ニューラルネットワーク）のベイズ学習＞

)1(x )2(x )(Mx

)1(y )2(y )( Ny

パラメータ

パラメータの次元：

}{},{ ,, jhhi baw

HNMd )(

12,20 HNM学習モデルが　　　　　　　　　　　　　　　　　のとき（真の構造は　　　　　　　）40 H

)noise(ABxy

温度パラメータ設定に関する研究平均交換率を均等にするよう設定

関数　　　　などの挙動をもとにした繰り返しアルゴリズム　　

最適な平均交換率の値 20%～ 25%くらいが最適らしい。　　

温度の端から端まで動くための時間の最小化　

(1999). Okamoto, Y. Sugita, Y. 314. Lett.,Chem. Phys(2002). Kofke, A. D. 117hys.,J. Chem. P

(2002). Garcia, E. A. u,Sanbonmats Y. K. 46Proteins,(2004). al,et Schug A. 57Proteins,

(2005). al,et Rathore N. 122Phys., Chem. J.(2005). . Kofke, A. D. Kone, A. 122Phys., Chem. J

(2006). . al,et Katzgraber G. H. Mech., Stat.J

全体のまとめ

JNNS-DEX-SMI- 玉川　公開講座「交換モンテカルロ法とその応用」

Documents

Инструкция DEX DKS-30, DEX DKS-30

s Dex 16051108180

d20 Modern Character Sheet 2 - err.no · PDF filecharacter.....

Fujitsu Eternus DEX

dEX Logger Software

Dex y rolo

マルコフ連鎖モンテカルロ法によるソフトウ...

사용설명서 DEX-P1 CD체인저콘트롤/ DSP / CD...

MASCC/ESMO 止吐指南(2013) · PDF file5ht3 dex apr 5ht3.....

Dex - Plush

IN DEX. []

Method DEX: A Qualitative, Hierarchical, Rule-Based...

Dex sienna

PERTAMINA Pertamina Dex Pertamina Dex (diesel environment...

HI-DEX Product Set · HDXZCT2 HI-DEX Cable Tray...

非線形状態空間モデル及びモンテカルロ・フ...

JNNS-DEX-SMI- 玉川 公開講座 「交換モンテカルロ法とその応用」

JNNS-DEX-SMI- 玉川　公開講座「交換モンテカルロ法とその応用」