エージェントベースシミュレーションの 廃棄物処理システムへの適用 Agent-based Simulation of Waste Disposal System 北海道大学 工学部 情報工学科 複雑系工学講座 調和系工学研究室 吉本 拓矢
エージェントベースシミュレーションの
廃棄物処理システムへの適用 Agent-based Simulation of Waste Disposal System
北海道大学 工学部 情報工学科
複雑系工学講座 調和系工学研究室
吉本 拓矢
背景 「持続可能な発展(Sustainable Development)※」の実現に向け
「廃棄物の処理システム」は重要なトピック
• 廃棄物処理システム
– 処理者の行動や環境・経済活動への影響を含めた廃棄物の処理系
かつての主目的
•公衆衛生の向上
•廃棄物の体積縮小
現在の要求
•環境負荷の減少
•資源消費の減少
考慮すべき特徴
• 処理をしてすぐには影響が出ない(時間遅れ)
– 温室効果ガスなどの発生・対策
• 処理の影響が非線形に現れる
– 二酸化炭素を10倍排出した時に,影響が10倍であるとは限らない
廃棄物処理システムの要素や特徴が,
系全体の振舞いに対してどのように影響しているか明らかではない
目的
廃棄物処理システムについて,
– 処理者の行動
– 時間遅れで影響が現れる
– 非線形な影響
といった要素・特徴と全体の振舞いとの関係に
焦点を当て,モデル化・分析を行う
具体的には,上記の要素・特徴を踏まえた問題を提案し,
モデル化・分析を行う
廃棄物処理システムについての問題モデル
戦略
• 浄化排水
• 非浄化排水
社会的ジレンマを含んだモデルである“The Lake※”を基とした
N個の工場と1つの湖からなる問題モデル
排水場所OP(t)
取水場所UP(t)
潜在的な汚染LP(t)
(実際はN個)
※[L.S.Shapley et al. 1969]
取水
(浄化して利用
→コスト発生)
コスト有り・汚染無し
コスト無し・汚染有り
汚水発生 流れ込み
拡散
一定確率で影響
自然浄化
影響の大きさは
LP(t)に比例
蓄積
LP(t)が上昇すると浄化力低下
LP(t)による影響は
すぐにはUP(t)に現れない
工場が知覚できるのはUP(t)のみ
ABSの適用と検討事項
環境への影響などはトップダウン的なアプローチで 表現した方が効果的
⇒システムダイナミックス(SD)を併せて用いる
時間遅れ・非線形な事象を全て エージェントの行動ルールの記述から ボトムアップ的に構築するのは難しい
行動主体を含んだ問題のモデル化を行うために
エージェントベースシミュレーション(ABS)
によるアプローチを考える
SDとABSの結合に関する関連研究
–エージェントの意思決定のプロセスをSDによってモデル化[Schieritz et al. 2003]
–Consumerの意思決定プロセスを心理学に基づいてモデル化し,
その振る舞いを考察する際に環境としてSDを導入[Jager 2001]
システムダイナミックス(SD)とは
• システムの要素は
– 蓄積(ストック)
– 蓄積の変化量(フロー)
– 外部からの影響・補助変数・定数 (コンバータ)
• システム内の要素間の相互作用(フィードバック)を定義 (定義には数式を用いる(固定的))
コンバータ1=
(コンバータ2-ストック)/コンバータ2
システムが持つ要素や各要素間の構造の記述から
全体の振舞いを明らかにするモデル化・シミュレーション手法
フィードバックの定義例
⇒対象が広範囲に渡る非線形なシステムを考えるのに有効
問題のモデル化
• 工場(エージェント)
• 湖(環境:SDによりモデル化)
利得 汚水放出
浄化排水 α- B - UP(t-1) 0
非浄化排水 α - UP(t-1) 10
α:操業利得(=200)
B:排水時浄化コスト(=100)
• OP(t) = OP(t-1) + (工場からの汚水の和) – (拡散量)
• LP(t) = LP(t-1) + (拡散量) – (自然浄化)
• UP(t) = OP(t-1) 95%
OP(t-1) + 0.6*LP(t-1) 5%
(拡散量) = max[OP(t-1), 5.0]
(自然浄化) = max[LP(t-1), 3.5] LP(t-1) ≦100
1.75 LP(t-1) > 100
排水場所OP(t)
取水場所UP(t)
潜在的汚染LP(t) 流れ込み
拡散
影響(5%)
自然浄化
t:ステップ数
(取水・排水で1ステップ)
シミュレーションによるモデル分析
• 実験の目的
– 提案したモデルにおいて,
実際にシミュレーションを行うことで,
• エージェントの戦略に対する利得・環境の変化
• 複数のエージェントが自己の利得を追求して戦略を決定した場合,どのような振舞いをするか
について考察する
0 0
3500
10000
3500 0
0
-100000
250000
実験1 • 目的と設定
– 浄化排水を行う割合(浄化割合)による影響について考察
– 工場数・・・1つ
– 戦略選択規則・・・ランダム(浄化割合が100%,90%,60%,50%の4種)
•ある期間の利得は高いが,次第に利得が低下する戦略選択規則が存在
•適度な非浄化排水により,浄化割合100%より高い利得の戦略選択規則が存在
100% 90%
60%
60%
50%
50% 潜在的な汚染L
P
100% 90%
利得和
ステップ数 ステップ数
50%,60%では
次第に利得が減少
0 0
2000
2500
0
0 2000
300000
実験2 • 目的と設定
– 同じ浄化割合での戦略選択規則の違いによる影響を考察
– 工場数・・・1つ
– 戦略選択規則1・・・GAにより2000ステップでの利得を最大化 (自身の過去5ステップの履歴から,次の戦略を一意に決定)
– 戦略選択規則2・・・ランダム(浄化割合65.15%)
ステップ数
利得和
ステップ数
戦略選択規則1
戦略選択規則2 戦略選択規則2
浄化割合が同じでも戦略選択規則の違いによって
利得に差が出る場合がある
戦略選択規則1
潜在的な汚染L
P
浄化割合は戦略選択規則1
と同じ
950 1000
400000
-1000000
実験3 • 目的と設定
– 複数の工場が自己の利得を追求した行動を取った場合,全体として
どのような振舞いになるか考察
– 工場数・・・3つ
– 戦略選択規則・・・GAを用いて共進化
(1世代(2000ステップ)で得た各々の利得が評価値)
戦略選択規則は収束しない
世代数
利得和
・・・
・・・
・・・
利得 利得 利得
戦略選択規則
利得
利得 利得 利得
利得
利得を適応度として交叉
まとめ • 実験の結果から,
– 処理者の行動
– 時間遅れで影響が現れる
– 非線形な影響
という要素・特徴に着目してシステム全体の振舞いを考察すると
–ある期間の利得は高いが,次第に利得が低下する戦略が存在
→近視眼的な利得追求戦略と,
持続可能な発展を目指す利得追求戦略が異なる場合が存在しうる
–自然浄化力を適度に利用することで,高い利得を得られる
–同じ浄化割合でも,戦略の違いにより利得に差が出る
–複数のエージェントが自己の利得を追求すると,戦略は収束しない
という特徴が得られた