Top Banner
. . 離散数学 第 14 系統樹復元の離散数学 岡本 吉央 [email protected] 電気通信大学 2013 7 30 最終更新:2013 7 29 17:54 岡本 吉央 (電通大) 離散数学 (14) 2013 7 30 1 / 44
76

離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

Aug 31, 2020

Download

Documents

dariahiddleston
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

.

......

離散数学 第 14回系統樹復元の離散数学

岡本 吉央[email protected]

電気通信大学

2013年 7月 30日

最終更新:2013年 7月 29日 17:54

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 1 / 44

Page 2: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

生物の進化と系統樹

目次

..1 生物の進化と系統樹

..2 形質に基づく系統樹復元

..3 Binary Directed Perfect Phylogeny問題

..4 不完全 Binary Directed Perfect Phylogeny問題

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 2 / 44

Page 3: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

生物の進化と系統樹

生物の多様性

http://en.wikipedia.org/wiki/File:Fungi of Saskatchewan.JPG

http://mappery.com/Singapore-Zoo-Map-2

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 3 / 44

Page 4: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

生物の進化と系統樹

形態と形質

http://tolweb.org/treehouses/?treehouse id=2482

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 4 / 44

Page 5: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

生物の進化と系統樹

遺伝子型と表現型

http://www.biotechlearn.org.nz/focus stories/evolved enzymes/images/fly genotype and phenotype

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 5 / 44

Page 6: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

生物の進化と系統樹

系統樹

http://evolution.berkeley.edu/evolibrary/news/061001 trapjaw

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 6 / 44

Page 7: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

生物の進化と系統樹

系統樹:ダーウィンの著書から

C. Darwin (1859) On the Origin of Species by Means of Natural Selection

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 7 / 44

Page 8: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

生物の進化と系統樹

系統樹:他分野での利用法

『カンタベリー物語』(Geoffrey Chaucer,14世紀) の写本の系統樹

http://www.canterburytalesproject.org/pubs/desc2.html

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 8 / 44

Page 9: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

形質に基づく系統樹復元

目次

..1 生物の進化と系統樹

..2 形質に基づく系統樹復元

..3 Binary Directed Perfect Phylogeny問題

..4 不完全 Binary Directed Perfect Phylogeny問題

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 9 / 44

Page 10: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

形質に基づく系統樹復元

系統樹復元のお話

系統樹を復元するために使う手法の分類

1 距離に基づく手法 distance-based approach

2 形質に基づく手法 character-based approach

C. Darwin (1859) On the Origin of Species by Means of Natural Selection

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 10 / 44

Page 11: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

形質に基づく系統樹復元

形質に基づく手法 (1):種形質行列

http://phylodiversity.net/bb09/images/9/9a/Kristinachar.png

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 11 / 44

Page 12: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

形質に基づく系統樹復元

形質に基づく手法 (2):復元された系統樹

http://phylodiversity.net/bb09/images/f/f5/KristinaPhylo.PNG

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 12 / 44

Page 13: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

形質に基づく系統樹復元

Perfect phylogeny問題

▶ 入力:種形質行列M▶ 出力:二分木で次を満たすもの

▶ 各葉が 1つの種でラベル付けされている▶ 各種はラベルとして一度だけ出現する▶ 各形質に対して,同じ状態の種が誘導する最小の部分木が互いに素

# toes Webbed feet

Ostrich 2 NEmu 3 NPelican 4 YDuck 4 YOwl 4 N

↑ ↑

Pelican(4, Y)

Owl(4, N) Emu

(3, N)

Ostrich(2, N)

Duck(4, Y)

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 13 / 44

Page 14: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

形質に基づく系統樹復元

Perfect phylogeny問題

▶ 入力:種形質行列M▶ 出力:二分木で次を満たすもの

▶ 各葉が 1つの種でラベル付けされている▶ 各種はラベルとして一度だけ出現する▶ 各形質に対して,同じ状態の種が誘導する最小の部分木が互いに素

# toes Webbed feet

Ostrich 2 NEmu 3 NPelican 4 YDuck 4 YOwl 4 N

↑ ↑

Pelican(4, Y)

Owl(4, N) Emu

(3, N)

Ostrich(2, N)

Duck(4, Y)

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 13 / 44

Page 15: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

形質に基づく系統樹復元

Perfect phylogeny問題

▶ 入力:種形質行列M▶ 出力:二分木で次を満たすもの

▶ 各葉が 1つの種でラベル付けされている▶ 各種はラベルとして一度だけ出現する▶ 各形質に対して,同じ状態の種が誘導する最小の部分木が互いに素

# toes Webbed feet

Ostrich 2 NEmu 3 NPelican 4 YDuck 4 YOwl 4 N

↑ ↑

Pelican(4, Y)

Owl(4, N) Emu

(3, N)

Ostrich(2, N)

Duck(4, Y)

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 13 / 44

Page 16: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

形質に基づく系統樹復元

問題のバリエーション

.入力に対する仮定:形質は「二値」か「多値」か?..

......

▶ 二値:形質が 0と 1の値をとる (ように符号化される)

▶ 多値:形質のとりうる値に制限なし

.出力に対する仮定:系統樹は「根付き」か「根無し」か?..

......

▶ 根付き:時間経過を考慮する▶ 根無し:時間経過を考慮しない

⇝ Binary Directed Perfect Phylogeny問題

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 14 / 44

Page 17: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

形質に基づく系統樹復元

Binary Directed Perfect Phylogeny問題

s:種,c:形質

c1 c2 c3 c4 c5 c6 c7 c8s1 0 0 1 1 1 0 1 0s2 0 1 1 1 0 0 0 0s3 1 0 0 0 0 1 0 1s4 0 0 1 1 0 0 1 0s5 1 0 0 0 0 0 0 0

s1 s4

s2 s3s5

c2c7

c5

c6, c8

c1c3, c4

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 15 / 44

Page 18: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

形質に基づく系統樹復元

Binary Directed Perfect Phylogeny問題

s:種,c:形質

c1 c2 c3 c4 c5 c6 c7 c8s1 0 0 1 1 1 0 1 0s2 0 1 1 1 0 0 0 0s3 1 0 0 0 0 1 0 1s4 0 0 1 1 0 0 1 0s5 1 0 0 0 0 0 0 0

s2

s1 s4

s3s5

c2c7

c5

c6, c8

c1c3, c4

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 15 / 44

Page 19: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

形質に基づく系統樹復元

Binary Directed Perfect Phylogeny問題

s:種,c:形質

c1 c2 c3 c4 c5 c6 c7 c8s1 0 0 1 1 1 0 1 0s2 0 1 1 1 0 0 0 0s3 1 0 0 0 0 1 0 1s4 0 0 1 1 0 0 1 0s5 1 0 0 0 0 0 0 0

s4s1

s2 s3s5

c2c7

c5

c6, c8

c1c3, c4

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 15 / 44

Page 20: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

形質に基づく系統樹復元

根つき木とは?:正確な定義

.根つき木とは?..

......

根つき木とは,ある有限集合 X 上の半順序集合 T = (X ,⪯)で,以下を満たすもの

1 X の最大元が存在する

2 任意の x , y , z ∈ X に対して,y , z が x の上界であるならば,y , z は比較可能である

この半順序集合のハッセ図を根つき木と呼ぶこともある

a

b c d

e f g

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 16 / 44

Page 21: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

形質に基づく系統樹復元

根つき木の根と葉

根つき木 T = (X ,⪯).根つき木の根と葉とは?..

......

▶ T の根とは X の最大元のこと▶ T の葉とは X の極小元のこと

a

b c d

e f g

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 17 / 44

Page 22: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

形質に基づく系統樹復元

根つき木の性質

根つき木 T = (X ,⪯).根つき木の性質........任意の Y ⊆ X に対して Y の最小上界が存在する

a

b c d

e f g

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 18 / 44

Page 23: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

形質に基づく系統樹復元

根つき木における子

根つき木 T = (X ,⪯),x ∈ X.根つき木における子とは?..

......

x の子とは,X の要素 y ∈ X で以下を満たすもの▶ y ≺ x

▶ y ≺ z ≺ x となる z ∈ X が存在しない

a

b c d

e f g

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 19 / 44

Page 24: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

形質に基づく系統樹復元

根つき二分木とは?

根つき木 T = (X ,⪯).根つき木二分木とは?..

......

T が根つき二分木であるとは,葉ではない任意の x ∈ X の子の数がちょうど 2であること

a

b c

d e f

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 20 / 44

Page 25: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

形質に基づく系統樹復元

Binary Directed Perfect Phylogeny問題 (再掲)

s:種,c:形質

c1 c2 c3 c4 c5 c6 c7 c8s1 0 0 1 1 1 0 1 0s2 0 1 1 1 0 0 0 0s3 1 0 0 0 0 1 0 1s4 0 0 1 1 0 0 1 0s5 1 0 0 0 0 0 0 0

s1 s4

s2 s3s5

c2c7

c5

c6, c8

c1c3, c4

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 21 / 44

Page 26: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

Binary Directed Perfect Phylogeny 問題

目次

..1 生物の進化と系統樹

..2 形質に基づく系統樹復元

..3 Binary Directed Perfect Phylogeny問題

..4 不完全 Binary Directed Perfect Phylogeny問題

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 22 / 44

Page 27: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

Binary Directed Perfect Phylogeny 問題

例 1:どのように系統樹を作るのか?

Aj =形質 cj を持つ種全体の集合(Aj = {si | Mi ,j = 1})

c1 c2 c3 c4 c5 c6 c7 c8s1 0 0 1 1 1 0 1 0s2 0 1 1 1 0 0 0 0s3 1 0 0 0 0 1 0 1s4 0 0 1 1 0 0 1 0s5 1 0 0 0 0 0 0 0

s1 s4

s2 s3s5

c2c7

c5

c6, c8

c1c3, c4

s1 s4 s2 s5 s3

A5 A7

A2 A6=A8

A1

A3=A4

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 23 / 44

Page 28: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

Binary Directed Perfect Phylogeny 問題

例 1:どのように系統樹を作るのか?

Aj =形質 cj を持つ種全体の集合(Aj = {si | Mi ,j = 1})

c1 c2 c3 c4 c5 c6 c7 c8s1 0 0 1 1 1 0 1 0s2 0 1 1 1 0 0 0 0s3 1 0 0 0 0 1 0 1s4 0 0 1 1 0 0 1 0s5 1 0 0 0 0 0 0 0

s1 s4

s2 s3s5

c2c7

c5

c6, c8

c1c3, c4

s1 s4 s2 s5 s3

A5 A7

A2 A6=A8

A1

A3=A4

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 23 / 44

Page 29: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

Binary Directed Perfect Phylogeny 問題

例 1:どのように系統樹を作るのか?

Aj =形質 cj を持つ種全体の集合(Aj = {si | Mi ,j = 1})

c1 c2 c3 c4 c5 c6 c7 c8s1 0 0 1 1 1 0 1 0s2 0 1 1 1 0 0 0 0s3 1 0 0 0 0 1 0 1s4 0 0 1 1 0 0 1 0s5 1 0 0 0 0 0 0 0

s1 s4

s2 s3s5

c2c7

c5

c6, c8

c1c3, c4

s1 s4 s2 s5 s3

A5 A7

A2 A6=A8

A1

A3=A4

s3, s5s1, s2, s4

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 23 / 44

Page 30: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

Binary Directed Perfect Phylogeny 問題

例 1:どのように系統樹を作るのか?

Aj =形質 cj を持つ種全体の集合(Aj = {si | Mi ,j = 1})

c1 c2 c3 c4 c5 c6 c7 c8s1 0 0 1 1 1 0 1 0s2 0 1 1 1 0 0 0 0s3 1 0 0 0 0 1 0 1s4 0 0 1 1 0 0 1 0s5 1 0 0 0 0 0 0 0

s1 s4

s2 s3s5

c2c7

c5

c6, c8

c1c3, c4

s1 s4 s2 s5 s3

A5 A7

A2 A6=A8

A1

A3=A4

s3, s5s1, s2, s4

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 23 / 44

Page 31: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

Binary Directed Perfect Phylogeny 問題

例 1:どのように系統樹を作るのか?

Aj =形質 cj を持つ種全体の集合(Aj = {si | Mi ,j = 1})

c1 c2 c3 c4 c5 c6 c7 c8s1 0 0 1 1 1 0 1 0s2 0 1 1 1 0 0 0 0s3 1 0 0 0 0 1 0 1s4 0 0 1 1 0 0 1 0s5 1 0 0 0 0 0 0 0

s1 s4

s2 s3s5

c2c7

c5

c6, c8

c1c3, c4

s1 s4 s2 s5 s3

A5 A7

A2 A6=A8

A1

A3=A4

s1, s2, s4

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 23 / 44

Page 32: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

Binary Directed Perfect Phylogeny 問題

例 1:どのように系統樹を作るのか?

Aj =形質 cj を持つ種全体の集合(Aj = {si | Mi ,j = 1})

c1 c2 c3 c4 c5 c6 c7 c8s1 0 0 1 1 1 0 1 0s2 0 1 1 1 0 0 0 0s3 1 0 0 0 0 1 0 1s4 0 0 1 1 0 0 1 0s5 1 0 0 0 0 0 0 0

s1 s4

s2 s3s5

c2c7

c5

c6, c8

c1c3, c4

s1 s4 s2 s5 s3

A5 A7

A2 A6=A8

A1

A3=A4

s1, s2, s4

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 23 / 44

Page 33: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

Binary Directed Perfect Phylogeny 問題

例 1:どのように系統樹を作るのか?

Aj =形質 cj を持つ種全体の集合(Aj = {si | Mi ,j = 1})

c1 c2 c3 c4 c5 c6 c7 c8s1 0 0 1 1 1 0 1 0s2 0 1 1 1 0 0 0 0s3 1 0 0 0 0 1 0 1s4 0 0 1 1 0 0 1 0s5 1 0 0 0 0 0 0 0

s1 s4

s2 s3s5

c2c7

c5

c6, c8

c1c3, c4

s1 s4 s2 s5 s3

A5 A7

A2 A6=A8

A1

A3=A4

s1, s4

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 23 / 44

Page 34: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

Binary Directed Perfect Phylogeny 問題

例 1:どのように系統樹を作るのか?

Aj =形質 cj を持つ種全体の集合(Aj = {si | Mi ,j = 1})

c1 c2 c3 c4 c5 c6 c7 c8s1 0 0 1 1 1 0 1 0s2 0 1 1 1 0 0 0 0s3 1 0 0 0 0 1 0 1s4 0 0 1 1 0 0 1 0s5 1 0 0 0 0 0 0 0

s1 s4

s2 s3s5

c2c7

c5

c6, c8

c1c3, c4

s1 s4 s2 s5 s3

A5 A7

A2 A6=A8

A1

A3=A4

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 23 / 44

Page 35: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

Binary Directed Perfect Phylogeny 問題

系統樹が作れるための必要十分条件

種 s1, . . . , sn,形質 c1, . . . , cm,種形質行列M ∈ {0, 1}n×m

.系統樹が作れるための必要十分条件 (整合性条件)..

......

M から系統樹を作ることができる ⇔集合 A1, . . . ,Amの中の任意の 2つ Ai と Aj が次のいずれかを満たす

Ai ⊆ Aj , Ai ⊇ Aj , Ai ∩ Aj = ∅

s1 s4 s2 s5 s3

A5 A7

A2 A6=A8

A1

A3=A4

▶ A1 ∩ A2 = ∅▶ A1 ∩ A3 = ∅▶ A1 ∩ A4 = ∅▶ A1 ∩ A5 = ∅▶ A1 ⊇ A6

▶ A1 ∩ A7 = ∅▶ A1 ⊇ A8

▶ A2 ⊆ A3

▶ A2 ⊆ A4

▶ A2 ∩ A5 = ∅▶ A2 ∩ A6 = ∅▶ A2 ∩ A7 = ∅▶ A2 ∩ A8 = ∅▶ · · ·

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 24 / 44

Page 36: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

Binary Directed Perfect Phylogeny 問題

系統樹が作れるための必要十分条件:証明 (1)

種 s1, . . . , sn,形質 c1, . . . , cm,種形質行列M ∈ {0, 1}n×m

.系統樹が作れるための必要十分条件 (整合性条件)..

......

M から系統樹を作ることができる ⇔集合 A1, . . . ,Amの中の任意の 2つ Ai と Aj が次のいずれかを満たす

Ai ⊆ Aj , Ai ⊇ Aj , Ai ∩ Aj = ∅

証明 (⇒):系統樹 T が作れると仮定する▶ 任意の異なる形質 ci と cj を選ぶ▶ 系統樹 T において以下のいずれかが成り立っている

1 ci を割り当てている枝が cj を割り当てている枝より下にある2 ci を割り当てている枝が cj を割り当てている枝より上にある3 ci を割り当てている枝と cj を割り当てている枝が同じである4 ci を割り当てている枝と cj を割り当てている枝が比較不能

図を板書

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 25 / 44

Page 37: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

Binary Directed Perfect Phylogeny 問題

系統樹が作れるための必要十分条件:証明 (2)

種 s1, . . . , sn,形質 c1, . . . , cm,種形質行列M ∈ {0, 1}n×m

.系統樹が作れるための必要十分条件 (整合性条件)..

......

M から系統樹を作ることができる ⇔集合 A1, . . . ,Amの中の任意の 2つ Ai と Aj が次のいずれかを満たす

Ai ⊆ Aj , Ai ⊇ Aj , Ai ∩ Aj = ∅

証明 (⇒) 続き:系統樹 T が作れると仮定する1 ci を割り当てている枝が cj を割り当てている枝より下にある

▶ このとき,Ai ⊆ Aj となる2 ci を割り当てている枝が cj を割り当てている枝より上にある

▶ このとき,Ai ⊇ Aj となる3 ci を割り当てている枝と cj を割り当てている枝が同じである

▶ このとき,Ai = Aj となる (すなわち,Ai ⊆ Aj となる)

4 ci を割り当てている枝と cj を割り当てている枝が比較不能▶ このとき,Ai ∩ Aj = ∅となる

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 26 / 44

Page 38: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

Binary Directed Perfect Phylogeny 問題

系統樹が作れるための必要十分条件:証明 (3)

種 s1, . . . , sn,形質 c1, . . . , cm,種形質行列M ∈ {0, 1}n×m

.系統樹が作れるための必要十分条件 (整合性条件)..

......

M から系統樹を作ることができる ⇔集合 A1, . . . ,Amの中の任意の 2つ Ai と Aj が次のいずれかを満たす

Ai ⊆ Aj , Ai ⊇ Aj , Ai ∩ Aj = ∅

証明 (⇐):A1, . . . ,Amがこの条件を満たすと仮定▶ 証明はmに関する帰納法で行う▶ 基底段階:m = 1のとき,

A1とそれ以外を分けることで,系統樹は必ず作れる

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 27 / 44

Page 39: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

Binary Directed Perfect Phylogeny 問題

系統樹が作れるための必要十分条件:証明 (3)

種 s1, . . . , sn,形質 c1, . . . , cm,種形質行列M ∈ {0, 1}n×m

.系統樹が作れるための必要十分条件 (整合性条件)..

......

M から系統樹を作ることができる ⇔集合 A1, . . . ,Amの中の任意の 2つ Ai と Aj が次のいずれかを満たす

Ai ⊆ Aj , Ai ⊇ Aj , Ai ∩ Aj = ∅

証明 (⇐) 帰納段階:k < mである場合に成り立つと仮定する▶ A1, . . . ,Amの中で,⊆に関して極大である集合を Ai とする▶ 形質 ci を持つ種と持たない種で分割し,系統樹の頭の部分を作る▶ 残りの部分は帰納法の仮定を用いて作ることができる

(詳細は演習問題)

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 28 / 44

Page 40: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

Binary Directed Perfect Phylogeny 問題

証明における帰納段階と構成法 (あるいは,構成法の復習)

Aj =形質 cj を持つ種全体の集合

c1 c2 c3 c4 c5 c6 c7 c8s1 0 0 1 1 1 0 1 0s2 0 1 1 1 0 0 0 0s3 1 0 0 0 0 1 0 1s4 0 0 1 1 0 0 1 0s5 1 0 0 0 0 0 0 0

s1 s4

s2 s3s5

c2c7

c5

c6, c8

c1c3, c4

s1 s4 s2 s5 s3

A5 A7

A2 A6=A8

A1

A3=A4

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 29 / 44

Page 41: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

Binary Directed Perfect Phylogeny 問題

証明における帰納段階と構成法 (あるいは,構成法の復習)

Aj =形質 cj を持つ種全体の集合

c1 c2 c3 c4 c5 c6 c7 c8s1 0 0 1 1 1 0 1 0s2 0 1 1 1 0 0 0 0s3 1 0 0 0 0 1 0 1s4 0 0 1 1 0 0 1 0s5 1 0 0 0 0 0 0 0

s1 s4

s2 s3s5

c2c7

c5

c6, c8

c1c3, c4

s1 s4 s2 s5 s3

A5 A7

A2 A6=A8

A1

A3=A4

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 29 / 44

Page 42: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

Binary Directed Perfect Phylogeny 問題

証明における帰納段階と構成法 (あるいは,構成法の復習)

Aj =形質 cj を持つ種全体の集合

c1 c2 c3 c4 c5 c6 c7 c8s1 0 0 1 1 1 0 1 0s2 0 1 1 1 0 0 0 0s3 1 0 0 0 0 1 0 1s4 0 0 1 1 0 0 1 0s5 1 0 0 0 0 0 0 0

s1 s4

s2 s3s5

c2c7

c5

c6, c8

c1c3, c4

s1 s4 s2 s5 s3

A5 A7

A2 A6=A8

A1

A3=A4

s3, s5s1, s2, s4

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 29 / 44

Page 43: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

Binary Directed Perfect Phylogeny 問題

証明における帰納段階と構成法 (あるいは,構成法の復習)

Aj =形質 cj を持つ種全体の集合

c1 c2 c3 c4 c5 c6 c7 c8s1 0 0 1 1 1 0 1 0s2 0 1 1 1 0 0 0 0s3 1 0 0 0 0 1 0 1s4 0 0 1 1 0 0 1 0s5 1 0 0 0 0 0 0 0

s1 s4

s2 s3s5

c2c7

c5

c6, c8

c1c3, c4

s1 s4 s2 s5 s3

A5 A7

A2 A6=A8

A1

A3=A4

s3, s5s1, s2, s4

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 29 / 44

Page 44: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

Binary Directed Perfect Phylogeny 問題

証明における帰納段階と構成法 (あるいは,構成法の復習)

Aj =形質 cj を持つ種全体の集合

c1 c2 c3 c4 c5 c6 c7 c8s1 0 0 1 1 1 0 1 0s2 0 1 1 1 0 0 0 0s3 1 0 0 0 0 1 0 1s4 0 0 1 1 0 0 1 0s5 1 0 0 0 0 0 0 0

s1 s4

s2 s3s5

c2c7

c5

c6, c8

c1c3, c4

s1 s4 s2 s5 s3

A5 A7

A2 A6=A8

A1

A3=A4

s1, s2, s4

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 29 / 44

Page 45: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

Binary Directed Perfect Phylogeny 問題

証明における帰納段階と構成法 (あるいは,構成法の復習)

Aj =形質 cj を持つ種全体の集合

c1 c2 c3 c4 c5 c6 c7 c8s1 0 0 1 1 1 0 1 0s2 0 1 1 1 0 0 0 0s3 1 0 0 0 0 1 0 1s4 0 0 1 1 0 0 1 0s5 1 0 0 0 0 0 0 0

s1 s4

s2 s3s5

c2c7

c5

c6, c8

c1c3, c4

s1 s4 s2 s5 s3

A5 A7

A2 A6=A8

A1

A3=A4

s1, s2, s4

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 29 / 44

Page 46: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

Binary Directed Perfect Phylogeny 問題

証明における帰納段階と構成法 (あるいは,構成法の復習)

Aj =形質 cj を持つ種全体の集合

c1 c2 c3 c4 c5 c6 c7 c8s1 0 0 1 1 1 0 1 0s2 0 1 1 1 0 0 0 0s3 1 0 0 0 0 1 0 1s4 0 0 1 1 0 0 1 0s5 1 0 0 0 0 0 0 0

s1 s4

s2 s3s5

c2c7

c5

c6, c8

c1c3, c4

s1 s4 s2 s5 s3

A5 A7

A2 A6=A8

A1

A3=A4

s1, s4

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 29 / 44

Page 47: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

Binary Directed Perfect Phylogeny 問題

証明における帰納段階と構成法 (あるいは,構成法の復習)

Aj =形質 cj を持つ種全体の集合

c1 c2 c3 c4 c5 c6 c7 c8s1 0 0 1 1 1 0 1 0s2 0 1 1 1 0 0 0 0s3 1 0 0 0 0 1 0 1s4 0 0 1 1 0 0 1 0s5 1 0 0 0 0 0 0 0

s1 s4

s2 s3s5

c2c7

c5

c6, c8

c1c3, c4

s1 s4 s2 s5 s3

A5 A7

A2 A6=A8

A1

A3=A4

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 29 / 44

Page 48: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

Binary Directed Perfect Phylogeny 問題

例 2:系統樹が作れない例

Aj =形質 cj を持つ種全体の集合

c1 c2 c3s1 1 0 0s2 1 1 1s3 0 1 1s4 0 0 1

s1 s4s2 s3

A2

A1

A3

A1,A2に対して

A1 ⊆ A2,A1 ⊇ A2,A1 ∩ A2 = ∅

のどれも成り立ってないので,系統樹が作れない

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 30 / 44

Page 49: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

Binary Directed Perfect Phylogeny 問題

Binary Directed Perfect Phylogeny問題の難しさ (易しさ)

.定理 (Estabrook, Johnson, McMorris ’76)..

......

Binary Directed Perfect Phylogeny問題は多項式時間で解ける▶ より詳細にはO(m2n)時間▶ mは形質の数,nは種の数

後に,O(mn)時間アルゴリズム (Gusfield ’91)

.展望..

......

アルゴリズム,多項式時間,O 記法については『アルゴリズム・データ構造および演習』にて学習を

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 31 / 44

Page 50: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

不完全 Binary Directed Perfect Phylogeny 問題

目次

..1 生物の進化と系統樹

..2 形質に基づく系統樹復元

..3 Binary Directed Perfect Phylogeny問題

..4 不完全 Binary Directed Perfect Phylogeny問題

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 32 / 44

Page 51: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

不完全 Binary Directed Perfect Phylogeny 問題

現実のデータには欠損がある

http://phylodiversity.net/bb09/images/9/9a/Kristinachar.png

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 33 / 44

Page 52: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

不完全 Binary Directed Perfect Phylogeny 問題

不完全 Binary Directed Perfect Phylogeny問題

▶ 入力:不完全な二値種形質行列 (M ∈ {0, 1, ?}n×m)▶ 出力:根つき二分木で次を満たすもの

▶ 入力の不完全な部分を補う▶ 各葉が 1つの種でラベル付けされている▶ 各種はラベルとして一度だけ出現する▶ 各形質に対して,同じ状態の種が誘導する最小の部分木が互いに素

c1 c2 c3 c4 c5 c6 c7 c8s1 0 0 1 1 1 0 ? 0s2 0 1 1 ? 0 0 0 0s3 1 0 0 0 0 1 0 1s4 0 ? 1 1 0 0 1 0s5 1 0 0 0 0 0 0 0

s1 s4

s2 s3s5

c2c7

c5

c6, c8

c1c3, c4

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 34 / 44

Page 53: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

不完全 Binary Directed Perfect Phylogeny 問題

不完全 Binary Directed Perfect Phylogeny問題

▶ 入力:不完全な二値種形質行列 (M ∈ {0, 1, ?}n×m)▶ 出力:根つき二分木で次を満たすもの

▶ 入力の不完全な部分を補う▶ 各葉が 1つの種でラベル付けされている▶ 各種はラベルとして一度だけ出現する▶ 各形質に対して,同じ状態の種が誘導する最小の部分木が互いに素

c1 c2 c3 c4 c5 c6 c7 c8s1 0 0 1 1 1 0 1 0s2 0 1 1 1 0 0 0 0s3 1 0 0 0 0 1 0 1s4 0 0 1 1 0 0 1 0s5 1 0 0 0 0 0 0 0

s1 s4

s2 s3s5

c2c7

c5

c6, c8

c1c3, c4

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 34 / 44

Page 54: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

不完全 Binary Directed Perfect Phylogeny 問題

不完全 Binary Directed Perfect Phylogeny問題

▶ 入力:不完全な二値種形質行列 (M ∈ {0, 1, ?}n×m)▶ 出力:根つき二分木で次を満たすもの

▶ 入力の不完全な部分を補う▶ 各葉が 1つの種でラベル付けされている▶ 各種はラベルとして一度だけ出現する▶ 各形質に対して,同じ状態の種が誘導する最小の部分木が互いに素

c1 c2 c3 c4 c5 c6 c7 c8s1 0 0 1 1 1 0 1 0s2 0 1 1 1 0 0 0 0s3 1 0 0 0 0 1 0 1s4 0 0 1 1 0 0 1 0s5 1 0 0 0 0 0 0 0

s1 s4

s2 s3s5

c2c7

c5

c6, c8

c1c3, c4

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 34 / 44

Page 55: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

不完全 Binary Directed Perfect Phylogeny 問題

不完全 Binary Directed Perfect Phylogeny問題:より詳細な定義

▶ 入力:不完全な二値種形質行列 (M ∈ {0, 1, ?}n×m)▶ 出力:根つき二分木で次を満たすもの

▶ 入力の不完全な部分を補う▶ 各葉が 1つの種でラベル付けされている▶ 各種はラベルとして一度だけ出現する▶ 各形質に対して,同じ状態の種が誘導する最小の部分木が互いに素

.やりたいこと..

......

行列M ∈ {0, 1, ?}n×mから行列M ′ ∈ {0, 1}n×mを次のように得ること▶ Mi ,j = 0ならばM ′

i ,j = 0

▶ Mi ,j = 1ならばM ′i ,j = 1

▶ M ′から得られる集合A1, . . . ,Amが先ほどの整合性条件を満たすこと

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 35 / 44

Page 56: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

不完全 Binary Directed Perfect Phylogeny 問題

例 1:どのように補えばよいか?

c1 c2 c3s1 1 0 0s2 1 1 0s3 ? 1 1s4 0 ? 1

▶ {s1, s2} ⊆ A1 ⊆ {s1, s2, s3}▶ {s2, s3} ⊆ A2 ⊆ {s2, s3, s4}▶ A3 = {s3, s4}

系統樹が作れるとすると▶ A1と A3を見ると,

A1 = {s1, s2}である▶ A2と A3を見ると,

A2 = {s2, s3, s4}である▶ しかし,このとき,A1,A2に対して

A1 ⊆ A2,A1 ⊇ A2,A1 ∩ A2 = ∅

のどれも成り立ってないので,系統樹が作れない

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 36 / 44

Page 57: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

不完全 Binary Directed Perfect Phylogeny 問題

例 2:どのように補えばよいか?

c1 c2 c3 c4 c5s1 1 ? 0 0 1s2 ? ? 0 1 0s3 ? 0 1 ? ?

▶ {s1} ⊆ A1 ⊆ {s1, s2, s3}▶ ∅ ⊆ A2 ⊆ {s1, s2}▶ A3 = {s3}▶ {s2} ⊆ A4 ⊆ {s2, s3}▶ {s1} ⊆ A5 ⊆ {s1, s3}

系統樹を作ろうとする▶ A1 = {s1, s2, s3}とすれば

A1 ⊇ A2,A3,A4,A5となるのでうれしそう

▶ A2 = ∅とすればA2 ⊆ A3,A4,A5となるのでうれしそう

▶ 他の「?」を 0にすれば,A3,A4,A5は互いに素

条件を満たせた!

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 37 / 44

Page 58: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

不完全 Binary Directed Perfect Phylogeny 問題

例 2:どのように補えばよいか?

c1 c2 c3 c4 c5s1 1 ? 0 0 1s2 ? ? 0 1 0s3 ? 0 1 ? ?

▶ {s1} ⊆ A1 ⊆ {s1, s2, s3}▶ ∅ ⊆ A2 ⊆ {s1, s2}▶ A3 = {s3}▶ {s2} ⊆ A4 ⊆ {s2, s3}▶ {s1} ⊆ A5 ⊆ {s1, s3}

系統樹を作ろうとする▶ A1 = {s1, s2, s3}とすれば

A1 ⊇ A2,A3,A4,A5となるのでうれしそう

▶ A2 = ∅とすればA2 ⊆ A3,A4,A5となるのでうれしそう

▶ 他の「?」を 0にすれば,A3,A4,A5は互いに素

条件を満たせた!

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 37 / 44

Page 59: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

不完全 Binary Directed Perfect Phylogeny 問題

例 2:どのように補えばよいか?

c1 c2 c3 c4 c5s1 1 ? 0 0 1s2 1 ? 0 1 0s3 1 0 1 ? ?

▶ {s1} ⊆ A1 ⊆ {s1, s2, s3}▶ ∅ ⊆ A2 ⊆ {s1, s2}▶ A3 = {s3}▶ {s2} ⊆ A4 ⊆ {s2, s3}▶ {s1} ⊆ A5 ⊆ {s1, s3}

系統樹を作ろうとする▶ A1 = {s1, s2, s3}とすれば

A1 ⊇ A2,A3,A4,A5となるのでうれしそう

▶ A2 = ∅とすればA2 ⊆ A3,A4,A5となるのでうれしそう

▶ 他の「?」を 0にすれば,A3,A4,A5は互いに素

条件を満たせた!

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 37 / 44

Page 60: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

不完全 Binary Directed Perfect Phylogeny 問題

例 2:どのように補えばよいか?

c1 c2 c3 c4 c5s1 1 ? 0 0 1s2 1 ? 0 1 0s3 1 0 1 ? ?

▶ {s1} ⊆ A1 ⊆ {s1, s2, s3}▶ ∅ ⊆ A2 ⊆ {s1, s2}▶ A3 = {s3}▶ {s2} ⊆ A4 ⊆ {s2, s3}▶ {s1} ⊆ A5 ⊆ {s1, s3}

系統樹を作ろうとする▶ A1 = {s1, s2, s3}とすれば

A1 ⊇ A2,A3,A4,A5となるのでうれしそう

▶ A2 = ∅とすればA2 ⊆ A3,A4,A5となるのでうれしそう

▶ 他の「?」を 0にすれば,A3,A4,A5は互いに素

条件を満たせた!

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 37 / 44

Page 61: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

不完全 Binary Directed Perfect Phylogeny 問題

例 2:どのように補えばよいか?

c1 c2 c3 c4 c5s1 1 0 0 0 1s2 1 0 0 1 0s3 1 0 1 ? ?

▶ {s1} ⊆ A1 ⊆ {s1, s2, s3}▶ ∅ ⊆ A2 ⊆ {s1, s2}▶ A3 = {s3}▶ {s2} ⊆ A4 ⊆ {s2, s3}▶ {s1} ⊆ A5 ⊆ {s1, s3}

系統樹を作ろうとする▶ A1 = {s1, s2, s3}とすれば

A1 ⊇ A2,A3,A4,A5となるのでうれしそう

▶ A2 = ∅とすればA2 ⊆ A3,A4,A5となるのでうれしそう

▶ 他の「?」を 0にすれば,A3,A4,A5は互いに素

条件を満たせた!

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 37 / 44

Page 62: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

不完全 Binary Directed Perfect Phylogeny 問題

例 2:どのように補えばよいか?

c1 c2 c3 c4 c5s1 1 0 0 0 1s2 1 0 0 1 0s3 1 0 1 ? ?

▶ {s1} ⊆ A1 ⊆ {s1, s2, s3}▶ ∅ ⊆ A2 ⊆ {s1, s2}▶ A3 = {s3}▶ {s2} ⊆ A4 ⊆ {s2, s3}▶ {s1} ⊆ A5 ⊆ {s1, s3}

系統樹を作ろうとする▶ A1 = {s1, s2, s3}とすれば

A1 ⊇ A2,A3,A4,A5となるのでうれしそう

▶ A2 = ∅とすればA2 ⊆ A3,A4,A5となるのでうれしそう

▶ 他の「?」を 0にすれば,A3,A4,A5は互いに素

条件を満たせた!

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 37 / 44

Page 63: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

不完全 Binary Directed Perfect Phylogeny 問題

例 2:どのように補えばよいか?

c1 c2 c3 c4 c5s1 1 0 0 0 1s2 1 0 0 1 0s3 1 0 1 0 0

▶ {s1} ⊆ A1 ⊆ {s1, s2, s3}▶ ∅ ⊆ A2 ⊆ {s1, s2}▶ A3 = {s3}▶ {s2} ⊆ A4 ⊆ {s2, s3}▶ {s1} ⊆ A5 ⊆ {s1, s3}

系統樹を作ろうとする▶ A1 = {s1, s2, s3}とすれば

A1 ⊇ A2,A3,A4,A5となるのでうれしそう

▶ A2 = ∅とすればA2 ⊆ A3,A4,A5となるのでうれしそう

▶ 他の「?」を 0にすれば,A3,A4,A5は互いに素

条件を満たせた!

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 37 / 44

Page 64: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

不完全 Binary Directed Perfect Phylogeny 問題

「うれしそう」であることをしてもよいという保証 (1)

種 s1, . . . , sn,形質 c1, . . . , cm,不完全種形質行列M ∈ {0, 1, ?}n×m

.性質..

......

ある形質 ck が存在して,Ak = ∅となるように補完できるこのとき,

M に対して系統樹が作れる ⇒ Ak = ∅として系統樹が作れる

証明:M に対して系統樹が作れると仮定▶ 集合 A1, . . . ,Amが存在して,任意の i , j に次のどれかが成り立つ

Ai ⊆ Aj ,Ai ⊇ Aj ,Ai ∩ Aj = ∅

▶ このとき,Ak を ∅に変えても,この性質は成り立つ

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 38 / 44

Page 65: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

不完全 Binary Directed Perfect Phylogeny 問題

「うれしそう」であることをしてもよいという保証 (2)

種 s1, . . . , sn,形質 c1, . . . , cm,不完全種形質行列M ∈ {0, 1, ?}n×m

.性質..

......

ある形質 ck が存在して,Ak = {s1, . . . , sn}となるように補完できるこのとき,

M に対して系統樹が作れる ⇒ Ak = {s1, . . . , sn}として系統樹が作れる

証明:M に対して系統樹が作れると仮定▶ 集合 A1, . . . ,Amが存在して,任意の i , j に次のどれかが成り立つ

Ai ⊆ Aj ,Ai ⊇ Aj ,Ai ∩ Aj = ∅

▶ このとき,Ak を {s1, . . . , sn}に変えても,この性質は成り立つ

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 39 / 44

Page 66: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

不完全 Binary Directed Perfect Phylogeny 問題

例 3:どのように補えばよいか?

c1 c2 c3 c4s1 1 0 ? 0s2 1 1 ? ?s3 ? 1 0 ?s4 0 ? 1 ?s5 ? 0 1 1s6 ? 0 ? 1

?を全部 0にしたときの状況

s1 s2 s3 s4 s5

A4A2 A3

s6

A1

系統樹を作ろうとする▶ 分けられるところで分けても問題なさそう

▶ 左側では,A1 = {s1, s2, s3}とすれば問題ない

▶ 右側では,A3 = {s4, s5, s6}とすれば問題ない

条件を満たせた!岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 40 / 44

Page 67: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

不完全 Binary Directed Perfect Phylogeny 問題

例 3:どのように補えばよいか?

c1 c2 c3 c4s1 1 0 ? 0s2 1 1 ? ?s3 ? 1 0 ?s4 0 ? 1 ?s5 ? 0 1 1s6 ? 0 ? 1

?を全部 0にしたときの状況

s1 s2 s3 s4 s5

A4A2 A3

s6

A1

系統樹を作ろうとする▶ 分けられるところで分けても問題なさそう

▶ 左側では,A1 = {s1, s2, s3}とすれば問題ない

▶ 右側では,A3 = {s4, s5, s6}とすれば問題ない

条件を満たせた!岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 40 / 44

Page 68: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

不完全 Binary Directed Perfect Phylogeny 問題

例 3:どのように補えばよいか?

c1 c2 c3 c4s1 1 0 0 0s2 1 1 0 0s3 ? 1 0 0s4 0 0 1 ?s5 0 0 1 1s6 0 0 ? 1

?を全部 0にしたときの状況

s1 s2 s3 s4 s5

A4A2 A3

s6

A1

系統樹を作ろうとする▶ 分けられるところで分けても問題なさそう

▶ 左側では,A1 = {s1, s2, s3}とすれば問題ない

▶ 右側では,A3 = {s4, s5, s6}とすれば問題ない

条件を満たせた!岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 40 / 44

Page 69: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

不完全 Binary Directed Perfect Phylogeny 問題

例 3:どのように補えばよいか?

c1 c2 c3 c4s1 1 0 0 0s2 1 1 0 0s3 ? 1 0 0s4 0 0 1 ?s5 0 0 1 1s6 0 0 ? 1

?を全部 0にしたときの状況

s1 s2 s3 s4 s5

A4A2 A3

s6

A1

系統樹を作ろうとする▶ 分けられるところで分けても問題なさそう

▶ 左側では,A1 = {s1, s2, s3}とすれば問題ない

▶ 右側では,A3 = {s4, s5, s6}とすれば問題ない

条件を満たせた!岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 40 / 44

Page 70: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

不完全 Binary Directed Perfect Phylogeny 問題

例 3:どのように補えばよいか?

c1 c2 c3 c4s1 1 0 0 0s2 1 1 0 0s3 1 1 0 0s4 0 0 1 ?s5 0 0 1 1s6 0 0 ? 1

?を全部 0にしたときの状況

s1 s2 s3 s4 s5

A4A2 A3

s6

A1

系統樹を作ろうとする▶ 分けられるところで分けても問題なさそう

▶ 左側では,A1 = {s1, s2, s3}とすれば問題ない

▶ 右側では,A3 = {s4, s5, s6}とすれば問題ない

条件を満たせた!岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 40 / 44

Page 71: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

不完全 Binary Directed Perfect Phylogeny 問題

例 3:どのように補えばよいか?

c1 c2 c3 c4s1 1 0 0 0s2 1 1 0 0s3 1 1 0 0s4 0 0 1 ?s5 0 0 1 1s6 0 0 ? 1

?を全部 0にしたときの状況

s1 s2 s3 s4 s5

A4A2 A3

s6

A1

系統樹を作ろうとする▶ 分けられるところで分けても問題なさそう

▶ 左側では,A1 = {s1, s2, s3}とすれば問題ない

▶ 右側では,A3 = {s4, s5, s6}とすれば問題ない

条件を満たせた!岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 40 / 44

Page 72: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

不完全 Binary Directed Perfect Phylogeny 問題

例 3:どのように補えばよいか?

c1 c2 c3 c4s1 1 0 0 0s2 1 1 0 0s3 1 1 0 0s4 0 0 1 0s5 0 0 1 1s6 0 0 1 1

?を全部 0にしたときの状況

s1 s2 s3 s4 s5

A4A2 A3

s6

A1

系統樹を作ろうとする▶ 分けられるところで分けても問題なさそう

▶ 左側では,A1 = {s1, s2, s3}とすれば問題ない

▶ 右側では,A3 = {s4, s5, s6}とすれば問題ない

条件を満たせた!岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 40 / 44

Page 73: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

不完全 Binary Directed Perfect Phylogeny 問題

「分けられるときに分ける」としてもよいという保証

種 s1, . . . , sn,形質 c1, . . . , cm,不完全種形質行列M ∈ {0, 1, ?}n×m

.性質..

......

M における ?をすべて 0にしたとき,種の集合の分割 {S1, S2}と形質の集合の分割 {C1,C2}が存在して,S1の種は C2の形質を持たない,そして,S2の種は C1の形質を持たない,となるとするこのとき,

M に対して系統樹が作れる ⇒ 上の分割から得られる補完を使って系統樹が作れる

.「上の分割から得られる補完」とは?..

......

その補完をM ′とすると▶ si ∈ S1かつ cj ∈ C2のとき,M ′

i ,j = 0

▶ si ∈ S2かつ cj ∈ C1のとき,M ′i ,j = 0

証明は省略岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 41 / 44

Page 74: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

不完全 Binary Directed Perfect Phylogeny 問題

不完全 Binary Directed Perfect Phylogeny問題を解く手順

1 ある列の成分をすべて 1に補完できるならば,そのように補完して,その列を削除

2 ある列の成分をすべて 0に補完できるならば,そのように補完して,その列を削除

3 残ったすべての ?を仮に 0として,A1, . . . ,Amを作る4 うまく分割できるところで分割しようとする

▶ 分割できた ⇒ 小さくなった問題を同じ手順で解く▶ 分割できない ⇒ 系統樹を作れない

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 42 / 44

Page 75: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

不完全 Binary Directed Perfect Phylogeny 問題

不完全 Binary Directed Perfect Phylogeny問題の難しさ (易しさ)

.定理 (Benham, Kannan, Paterson, Warnow ’95)..

......

不完全 Binary Directed Perfect Phylogeny問題は多項式時間で解ける▶ より詳細にはO(mn2)時間▶ mは形質の数,nは種の数

後に,O(mn + k log2(m + n))時間アルゴリズム(Pe’er, Pupko, Shamir, Sharan, ’04)

▶ k は「?」の総数

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 43 / 44

Page 76: 離散数学第 14 回 系統樹復元の離散数学 岡本吉央 ...dopal.cs.uec.ac.jp/okamotoy/lect/2013/discretemath/lect...離散数学第14 回 系統樹復元の離散数学

不完全 Binary Directed Perfect Phylogeny 問題

目次

..1 生物の進化と系統樹

..2 形質に基づく系統樹復元

..3 Binary Directed Perfect Phylogeny問題

..4 不完全 Binary Directed Perfect Phylogeny問題

岡本 吉央 (電通大) 離散数学 (14) 2013 年 7 月 30 日 44 / 44