In silico drug discovery with FAMS and chooseLD
Post on 16-Jul-2015
347 Views
Preview:
Transcript
FAMSFAMSととchooseLDchooseLDを用いたインシリコ創薬パイプラインを用いたインシリコ創薬パイプライン
[[中央大学共同研究プロジェクト 中央大学共同研究プロジェクト 20132013年度年度-2015-2015年度年度]]
中央大学理工学部物理学科 田口善弘
共同研究者
中央大学理工学部生命科学科 岩舘満男北里大学薬学部名誉教授 梅山秀明(中央大学共同研究員)
(株)インシリコサイエンス
1 「主成分分析を用いた教師なし学習による変数選択」とは何か
2 インシリコ創薬への応用例
2.1 3種類の自己免疫疾患に共通するプロモーターメチル化異常を起こしている遺伝子の探索およびその結果に基づいたインシリコ創薬
2.2 食道上皮がんにおけるSNP特異的なDNAメチル化の探索とその結果に基づいたインシリコ創薬
2.3 マウスモデルを用いたPTSD由来の心疾患におけるmicroRNA発現異常を伴う標的遺伝子発現異常の探索とその結果に基づいたインシリコ創薬
2.4 ヒト小細胞肺がんセルラインのリプログラミング実験における、プロモーターメチル化異常を伴う遺伝子発現異常の探索とインシリコ創薬の可能性
3 終わりに
1 「主成分分析を用いた教師なし学習による変数選択」とは何か
目的: サンプルのラベル情報なしに変数選択を行う
通常:「健常者と患者のオミックスデータがある。差が大きい変数を選択して診療・診断に使おう」
この戦略の弱点:「実は患者の方が有意にコーヒー愛好家が多く、選んだ変数は「患者と健常者」の区別ではなく「コーヒー愛好家かそうでないか」の区別をする変数だった」がありうる。
✖ ✖✖
✖
✖ ✖✖
✖✖ ✖
✖
✖✖ ✖✖
✖✖ ✖
✖
✖
✖ 患者○ 健常者赤 コーヒー愛好家青 コーヒー愛好家以外
コーヒー愛好家判別変数
変数A
変数B
変数Aと変数Bが「真の患者vs健常者」判別変数になりうるがこれは「一個(=コーヒ ー 愛 好 家 判 別 変数)でそこそこできているのだから」という理由で誤って見逃されるかもしれない
教師なし変数選択は可能か?
20サンプル
A群10個体 B群10個体
10
90
100
変数
100変数中10変数「だけ」が2群で差がある
サンプルのラベル情報「無し」で100変数の方を主成分分析
第二主成分
第一主成分
二群に差のある変数が外れ値として抽出される
サンプル
第一主成分
第一主成分への各サンプルの寄与を見ると2群できっちり分かれている。ラベリング情報無しでもきっちり2群で差があるような第一主成分が自動的に構成されるので、これに沿った「外れ値」に相当する変数を選択すれば少ない変数で2群を区別できるようになる⇒教師なし変数選択が可能な理由
しかし、現実はこんなに単純じゃないだろう。うまく行くのか?
2 インシリコ創薬への応用例 2.1 3種類の自己免疫疾患に共通するプロモーターメチル化
異常を起こしている遺伝子の探索およびその結果に基づいたインシリコ創薬
目的:3種類の自己免疫疾患共通のプロモーターメチル化異常の探索全身性エリマトーデス(SLE),関節リュウマチ(RA)、皮膚筋炎(DM)一卵性双生児(健常vs患者)+性別年齢一致健常者2名 5セット✕(Javierre et al, Genome Res. (2010) )
全身性トリマトーデス(SLE)
第三主成分
第二主成分
第二主成分
○:SLE双子 +:健常1△:健常双子 :健常2✕
患者側が非メチル化
それぞれで選択された遺伝子の過半数が共通⇒複数の自己免疫疾患に対するプロモーターメチル化異常の検出
(世界初)
AIM2,CARD15,CD82,CSF1R,CSF3,CSF3R,DHCR24,ERCC3,GRB7,HG
F,HOXB2,IFNGR2,LCN2,LMO2,LTB4R,MMP14,MMP8,MPL,PADI4,
PECAM1,PI3,RARA,S100A2,SEPT9,SLC22A18,SPI1,SPP1,STAT5A,
SYK,TIE1,TM7SF3,TRIP6,VAMP8
chooseLDによるインシリコ創薬 in DrugBank
北里大学薬学部梅山研で開発されたin silico drug discovery tool
創薬対象化合物データベース
CSF1R,SYK,MMP8,MMP14,LCN2について、DrugBankの中から既知の阻害剤との類似性をTanimoto Indexでフィルタリ ン グ し た 1 0 0 0程度の 化合物 をFPAScoreでランキングした
2.2 食道上皮がんにおけるSNP特異的なDNAメチル化の探索とその結果に基づいたインシリコ創薬
食道上皮がん患者30人
血液 周辺組織 食道がん
genotype
DNA メチル化
(Yang et al, PLoS ONE 2010)
SNPアレイ
ALK,EGLN3,NUAK1についてDrugBankから既知の阻害剤とのTanimoto係数が0.2以上である化合物約1000個をFPAScoreでランキングを行った。
ALKALK上位10位上位10位
2.3 マウスモデルを用いたPTSD由来の心疾患におけるmicroRNA発現異常を伴う標的遺伝子発現異常の探索とそ
の結果に基づいたインシリコ創薬
ス トレス を 与えた マ ウ ス の 心臓のス トレス を 与えた マ ウ ス の 心臓の miRNAmiRNAとと mRNAmRNAの 発 現の 発 現データを解析。データを解析。 miRNAmiRNAの発現と負相関しているの発現と負相関している mRNAmRNAを教師を教師なし学習を用いた変数選択で特定。心筋関連の遺伝子が多なし学習を用いた変数選択で特定。心筋関連の遺伝子が多数 選 択 さ れ た 。 そ の 中 か ら数 選 択 さ れ た 。 そ の 中 か ら fabp3fabp3を 標 的 に イ ン シ リ コ 創 薬 をを 標 的 に イ ン シ リ コ 創 薬 を行った。行った。
2.4 ヒト小細胞肺がんセルラインのリプログラミング実験における、プロモーターメチル化異常を伴う遺伝子発現異常の探
索とインシリコ創薬の可能性
ヒト小細胞肺がんセルラインのリプログラミング実験からプロヒト小細胞肺がんセルラインのリプログラミング実験からプロモーターメチル化とモーターメチル化と mRNAmRNAの発現が負相関している遺伝子をの発現が負相関している遺伝子を教 師 な し 学 習 を 用 い た 変 数 選 択 で 特定 。教 師 な し 学 習 を 用 い た 変 数 選 択 で 特定 。 TGFBI,S100A6, TGFBI,S100A6, CSRP1, CLDN11, PRKCDBP, CRIP1,CSRP1, CLDN11, PRKCDBP, CRIP1,の6つを特定した。の6つを特定した。
top related