2014 年度実績報告書

第二世代モチーフ解析法に基づくがん細胞に特異的な転写制御経路の発見

公募研究

研究領域	システム的統合理解に基づくがんの先端的診断、治療、予防法の開発
研究課題/領域番号	25134716
研究機関	統計数理研究所
研究代表者	吉田亮統計数理研究所, モデリング研究系, 准教授 (70401263)
研究期間 (年度)	2013-04-01 – 2015-03-31
キーワード	モチーフ発見問題 / ゲノム / 転写因子 / ChIP-seq / ベイズ統計 / マルコフ連鎖モンテカルロ法
研究実績の概要	DNA配列から短い保存配列のパターンを検出する問題（モチーフ発見問題）に取り組んだ。モチーフ発見問題はバイオインフォマティクスの古典的問題であり、これまでに数多くのアルゴリズムが提案されてきた。従来法の多くは、古典的なプロモータ解析を対象に開発されてきた。したがって、超高速シーケンサの普及によるデータの大規模化に対し、計算効率および検出性能の劣化が問題になってきた。例えば、ChIP-seqの解析では、長さ数百bp、10^4-10^6個くらいの配列が解析対象となるが、従来法には、長さ10^3 bp、配列数10^2程度のデータしか想定されていない。そこで、ポスト次世代シーケンサのアルゴリズム開発が始まることとなった。しかしながら、これらのアルゴリズムは、計算速度の改善を優先するあまり、検出力の低さが問題となる。本研究では、検出力の改善を最重要課題とし、Repulsive Parallel MCMC（RPMCMC）というモチーフ発見アルゴリズムを開発した。複数個のギブスサンプリングを同時に実行し、サンプル列が互いに接近した際に反発作用を加える。するとサンプル列のアンサンブルは互いに異なる領域に向かうため、一回のサンプリングで多様なモチーフを発見することができることが大きな特徴である。包括的な数値実験を実施し、既存手法に対する高い優位性を示した。開発したプログラムは論文とともに公開した（Ikebata et al., Bioinformatics, 2015）。癌研究への応用では、ChIP-seqのデータを用いて転写共役因子の結合部位を網羅的に発見する問題に取り組んだ。ENCODEの228個のChIP-seqのデータにRPMCMCを適用し、発見されたモチーフとDNA結合タンパク質のアノテーションリストを公開した。
現在までの達成度 (段落)	26年度が最終年度であるため、記入しない。
今後の研究の推進方策	26年度が最終年度であるため、記入しない。

研究成果
(4件)

すべて 2015 2014 その他

すべて雑誌論文 (1件) (うち査読あり 1件、オープンアクセス 1件、謝辞記載あり 1件) 学会発表 (2件) 備考 (1件)

[雑誌論文] Repulsive parallel MCMC algorithm for discovering diverse motifs from large sequence sets2015
- 著者名/発表者名
  Hisaki Ikebata, Ryo Yoshida
- 雑誌名
  
  Bioinformatics
  
  巻: 31(10) ページ: 1561-1568
- DOI
  10.1093/bioinformatics/btv017
- 査読あり / オープンアクセス / 謝辞記載あり
[学会発表] Repulsive parallel MCMC algorithm for discovering diverse motifs from large sequence datasets2014
- 著者名/発表者名
  池端久貴
- 学会等名
  生命医薬情報学連合大会2014
- 発表場所
  仙台 (仙台国際センター)
- 年月日
  2014-10-02 – 2014-10-04
[学会発表] Repulsive Parallel MCMC アルゴリズムによる塩基配列のモチーフ探索2014
- 著者名/発表者名
  池端久貴
- 学会等名
  2014年度統計関連学会連合大会
- 発表場所
  東京 (東京大学本郷キャンパス)
- 年月日
  2014-09-13 – 2014-09-16
[備考] ソフトウェア配布および研究成果公開用ウェブサイト
- URL
  http://daweb.ism.ac.jp/yoshidalab/motif/

2014 年度 実績報告書

第二世代モチーフ解析法に基づくがん細胞に特異的な転写制御経路の発見

研究代表者

吉田 亮 統計数理研究所, モデリング研究系, 准教授 (70401263)

研究成果

[雑誌論文] Repulsive parallel MCMC algorithm for discovering diverse motifs from large sequence sets2015

著者名/発表者名

雑誌名

DOI

[学会発表] Repulsive parallel MCMC algorithm for discovering diverse motifs from large sequence datasets2014

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Repulsive Parallel MCMC アルゴリズムによる塩基配列のモチーフ探索2014

著者名/発表者名

学会等名

発表場所

年月日

[備考] ソフトウェア配布および研究成果公開用ウェブサイト

URL

2014 年度実績報告書

吉田亮統計数理研究所, モデリング研究系, 准教授 (70401263)