2016 Fiscal Year Annual Research Report
Mixture modeling of regularization terms with optimization sampling strategies and its application to biological large scale data
Project/Area Number |
26330330
|
Research Institution | Kyushu University |
Principal Investigator |
丸山 修 九州大学, マス・フォア・インダストリ研究所, 准教授 (20282519)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 混合正則化 / モデリング / バイオインフォマティクス / マルコフ連鎖モンテカルロ法 / 相互排他 / タンパク質複合体 / タンパク質間相互作用 / ガウス分布のベイズ推定 |
Outline of Annual Research Achievements |
最終年度に実施した研究とその成果:正則化モデリングとは,べき乗則や L1 ノルムなどの正則化(罰則)項を評価関数に加えるモデリングであり,汎化誤差を小さく抑えた自然な解を見つけ出すための技法である.「混合」正則化モデリングとは,「複数」の正則化項を同時に用いる複雑な評価関数の設計を目指すモデリングである.本研究の目的は,バイオインフォマティクス分野の重要な予測・推論問題に対して,混合正則化モデリングにより評価関数を定式化し,これをマルコフ連鎖モンテカルロ法に基づくサンプリング・アルゴリズムで最適化する手法を追求することである. 最終年度は,取り組む具体的課題の1つである「タンパク質複合体予測問題」の挑戦的課題である「個々のタンパク質複合体同士が共通のタンパク質を共有することを」制御する正則化項のモデル化に取り組んだ.具体的にそのような正則化項を提案し,さらにその正則化項を含む評価関数を最適化するアルゴリズムをマルコフ連鎖モンテカルロ法に基づき開発した.その提案手法は,実施した計算機実験において,既存手法よりも優れた予測率することを報告している. 研究期間全体を通じて実施した研究とその成果:正則化モデリングとマルコフ連鎖モンテカルロ法に基づく最適化を軸に,タンパク質複合体予測問題とガウス分布のベイズ推定問題に対して成果を得ることが出来た.とくに,タンパク質複合体予測問題に関しては,最終年度の成果に加えて,「相互に排他的なタンパク質間相互作用に基づく正則化項の有効性の検証」や「最小サイズ(2と3)のタンパク質複合体の教師付き学習の手法の開発」など様々な角度から研究を展開することができた.
|