2015 Fiscal Year Research-status Report
大規模バイオデータに対する混合正則化モデリングと最適化サンプリング技法の研究
Project/Area Number |
26330330
|
Research Institution | Kyushu University |
Principal Investigator |
丸山 修 九州大学, マス・フォア・インダストリ研究所, 准教授 (20282519)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 混合正則化 / モデリング / バイオインフォマティクス / マルコフ連鎖モンテカルロ法 / 相互排他 / タンパク質複合体 / タンパク質間相互作用 |
Outline of Annual Research Achievements |
正則化モデリングとは,べき乗則や L1 ノルムなどの正則化(罰則)項を評価関数に加えるモデリングであり,汎化誤差を小さく抑えた自然な解を見つけ出すための技法である.「混合」正則化モデリングとは,「複数」の正則化項を用いた複雑な評価関数の設計を目指すモデリングである.本研究の目的は,バイオインフォマティクス分野の重要な予測・推論問題に対して,混合正則化モデリングにより評価関数を定式化し,これをマルコフ連鎖モンテカルロ法に基づくサンプリング・アルゴリズムで最適化する手法を追求することである.
本年度は,取り組む課題として挙げていた「タンパク質複合体予測問題」に対して進展を得ることができた.タンパク質複合体予測問題とは,タンパク質間相互作用ネットワークからタンパク質複合体を予測する問題である.具体的には,相互に排他的なタンパク質間相互作用(mutually exclusive protein-protein interaction)情報が公表されているので,この情報に基づく正則化項を定式化し,その有効性を検証した.具体的には,当方の研究グループで鋭意開発中のタンパク質複合体予測システム PPSampler2 (Proteins' partition sampler)の評価関数にこの新しい正則化項を追加したシステムを PPSampler2-PIME (pair of interactions which are mutually exclusive)とし,その精度評価を行い,その有効性を明らかにした.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
相互に排他的なタンパク質間相互作用情報がタンパク質複合体予測に確実に貢献することを示せたことは成果であり,またその正則化モデリングを具体的に示したことは意義深い.しかしながら,本研究課題で取り組むべき具体的問題として挙げていた「遺伝子発現データからの遺伝子ネットワークの推定」に関しては,学術雑誌に投稿したが不採択となった.
|
Strategy for Future Research Activity |
「遺伝子発現データからの遺伝子ネットワークの推定」に関しては,指摘された問題点をつぶさに検証し研究の質を高める.「タンパク質複合体予測問題」に関しては,より精緻なタンパク質複合体のモデリングを探索するための「混合」正則化モデリングを追求する.
|
Causes of Carryover |
所属する研究所の計算機資源を活用することが出来たため,当初予定していた計算機の購入の必要性がなくなった.
|
Expenditure Plan for Carryover Budget |
研究の進展具合によってはより高性能な計算機が必要となるのでその購入資金とする.さらに,国内外の出張が当初予定より多くなると思われるのでそのような旅費に使用する.
|