2014 Fiscal Year Research-status Report
大規模バイオデータに対する混合正則化モデリングと最適化サンプリング技法の研究
Project/Area Number |
26330330
|
Research Institution | Kyushu University |
Principal Investigator |
丸山 修 九州大学, マス・フォア・インダストリ研究所, 准教授 (20282519)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 正則化 / モデリング / 混合正則化 / サンプリング / マルコフ連鎖モンテカルロ / タンパク質複合体 / 遺伝子発現ネットワーク / ガウシアン・グラフィカル・モデル |
Outline of Annual Research Achievements |
正則化モデリングとは,べき乗則やL1ノルムなどの正則化(罰則)項を評価関数に加えるモデリングであり,汎化誤差を小さく抑えた自然な解を見つけ出すための技法である.「混合」正則化モデリングとは,「複数」の正則化項を用いた複雑な評価関数の設計を目指すモデリングである.本研究では,具体的な題材としてバイオインフォマティクス分野の3つの重要な予測・推論問題に対して,混合正則化モデリングにより評価関数を定式化し,これをマルコフ連鎖モンテカルロ法に基づくサンプリング・アルゴリズムで最適化する手法を追求している.具体的に取り組む3つの問題とは次である:(1) タンパク質複合体予測問題,(2) 遺伝子発現データからの遺伝子ネットワークの推定,(3) 一塩基多型によるゲノムワイド関連解析. 「タンパク質複合体予測問題」に対しては,申請者が開発してきた手法の探索アルゴリズムを改良することにより予測精度の向上に成功している.さらに,「遺伝子発現データからの遺伝子ネットワークの推定」に関しては,2年目から本格的に取り組む予定であったが,予想以上に研究が進展した.その結果,少ないサンプルからのGaussian グラフィカル・モデリングの推定問題において,モデル・パラメータである共分散の構造のスケール・フリー性を捉える新しい 正則化項を定式化し,対応するサンプリング最適化アルゴリズムを開発した.そして,その性能評価では,既存手法よりも高い予測精度を示している.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究実績の概要に述べたとおり,順調に研究が展開できている.
|
Strategy for Future Research Activity |
当初の計画を大きく変更する必要はないと考えており,それぞれの研究項目について着実に前進することを目指す.
|
Causes of Carryover |
想定以上の研究成果が得られたため,成果発表のための旅費等が余計に必要となった.また,想定していた程には計算機等の物品が必要でなかったため,その費用を旅費にまわすこととなった.
|
Expenditure Plan for Carryover Budget |
初年度と同様に研究が進展すれば,余計に旅費が必要になると想定されるので,繰越金は旅費として使用する予定である.
|