Study on machine learning approaches for heterogeneous biological data based on mixing regularization models
Project/Area Number |
17K00407
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Research Field |
Life / Health / Medical informatics
|
Research Institution | Kyushu University |
Principal Investigator |
Maruyama Osamu 九州大学, 芸術工学研究院, 准教授 (20282519)
|
Project Period (FY) |
2017-04-01 – 2021-03-31
|
Project Status |
Completed (Fiscal Year 2020)
|
Budget Amount *help |
¥4,420,000 (Direct Cost: ¥3,400,000、Indirect Cost: ¥1,020,000)
Fiscal Year 2019: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2018: ¥1,820,000 (Direct Cost: ¥1,400,000、Indirect Cost: ¥420,000)
Fiscal Year 2017: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
|
Keywords | モチーフ / ギブス・サンプリング / 結合部位 / E3ユビキチン / タンパク質disorder / 混合正則化 / バイオインフォマティクス / デグロン / 崩壊型ギブス・サンプリング / E3ユビキチン・ライゲース / 依存関係モデル / E3ユビキチン・ライゲース / たんぱく質disorder / モデリング / 機械学習 / マルコフ連鎖モンテカルロ法 / タンパク質複合体 / タンパク質間相互作用ネットワーク / ボルツマン分布 / ヘテロ生物データ |
Outline of Final Research Achievements |
For the problem of protein complex prediction and that of E3 ubiquitin ligase binding site prediction, I got successful results to some extent, by modeling target data, designing evaluation functions, and constructing optimization algorithms based on the Gibbs sampling algorithm. Particularly, for the problem of E3 ubiquitin ligase binding site prediction, I designed complicated likelihood functions, the multiple prior distributions based on biological knowledge, and collapsed Gibbs sampling algorithm for the posterior probability distribution derived from the likelihood functions and the prior probability distributions. I showed that the proposed method is superior to existing methods in prediction accuracy on our target datasets.
|
Academic Significance and Societal Importance of the Research Achievements |
本研究では,データ・ドリブンな研究手法として,データに基づくモデリングを行い評価関数を設計するスキームを確立することが出来た.とくに,事後確率によるモデリングの柔軟性の高さとギブス・サンプリングをベースとした最適化の汎用性の組み合わせの利点を示すことが出来た.また,取り組んだ生物学的個別課題「E3ユビキチン・ライゲース結合部位予測問題」に関しては,タンパク質配列上の結合部位の予測情報は新規薬剤の設計などに応用できる可能性がある.
|
Report
(5 results)
Research Products
(10 results)