2016 Fiscal Year Annual Research Report
立体構造情報と相互作用情報を組み合わせた薬剤オフターゲット予測システムの開発
Project/Area Number |
15J11261
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
伴 兼弘 東京工業大学, 大学院情報理工学研究科, 特別研究員(DC1)
|
Project Period (FY) |
2015-04-24 – 2018-03-31
|
Keywords | 薬剤 / タンパク質 / 創薬研究 / ネットワーク推定 / ドッキングシミュレーション / 機械学習 / 人工知能 / 統計学 |
Outline of Annual Research Achievements |
薬剤が持つオフターゲットの同定は、創薬研究において副作用の少ない薬剤の設計や、既存薬の別疾患への適応拡大を可能にする。本研究では、タンパク質立体構造情報および相互作用情報から、計算機を用いた薬剤オフターゲット予測システムを開発することを目的とする。そこで、平成28年度は、下記に挙げる項目の実現を進めてきた。それぞれ、(1)カーネル法による予測手法の開発、(2)統計モデルによる予測手法の開発、である。 (1)カーネル法による予測手法の開発に関する研究成果 研究成果として、①emWNNGIP、②cmvWNNGIPという2つ予測手法を開発した。emWNNGIPは、WNN-GIP(Laarhoven et al., 2013)に対して、カルバック・ライブラー・ダイバージェンスを用いたカーネル補完を行う手法である。一方、cmvWNNGIPは、WNN-GIPに対してカーネル拡張(Belanche et al., 2014)を行う手法である。さらに、従来手法では計算量が指数時間であるのに対し、多項式時間で計算できるアルゴリズムも開発した。 (2)統計モデルによる予測手法の開発に関する研究成果 研究成果として、③EMLMF、④GBFRM、⑤MBFRMという3つの予測手法を開発した。EMLMFは、NRLMF(Liu et al., 2016)に対して、テストデータを欠損値として扱い、EMアルゴリズムを用いて予測する手法である。また、ベイズ最適化手法であるGP-MI(Contal et al., 2014)を用いることで、ハイパーパラメータ探索を効率化する改良も行った。GBFRMは、他分野の予測手法DLFRM(Chen et al., 2016)を本研究分野に応用した手法である。一方、MBFRMはGBFRMの計算時間を短縮するためにギブスサンプリングするところをMAP推定で置き換えた手法である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
平成28年度の研究実施計画では、前期にカーネル法による予測手法の開発を行い、後期に統計モデルによる予測手法の開発を行うことを予定していた。平成28年度は、おおむね順調に進展し、研究実施計画通りに進行した。 前期の進捗(平成28年4月1日~平成28年9月30日) 前期は、カーネル法を用いた手法を2つ開発した。それぞれ、①emWNNGIP、②cmvWNNGIPである。emWNNGIPに関しては、評価実験を行いながら、既存手法と比べて有意に改善するような方法を模索している状況である。一方、cmvWNNGIPに関しては、カーネルの正定値性を保証するため、新たな方法を模索している状況である。 後期の進捗(平成28年10月1日~平成29年3月31日) 後期は、統計モデルを用いた手法を3つ開発した。それぞれ、③EMLMF、④GBFRM、⑤MBFRMである。EMLMFに関しては、評価実験を行いながら、既存手法と比べて有意に改善するような方法を模索している状況である。また、ハイパーパラメータ探索の効率化のため、ベイズ最適化手法であるGPMI(Contal et al., 2014)を適用し、学習効率の改善を試みた。GBFRMとMBFRMに関しては、現在研究を進めている段階である。
|
Strategy for Future Research Activity |
平成29年度は、薬剤オフターゲット予測システムを開発するために、下記に挙げる2つの項目に分けて実現を図る。それぞれ、①予測手法の開発、②予測手法の拡張である。 ①予測手法の開発(平成29年4月1日~平成29年9月30日) 前期は、統計モデリングに基づいた予測手法の開発を行うことを予定している。研究目標であるNRLMF(Liu et al., 2016)の予測精度を上回る手法を開発することで、従来手法では発見されなかった未知の活性を予測できるようになると考えている。具体的な方策として、NRLMFの特徴抽出のメカニズムを同定し、予測がうまくできなかったものに関して分析を行う。そして、その分析結果に基づいて改善策を提案し実装する。これにより、予測精度の有意な向上を目指す。 ②予測手法の拡張(平成29年10月1日~平成30年3月31日) 後期は、分子構造情報および活性情報の他にドッキングスコアやタンパク質立体構造情報を組み込んだ予測手法の開発を行う。これにより、従来の問題設定では見つけられなかった新しい活性を予測できるようになると考えている。具体的な方策として、タンパク質立体構造情報やドッキングスコアの結果を含めた特徴量を設計することで、新しい情報を学習アルゴリズムに組み込む手法を検討している。また、本研究の最終的なまとめとして、主に論文投稿や学会発表を行い、多くの研究者が本研究で得られた研究成果を利用できるよう情報公開にも努める。
|