研究課題/領域番号 |
15J11261
|
研究機関 | 東京工業大学 |
研究代表者 |
伴 兼弘 東京工業大学, 大学院情報理工学研究科, 特別研究員(DC1)
|
研究期間 (年度) |
2015-04-24 – 2018-03-31
|
キーワード | 薬剤 / タンパク質 / 創薬研究 / ネットワーク推定 / ドッキングシミュレーション / 機械学習 / 情報幾何 |
研究実績の概要 |
薬剤は、生体内における特定のタンパク質と相互作用することにより、タンパク質の持つ働きを調整し疾病に作用する。しかし、薬剤が予期せぬタンパク質と相互作用してしまうと、副作用を引き起こす可能性が知られている。そこで、本研究では、タンパク質の立体構造及び既知の化合物-タンパク質間相互作用という2つの生化学情報を用いて、薬剤と相互作用するタンパク質を網羅的に予測する計算手法の開発を行っている。これにより、新薬開発において薬剤と相互作用する可能性のあるタンパク質を想定した合理的な研究開発を行うことができるようになると考える。 本年度(平成27年度)の前期は、化合物とタンパク質の立体構造から結合状態を推定するドッキングシミュレーションを用いた薬剤オフターゲット予測システムの開発、及びドッキングスコアを辺の重みとする化合物-タンパク質間相互作用ネットワークの構築を達成目標として計画し、タンパク質の表面全域に対し効率良くドッキングする手法を開発した。本成果は査読付国際論文誌への投稿準備中である。また、開発した手法を用いてドッキングスコアを辺の重みとする化合物-タンパク質間相互作用ネットワークの構築を行い、当初の目標を達成した。 また本年度の後期は、既知の化合物-タンパク質間相互作用を学習データとして、未知の相互作用を予測する機械学習による予測手法の開発に着手すること、そしてデータセットの取得及び実験系を構築することを達成目標として計画した。データセットの取得及び実験系の構築を達成するとともに、情報幾何に基づくKLD-WGという新規手法を実装し、その性能評価を行った。これらに関しては、研究実施計画以上の進展があったと言える。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本年度(平成27年度)の研究実施計画では、ドッキングシミュレーションによる薬剤オフターゲット予測システムの開発及び、機械学習による薬剤オフターゲット予測システムの開発を別々で行うことを予定していた。特に、ドッキングシミュレーションでは、ドッキングスコアを要素とする隣接行列の構築することを目標とし、機械学習では、データセットの構築を目標としていた。 ドッキングシミュレーションによる薬剤オフターゲット予測システムの開発に関しては、まず研究計画時に開発していた提案手法の有効性を示すために、既存のデータセットを用いた評価実験を行う必要があった。そこで、ドッキング用ベンチマークデータセットAstex Diverse Dataset(Hartshorn et al., 2007)を用いた評価系を構築した。その後、評価実験を実施すると同時に、提案手法を改善したドッキング手法Multiple Grid Arrangement(論文投稿予定)を提案した。一方で、ドッキングスコアを要素とする隣接行列の構築は、それらの過程で達成した。 機械学習による薬剤オフターゲット予測システムの開発に関しては、データセットの構築を目標としていたが、まずは既存のベンチマークデータセットYamanishi’s Dataset(Yamanishi et al., 2008)で評価することにした。これにより、計画よりも早く相互作用ネットワークのリンク予測問題及び外挿問題に対する機械学習ベースの手法の開発に着手し、情報幾何に基づくKLD-WGという新規手法を実装し、その性能評価を行った。
|
今後の研究の推進方策 |
平成28年度は、前年度の機械学習による薬剤オフターゲット予測システムの開発の続きを行う。研究実施計画では、化合物-タンパク質間相互作用ネットワークにおけるリンク予測問題と外挿問題に対する予測手法の開発を行うことを予定していた。特に、予測手法に関しては、グラフのトポロジーを考慮したカーネルを用いることにより、薬剤がタンパク質に相互作用する可能性を定量化する判別機の開発を考えている。そこで、グラフの情報を用いたカーネル法の改良、ならびに確率モデルを用いた新規手法の開発という2つの方向性で研究を進めていくことを試みる。 研究を進めていくにあたり、グラフの情報を用いたカーネル法の改良という方向性では、平成27年度の時点で情報幾何に基づく新規手法の開発に着手した。開発を行っている手法は、グラフの情報を扱うとき、新規化合物あるいは新規タンパク質はグラフの情報が定義できないため、その情報を補完することにより予測精度を向上させるという方策に基づいて開発・検討を行っている。一方、確率モデルを用いた新規手法の開発に関しては、現在最も予測精度が良いとされるリコメンデーションシステムの技術を応用したNRLMFという予測手法を参考に新規手法の開発を考えている。アイデアとしては、従来の手法では相互作用が未知のペアを負例として扱っているが、それらを欠損データとして扱い、情報幾何におけるemアルゴリズムでより適切なモデルを求めることを考えている。
|