研究課題/領域番号 |
25700029
|
研究機関 | 九州大学 |
研究代表者 |
山西 芳裕 九州大学, 高等研究院, 准教授 (60437267)
|
研究期間 (年度) |
2013-04-01 – 2016-03-31
|
キーワード | 機械学習 / インシリコ創薬 / 標的分子 / 相互作用予測 / 薬物 |
研究実績の概要 |
薬物・標的タンパク質間相互作用の同定は、医薬品開発において最重要課題である。ポストゲノム研究では、ゲノム、トランスクリプトーム、プロテオームなどの遺伝子やタンパク質に関する大量のオミックスデータが得られるようになってきた。同時に、膨大な数の化合物や薬物に関するケミカル情報や生理活性情報も蓄積されている。本研究プロジェクトでは、そのような薬物やタンパク質に関する膨大なオミックスデータを融合解析し、未知の薬物・標的タンパク質間相互作用を予測するための機械学習の手法を開発することを目的としている。 平成26年度は、薬物やタンパク質に関する様々なデータを追加的に収集し、薬物・タンパク質ペアの特徴を記述子として表現する手法の改良を行った。薬物の化学部分構造、薬理作用、タンパク質の機能ドメイン、パスウェイなどの様々なデータを組み合わせて、薬物・タンパク質ペアの特徴を高次元の連続値ベクトルで表す記述子を構築し、昨年度に検討したフィンガープリントとの性能比較を行った。次に、薬物・タンパク質間相互作用ペアを解析する手法を開発した。教師付き学習に基づく機械学習の分類モデルを適用し、薬物・タンパク質ペアの相互作用を予測した。同時に、相互作用に関連があるとモデルから推測される薬物の化学部分構造、薬理作用、機能ドメイン、パスウェイに対して生物学的な考察を行った。その解析結果を検索するウェブアプリケーションを開発した。これまでの成果について、平成26年度は国際学術雑誌への論文発表を2件、国際学会での口頭発表を2件、国際学会でのポスター発表を2件、国内学会での口頭発表を6件行った。本研究プロジェクトは、おおむね順調に進展していると考えることができる。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
平成26年度は、薬物やタンパク質に関連する様々なデータの収集を引き続き行い、データの更なる拡充を行った。それらのデータに基づき、薬物やタンパク質の特徴を表す記述子の改良を行った。薬物の化学構造を表現するために、官能基や原子の環境情報を考慮できるKCF-Sという記述子を用いた。薬物の薬理作用情報を表現するため、FDA AERSに登録されている約1万種類の副作用の報告頻度で薬理作用プロファイルを表現した。タンパク質に関しては、パスウェイ、連続アミノ酸の頻度や機能ドメインの頻度によるプロファイルを表現した。これらを組み合わせて薬物・タンパク質ペアの特徴を高次元の連続値ベクトルで表す記述子を構築し、昨年度に検討したフィンガープリントとの性能比較を行った。当初の計画通りに、薬物・タンパク質ペアの記述子の構築をすることができた。 次に、薬物とタンパク質の記述子を基に、ペアワイズなカーネル回帰やスパース分類器を適用し、薬物・タンパク質ペアの相互作用ネットワークを解析および予測した。クロスバリデーション実験で性能評価した結果、薬物の薬理作用プロファイルを記述子に用いることで、化学構造に依存せずに相互作用タンパク質を予測できることが確認できた。予測された薬物・タンパク質間相互作用ペアのリストを整備し、その解析結果を検索するウェブアプリケーションを開発した。当初の計画通りに、提案手法のアルゴリズムのプロトタイプを実装することができた。 これまでの成果について、平成26年度は国際学術雑誌への論文発表を2件、国際学会での口頭発表を2件、国際学会でのポスター発表を2件、国内学会での口頭発表を6件行った。本研究プロジェクトは、おおむね順調に進展していると考えることができる。
|
今後の研究の推進方策 |
これまでに行った研究の知見をもとに、提案手法の理論やアルゴリズムを更に発展させる。手法のパラメータを最適化して大規模データに適用可能なアルゴリズムを実装する。平成25年度、平成26年度で判明した問題点を修正し、アルゴリズム設計にフィードバックを与えて、提案手法の更なる改善に努める。例えば、各薬物・タンパク質ペアを高次元記述子で表す際のメモリーの大量消費問題に対処するため、提案手法にデータ圧縮の技術を導入することで、高次元記述子でも適用できるようにアルゴリズムを改良する。専門知識を持つ研究協力者と定期的に研究打ち合わせを行い、提案手法を早期に修正および改善できるように心がけ、研究プロジェクトの円滑な進行を促す。 日本や欧米で承認された全て薬物に対して提案手法を適用し、より大規模な薬物・標的タンパク質間相互作用ネットワークの予測や詳細な解析を行う。もし予測された標的タンパク質が別の疾患の創薬ターゲットであった場合、その薬物が本来開発された疾患とは別の疾患への効能が期待できるため、既存薬の適応拡大に対する可能性も検証する。提案手法によって抽出される分子の特徴(薬物の化学部分構造、薬効や副作用、タンパク質の機能モチーフ、パスウェイなど)の組み合わせに対して、薬理作用機序の観点から生物学的な考察を行う。最新の学術論文や臨床報告などの文献を調査し、未知の相互作用ペアを同定する。専門知識を持つ研究協力者と定期的に研究打ち合わせを行い、研究プロジェクトの円滑な進行を促す。 これらの研究成果を論文発表し、ウェブ上で公開する。国内外の最新の関連研究動向の情報収集を積極的に行い、論文発表や学会発表を適切な時期に有効に行えるように最新の注意を払う。製薬会社などの産業界への情報発信を積極的に行い、研究成果の社会への還元を目指す。
|
次年度使用額が生じた理由 |
本研究プロジェクトの解析結果を整備するためにためにデータベース構築を考えていたが、そのシステム構築が業者の都合で納期が遅れることが判明したため、年度内に購入することができなくなった。また参加を予定していた国内外の会議やシンポジウムに、日程が合わず参加できなかったため次年度使用額が生じた。
|
次年度使用額の使用計画 |
本年度は採用する研究員が既に決まっているため、その人件費に4月初めから使用する予定である。初年度からの研究活動が実り順調に研究成果が出てきており、本年度はその成果を適切なタイミングで発表していくため、国際学会や国内学会への参加費用、論文出版費用に適時使用していく予定である。また計算リソース強化やデータベース作成のためのストレージの購入に、適時使用していく予定である。
|