• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2013 年度 実績報告書

オミックスデータから薬物の標的分子を網羅的に予測するための機械学習法の開発

研究課題

研究課題/領域番号 25700029
研究種目

若手研究(A)

研究機関九州大学

研究代表者

山西 芳裕  九州大学, 高等研究院, 准教授 (60437267)

研究期間 (年度) 2013-04-01 – 2016-03-31
キーワード機械学習 / インシリコ創薬 / 標的分子 / 相互作用予測 / 薬物
研究概要

薬物・標的タンパク質間相互作用の同定は、医薬品開発において最重要課題である。ポストゲノム研究では、ゲノム、トランスクリプトーム、プロテオームなどの遺伝子やタンパク質に関する大量のオミックスデータが得られるようになってきた。同時に、膨大な数の化合物や薬物に関するケミカル情報や生理活性情報も蓄積されている。本研究プロジェクトでは、そのような薬物やタンパク質に関する膨大なオミックスデータを融合解析し、未知の薬物・標的タンパク質間相互作用を予測するための機械学習の手法を開発することを目的としている。
初年度である平成25年度は、薬物やタンパク質に関する様々なデータを収集し、薬物・タンパク質ペアの特徴を表現する手法の開発を行った。薬物の化学部分構造、副作用、タンパク質の機能ドメインなどの様々なデータを記述子で表し、それを組み合わせることで薬物・タンパク質ペアの特徴をフィンガープリント(高次元のバイナリ特徴ベクトル)で表現する方法を提案した。次に、薬物・タンパク質間相互作用ペアを解析する手法を開発した。機械学習の分野で有望視されている分類器を適用し、各薬物・タンパク質ペアを相互作用の可能性を予測した。同時に、相互作用に関連があるとモデルから推測される薬物の化学部分構造、副作用、機能ドメインなどの特徴を抽出し、生物学的な考察を行った。またクロスバリデーション実験によってその有用性を確認した。提案手法と解析結果について、国際学術雑誌(BMC Systems Biology誌やMolecular Informatics誌など)への論文発表を4件行った。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

初年度である平成25年度は、まず薬物関連データの収集を行った。薬物の化学構造、標的分子やオフターゲットの情報、薬物の副作用データ、タンパク質の機能ドメイン情報は、様々な公共データベース(KEGG, DrugBank, Matador, ChEMBLなど)から得た。当初の計画通りに、データの準備をすることができた。
それらのデータに基づき、薬物やタンパク質の記述子、薬物・タンパク質ペアを表すフィンガープリントを開発した。薬物の記述子とタンパク質の記述子を別々に構築し、それをテンソル積で繋ぎ合わせることによって、各薬物・タンパク質ペアをフィンガープリント(高次元のバイナリ特徴ベクトル)で表した。またフィンガープリントにminwise hashingというアルゴリズムを適用することで、情報をなるべく落とさずに低次元のフィンガープリントに変換する方法を開発した。当初の計画通りに、フィンガープリントの構築をすることができた。
次に、薬物・タンパク質間相互作用ペアを解析する手法を開発した。機械学習の分野で有望視されているスパースモデルに基づく分類器(L1罰則化に基づくロジスティック回帰など)を適用し、各薬物・タンパク質ペアを相互作用を解析および予測した。同時に、相互作用に関連があると推測される薬物の化学部分構造、副作用、機能ドメインなどの特徴を抽出し、生物学的な考察を行った。当初の計画通りに、小規模データに対しては解析をすることができた。
初年度の成果について、国際学術雑誌への論文発表を4件、国際学会での発表を3件、国内学会での発表を6件行った。そのため、本研究プロジェクトは、おおむね順調に進展していると考えることができる。

今後の研究の推進方策

初年度に行った研究の知見をもとに、提案手法の理論やアルゴリズムを更に発展させる。初年度で提案した方法は、膨大なメモリと計算時間を必要とするため、限られた数の薬物やタンパク質のペアにしか適用できず、記述子として表現できるデータの種類も少なかった。そこで今後は、大規模な適用を可能にする手法の理論構築と効率的なアルゴリズムの開発を行う。データマイニングの分野で有効性が確認されているデータ簡素構造表現のアイデアを提案手法に導入することを試みる。専門知識を持つ研究協力者と定期的に研究打ち合わせを行い、実装における問題点をできるだけ早期に発見し、研究プロジェクトの円滑な進行を促す。
薬物やタンパク質に関する他のデータ(薬理作用情報やパスウェイ情報など)を追加し、薬物やタンパク質のデータ数を増やして解析を行う。提案手法を公共データベースに登録されている全ての薬物(または候補化合物)とヒトの全てのタンパク質に適用する。相互作用パターンを表す特徴の網羅的な抽出と、未知の薬物・タンパク質間相互作用の大規模な予測を行う。最終的に開発した手法を適用した結果、抽出した特徴や予測された薬物・タンパク質間相互作用に対して妥当性の検証を行う。研究を効率良く遂行するため、専門知識を持つ研究協力者と定期的に研究打ち合わせを行い、生物学的な解析が円滑な進行するように務める。
国内外の最新の関連研究動向の情報収集を積極的に行い、論文発表や情報発信を適切な時期に有効に行えるように最新の注意を払う。提案手法のアルゴリズムや生物学的な解析結果を論文発表や学会発表し、ウェブ上で公開する。また製薬企業と積極的に議論し、医療や創薬への応用を検討する。開発した手法のソフトウェアを作成し、ウェブ上で計算を実行できる計算サーバを構築する。

次年度の研究費の使用計画

本研究プロジェクトのために最新の高性能計算機を発売予定日の前から予約していたが、販売メーカー側の都合で発売日が当初の予定よりも大幅に遅れたため、年度内に購入することができなくなった。また雇用する予定だった研究員の応募が期待通りに集まらず、雇用者の決定が遅れたため次年度使用額が生じた。
本年度は採用する研究員が既に決まっているため、その人件費に4月初めから使用する予定である。初年度からの研究活動が実り順調に研究成果が出てきており、本年度はその成果を適切なタイミングで発表していくため、国際学会や国内学会への参加費用、論文出版費用に適時使用していく予定である。また計算リソース強化やデータベース作成のための計算機やストレージの購入に、適時使用していく予定である。

  • 研究成果

    (14件)

すべて 2014 2013

すべて 雑誌論文 (4件) (うち査読あり 4件) 学会発表 (10件) (うち招待講演 7件)

  • [雑誌論文] KCF-S: KEGG Chemical Function and Substructure for improved interpretability and prediction in chemical bioinformatics2013

    • 著者名/発表者名
      Kotera, M., Tabei, Y., Yamanishi, Y., Moriya, Y., Tokimatsu, T., Kanehisa, M., and Goto, S.
    • 雑誌名

      BMC Systems Biology

      巻: 7(Suppl 6) ページ: S2

    • DOI

      doi:10.1186/1752-0509-7-S6-S2

    • 査読あり
  • [雑誌論文] Scalable prediction of compound-protein interactions using minwise hashing2013

    • 著者名/発表者名
      Tabei, Y. and Yamanishi, Y.
    • 雑誌名

      BMC Systems Biology

      巻: 7(Suppl 6) ページ: S3

    • DOI

      doi:10.1186/1752-0509-7-S6-S3

    • 査読あり
  • [雑誌論文] Inferring protein domains associated with drug side effects based on drug-target interaction network2013

    • 著者名/発表者名
      Iwata, H., Mizutani, S., Tabei, Y., Kotera, M., Goto, S., and Yamanishi, Y.
    • 雑誌名

      BMC Systems Biology

      巻: 7(Suppl 6) ページ: S18

    • DOI

      doi:10.1186/1752-0509-7-S6-S18

    • 査読あり
  • [雑誌論文] Inferring chemogenomic features from drug-target interaction networks2013

    • 著者名/発表者名
      Yamanishi, Y.
    • 雑誌名

      Molecular Informatics

      巻: 32 ページ: 991,999

    • DOI

      DOI: 10.1002/minf.201300079

    • 査読あり
  • [学会発表] ドラッグ・リポジショニングのためのイン・シリコ手法2014

    • 著者名/発表者名
      山西芳裕
    • 学会等名
      千里ライフサイエンス振興財団専門実務セミナー
    • 発表場所
      大阪
    • 年月日
      20140320-20140320
    • 招待講演
  • [学会発表] 薬物の潜在標的分子と新規効能のインシリコ予測2014

    • 著者名/発表者名
      山西芳裕
    • 学会等名
      共進化社会システム創成拠点フォーラム
    • 発表場所
      東京
    • 年月日
      20140312-20140313
    • 招待講演
  • [学会発表] Predicting drug-target interaction networks from the integration of chemical, genomic, and pharmacological spaces2014

    • 著者名/発表者名
      Yamanishi, Y.
    • 学会等名
      International Symposium on Tumor Biology in Kanazawa & Academic Drug Discovery Symposium
    • 発表場所
      Kanazawa, Japan
    • 年月日
      20140123-20140124
    • 招待講演
  • [学会発表] KCF-S: KEGG Chemical Function and Substructure for improved interpretability and prediction in chemical bioinformatics2013

    • 著者名/発表者名
      Kotera, M., Tabei, Y., Yamanishi, Y., Moriya, Y., Tokimatsu, T., Kanehisa, M., and Goto, S.
    • 学会等名
      The 24th International Conference on Genome Informatics (GIW2013)
    • 発表場所
      Singapore, Singapore
    • 年月日
      20131216-20131218
  • [学会発表] Scalable prediction of compound-protein interactions using minwise hashing2013

    • 著者名/発表者名
      Tabei, Y. and Yamanishi, Y.
    • 学会等名
      The 24th International Conference on Genome Informatics (GIW2013)
    • 発表場所
      Singapore, Singapore
    • 年月日
      20131216-20131218
  • [学会発表] Inferring protein domains associated with drug side effects based on drug-target interaction network2013

    • 著者名/発表者名
      Iwata, H., Mizutani, S., Tabei, Y., Kotera, M., Goto, S., and Yamanishi, Y.
    • 学会等名
      The 24th International Conference on Genome Informatics (GIW2013)
    • 発表場所
      Singapore, Singapore
    • 年月日
      20131216-20131218
  • [学会発表] 機械学習による薬物の標的分子や副作用の網羅的予測2013

    • 著者名/発表者名
      山西芳裕
    • 学会等名
      第41回構造活性相関シンポジウム
    • 発表場所
      西宮
    • 年月日
      20131107-20131108
    • 招待講演
  • [学会発表] ケモゲノミクスや薬理ゲノミクスの手法による薬物・標的タンパク質間相互作用ネットワークの予測2013

    • 著者名/発表者名
      山西芳裕
    • 学会等名
      第2回生命システム理論研究会
    • 発表場所
      東京
    • 年月日
      20130913-20130913
    • 招待講演
  • [学会発表] ゲノム情報、ケミカル情報、薬理情報から薬物標的分子を予測する統計手法2013

    • 著者名/発表者名
      山西芳裕
    • 学会等名
      2013年度統計関連学会連合大会
    • 発表場所
      大阪
    • 年月日
      20130908-20130911
    • 招待講演
  • [学会発表] オミックスデータから薬物標的分子を網羅的に予測するためのバイオインフォマティクス2013

    • 著者名/発表者名
      山西芳裕
    • 学会等名
      第3回NGS現場の会
    • 発表場所
      神戸
    • 年月日
      20130904-20130905
    • 招待講演

URL: 

公開日: 2015-05-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi