• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

機械学習による遺伝子、タンパク質、化合物の自動設計

研究課題

研究課題/領域番号 22K19834
研究種目

挑戦的研究(萌芽)

配分区分基金
審査区分 中区分62:応用情報学およびその関連分野
研究機関九州大学

研究代表者

西郷 浩人  九州大学, システム情報科学研究院, 准教授 (90586124)

研究期間 (年度) 2022-06-30 – 2025-03-31
研究課題ステータス 交付 (2023年度)
配分額 *注記
6,240千円 (直接経費: 4,800千円、間接経費: 1,440千円)
2024年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
2023年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
2022年度: 2,860千円 (直接経費: 2,200千円、間接経費: 660千円)
キーワード機械学習 / 実験計画 / 勾配降下法 / タンパク質 / 化合物 / ガウス過程 / 物性予測
研究開始時の研究の概要

科学の基本的なプロセスは仮説を立てて実験を行い、それを検証することの繰り返してである。近年は実験装置の機械化や測定装置の高精度化と高速化などにより、実験の質や量が急激に増える傾向にある。しかしながら、次にどのような実験を行うかを決定する実験計画は人間の勘に頼ったままである。そこで本研究課題が目指すのは機械学習を用いた実験計画の自動化である。
本提案課題では特に、タンパク質・化合物をターゲットとし、類似度の指標に滑らかな近似を導入することで局所解の効率的な探索を目指す。この結果として、次に実験を行うべきタンパク質や化合物を逐次的かつ効率的に行うことが可能となる。

研究実績の概要

科学の基本的なプロセスは仮説を立てて実験を行い、それを検証することの繰り返しである。自然科学における重要な発見はこの一連のプロセスによって支えられてきた。
このシステムを模倣して本研究課題が目指すのは機械学習を用いた実験計画の自動化である。特に、タンパク質・化合物の設計に取り組む。難しさの情報学的原因は、タンパク質・化合物の大きさに対して、探索空間のサイズが指数関数的に増加してしまうことにある。そこで本提案課題では、タンパク質や化合物の類似度の指標に滑らかな近似を導入することで局所解の効率的な探索を実現する。予測モデルとしてガウス過程と組み合わせることにより、次に実験を行うべき条件の決定を逐次的かつ効率的に行うことが可能である。
2022年度までの調査によって上記を実現するための効率的なアルゴリズムの設計と実際のデータセット(シトクローム熱安定性予測、チャンネルロドプシン局在化予測、バクテリア泥プシン吸光度予測、エポキシヒドラーゼエナンチオ選択性予測)における評価を行い、良好な結果を得た。
しかしながら、提案手法を大きなデータセットに適用しようとすると通常のワークステーションでは時間がかかりすぎるのが課題であったため、本年度は以下の点を検討した。
1)勾配計算の安定化: 勾配の行列が半正定値性を満たさなくなるケースが確認されたため、経験的な対策方法を数種類実装した。2)実装の効率化: Pythonによる実装をC++で実装することにより、数倍の高速化を確認した。3)大規模な評価方法の検討: 評価(テスト時)に大量のデータを扱う手法について検討した。

現在までの達成度 (区分)
現在までの達成度 (区分)

3: やや遅れている

理由

手法の効率的な実装に想定以上の時間を要した。

今後の研究の推進方策

現在評価中のものを含めていくつかのデータセットで提案手法を評価した後に国際会議に投稿予定である。

報告書

(2件)
  • 2023 実施状況報告書
  • 2022 実施状況報告書
  • 研究成果

    (5件)

すべて 2024 2023 その他

すべて 国際共同研究 (2件) 雑誌論文 (1件) (うち国際共著 1件、 査読あり 1件、 オープンアクセス 1件) 学会発表 (2件) (うち国際学会 2件)

  • [国際共同研究] Michigan Technological University(米国)

    • 関連する報告書
      2023 実施状況報告書
  • [国際共同研究] Michigan Technological University(米国)

    • 関連する報告書
      2022 実施状況報告書
  • [雑誌論文] pLMSNOSite: an ensemble-based approach for predicting protein S-nitrosylation sites by integrating supervised word embedding and embedding from pre-trained protein language model2023

    • 著者名/発表者名
      Pratyush, P., Pokharel, S., Saigo, H., KC.D.B.
    • 雑誌名

      BMC Bioinform.

      巻: 24(1) 号: 1

    • DOI

      10.1186/s12859-023-05164-9

    • 関連する報告書
      2022 実施状況報告書
    • 査読あり / オープンアクセス / 国際共著
  • [学会発表] A Branch-and-Bound Approach to Efficient Classification and Retrieval of Documents.2024

    • 著者名/発表者名
      Kotaro Ii, Hiroto Saigo, Yasuo Tabei
    • 学会等名
      International Conference on Pattern Recognition Applications and Methods
    • 関連する報告書
      2023 実施状況報告書
    • 国際学会
  • [学会発表] Benchmarking a Wide Range of Unsupervised Learning Methods for Detecting Anomaly in Blast Furnace.2024

    • 著者名/発表者名
      Kendai Itakura, Dukka Bahadur, Hiroto Saigo
    • 学会等名
      International Conference on Pattern Recognition Applications and Methods
    • 関連する報告書
      2023 実施状況報告書
    • 国際学会

URL: 

公開日: 2022-07-05   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi