• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2023 年度 実施状況報告書

機械学習による遺伝子、タンパク質、化合物の自動設計

研究課題

研究課題/領域番号 22K19834
研究機関九州大学

研究代表者

西郷 浩人  九州大学, システム情報科学研究院, 准教授 (90586124)

研究期間 (年度) 2022-06-30 – 2025-03-31
キーワード機械学習 / 実験計画 / 勾配降下法 / タンパク質 / 化合物 / ガウス過程 / 物性予測
研究実績の概要

科学の基本的なプロセスは仮説を立てて実験を行い、それを検証することの繰り返しである。自然科学における重要な発見はこの一連のプロセスによって支えられてきた。
このシステムを模倣して本研究課題が目指すのは機械学習を用いた実験計画の自動化である。特に、タンパク質・化合物の設計に取り組む。難しさの情報学的原因は、タンパク質・化合物の大きさに対して、探索空間のサイズが指数関数的に増加してしまうことにある。そこで本提案課題では、タンパク質や化合物の類似度の指標に滑らかな近似を導入することで局所解の効率的な探索を実現する。予測モデルとしてガウス過程と組み合わせることにより、次に実験を行うべき条件の決定を逐次的かつ効率的に行うことが可能である。
2022年度までの調査によって上記を実現するための効率的なアルゴリズムの設計と実際のデータセット(シトクローム熱安定性予測、チャンネルロドプシン局在化予測、バクテリア泥プシン吸光度予測、エポキシヒドラーゼエナンチオ選択性予測)における評価を行い、良好な結果を得た。
しかしながら、提案手法を大きなデータセットに適用しようとすると通常のワークステーションでは時間がかかりすぎるのが課題であったため、本年度は以下の点を検討した。
1)勾配計算の安定化: 勾配の行列が半正定値性を満たさなくなるケースが確認されたため、経験的な対策方法を数種類実装した。2)実装の効率化: Pythonによる実装をC++で実装することにより、数倍の高速化を確認した。3)大規模な評価方法の検討: 評価(テスト時)に大量のデータを扱う手法について検討した。

現在までの達成度 (区分)
現在までの達成度 (区分)

3: やや遅れている

理由

手法の効率的な実装に想定以上の時間を要した。

今後の研究の推進方策

現在評価中のものを含めていくつかのデータセットで提案手法を評価した後に国際会議に投稿予定である。

次年度使用額が生じた理由

未使用額は158円であり、ほぼ残額はない。次年度に消耗品費として計上する予定である。

  • 研究成果

    (3件)

すべて 2024 その他

すべて 国際共同研究 (1件) 学会発表 (2件) (うち国際学会 2件)

  • [国際共同研究] Michigan Technological University(米国)

    • 国名
      米国
    • 外国機関名
      Michigan Technological University
  • [学会発表] A Branch-and-Bound Approach to Efficient Classification and Retrieval of Documents.2024

    • 著者名/発表者名
      Kotaro Ii, Hiroto Saigo, Yasuo Tabei
    • 学会等名
      International Conference on Pattern Recognition Applications and Methods
    • 国際学会
  • [学会発表] Benchmarking a Wide Range of Unsupervised Learning Methods for Detecting Anomaly in Blast Furnace.2024

    • 著者名/発表者名
      Kendai Itakura, Dukka Bahadur, Hiroto Saigo
    • 学会等名
      International Conference on Pattern Recognition Applications and Methods
    • 国際学会

URL: 

公開日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi