• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2023 年度 実績報告書

タンパク質の機能改良のための「省データ」機械学習技術の開発

研究課題

研究課題/領域番号 22H03691
配分区分補助金
研究機関国立研究開発法人産業技術総合研究所

研究代表者

齋藤 裕  国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (60721496)

研究期間 (年度) 2022-04-01 – 2026-03-31
キーワードタンパク質工学 / 機械学習 / 分子シミュレーション / バイオインフォマティクス
研究実績の概要

本研究では、少数の教師データで変異効果予測を高精度に行うための「省データ」機械学習技術として、ゼロショット予測、データ拡張、弱教師あり学習の3つの手法を開発する。
今年度は、主に弱教師あり学習について手法開発を行った。分子シミュレーション手法であるRosettaやGROMACSによって計算される結合親和性や構造安定性などの機能計算値を機械学習の「弱い」教師データと考え、実験によって取得された教師データに追加することで、機械学習の予測精度の向上を試みた。公開されているリガンド結合タンパク質および酵素の活性データをベンチマークとして本手法の性能を評価した。その結果、本手法は実験データのみを用いる従来の機械学習に比べて高い予測精度を達成した。特に、利用できる実験データ量が100個以下と少数の場合には、弱教師データの追加によって顕著な精度向上が得られることがわかった。また、単変異体の弱教師データを利用することで、2重変異体の予測精度を向上できるなど、タンパク質工学への応用面でも重要な結果が得られた。以上の結果について学会発表を行った。
手法開発と並行して、実験系研究者との共同研究による手法の応用展開も進めている。今年度は酵素FMOの機能改変に関して論文発表を行った。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

ゼロショット予測、データ拡張、弱教師あり学習いずれについても予定通り進行している。ゼロショット予測については、昨年度に論文発表を行った。データ拡張、弱教師あり学習についても今年度に学会発表を行っており、来年度以降、論文化に向けて取りまとめる予定である。

今後の研究の推進方策

データ拡張、弱教師あり学習の手法開発を継続して進め、結果を取りまとめて論文化を目指す。また、実験系研究者との共同研究による手法の応用展開も継続して進める。

  • 研究成果

    (22件)

すべて 2024 2023

すべて 雑誌論文 (4件) (うち査読あり 4件、 オープンアクセス 4件) 学会発表 (18件) (うち国際学会 1件、 招待講演 3件)

  • [雑誌論文] Extensive antibody search with whole spectrum black-box optimization2024

    • 著者名/発表者名
      Tucs Andrejs、Ito Tomoyuki、Kurumida Yoichi、Kawada Sakiya、Nakazawa Hikaru、Saito Yutaka、Umetsu Mitsuo、Tsuda Koji
    • 雑誌名

      Scientific Reports

      巻: 14 ページ: 552

    • DOI

      10.1038/s41598-023-51095-z

    • 査読あり / オープンアクセス
  • [雑誌論文] VeloPro: A pipeline integrating Ribo‐seq and AlphaFold deciphers association patterns between translation velocity and protein structure features2023

    • 著者名/発表者名
      Bian Bian、Kumagai Toshitaka、Saito Yutaka
    • 雑誌名

      iMeta

      巻: 2 ページ: e148

    • DOI

      10.1002/imt2.148

    • 査読あり / オープンアクセス
  • [雑誌論文] A Multiomics Atlas of Brown Adipose Tissue Development Over Time2023

    • 著者名/発表者名
      Kumagai Yutaro、Saito Yutaka、Kida Yasuyuki S
    • 雑誌名

      Endocrinology

      巻: 164 ページ: bqad064

    • DOI

      10.1210/endocr/bqad064

    • 査読あり / オープンアクセス
  • [雑誌論文] タンパク質の言語モデル2023

    • 著者名/発表者名
      山口 秀輝、齋藤 裕
    • 雑誌名

      JSBi Bioinformatics Review

      巻: 4 ページ: 52~67

    • DOI

      10.11234/jsbibr.2023.1

    • 査読あり / オープンアクセス
  • [学会発表] 生体分子設計のインフォマティクス2023

    • 著者名/発表者名
      齋藤 裕
    • 学会等名
      CBI学会 2023年大会
    • 招待講演
  • [学会発表] 機械学習によるタンパク質の機能予測と設計2023

    • 著者名/発表者名
      齋藤 裕
    • 学会等名
      公益社団法人新化学技術推進協会ライフサイエンス技術部会反応分科会 技術セミナー「タンパク質の予測・設計を学ぶ」
    • 招待講演
  • [学会発表] タンパク質工学における機械学習の利用2023

    • 著者名/発表者名
      齋藤 裕
    • 学会等名
      大阪大学インタラクティブ物質科学・カデットプログラム 第9回 インタラクティブ交流会
    • 招待講演
  • [学会発表] ranslation velocity harmonization: an innovative approach towards mRNA design through the integration of ribosome profiling and deep learning2023

    • 著者名/発表者名
      Bian Bian, Jichen Zhang, Yutaka Saito
    • 学会等名
      The 22nd International Conference on Bioinformatics (InCoB 2023)
    • 国際学会
  • [学会発表] Protein-compound interaction prediction using microbial chemical communication network2023

    • 著者名/発表者名
      Hongyi Shen, Yutaka Saito
    • 学会等名
      情報処理学会 第76回 BIO合同研究発表会
  • [学会発表] 機械学習でタンパク質の変異効果を予測する2023

    • 著者名/発表者名
      齋藤 裕
    • 学会等名
      「集え、他分野研究者!」感染症キャンプ in 宮崎
  • [学会発表] 適応度地形の代数学:自然進化と指向性進化の統合に向けて2023

    • 著者名/発表者名
      齋藤 裕
    • 学会等名
      第46回 日本分子生物学会
  • [学会発表] 抗原情報を考慮した機械学習によるタンパク質結合力予測の精度向上2023

    • 著者名/発表者名
      来見田 遥一, 齋藤 裕
    • 学会等名
      第2回 日本抗体学会学術大会
  • [学会発表] MDシミュレーション・レプリカ交換モンテカルロ法と機械学習によるデータ効率的なタンパク質機能改良2023

    • 著者名/発表者名
      出口 鉄平, 飯田 慎仁, 齋藤 裕
    • 学会等名
      第61回 日本生物物理学会年会
  • [学会発表] Imaged-based profiling of epigenetic changes in VPA-treated HEK293 cells using machine learning and high-speed super-resolution microscopy2023

    • 著者名/発表者名
      Yicheng Wang, Nur Syatila Ab Ghani, Munmee Dutta, Shungo Adachi, Kaoru Katoh, Masakazu Namihira, Toutai Mitsuyama, Yutaka Saito
    • 学会等名
      第32回 日本バイオイメージング学会学術集会
  • [学会発表] Protein sequence design based on large-scale language models and reinforcement learning optimization2023

    • 著者名/発表者名
      Dingnan Jin, Yutaka Saito
    • 学会等名
      日本バイオインフォマティクス学会2023年年会, 第12回 生命医薬情報学連合大会 (IIBMP 2023)
  • [学会発表] ホモログ適応度地形のトランスロケーションによる変異効果予測の精度向上2023

    • 著者名/発表者名
      勝木 陸, 福永 秀蔵, 山口 秀輝, 齋藤 裕
    • 学会等名
      日本バイオインフォマティクス学会2023年年会, 第12回 生命医薬情報学連合大会 (IIBMP 2023)
  • [学会発表] Enhancing mRNA sequence design in diverse organisms by deep learning and genetic algorithm for translation velocity harmonization2023

    • 著者名/発表者名
      Bian Bian, Jichen Zhang, Yutaka Saito
    • 学会等名
      日本バイオインフォマティクス学会2023年年会, 第12回 生命医薬情報学連合大会 (IIBMP 2023)
  • [学会発表] Data efficient protein function improvement by machine learning with MD simulation and replica exchange Monte Carlo method2023

    • 著者名/発表者名
      Teppei Deguchi, Shinji Iida, Yutaka Saito
    • 学会等名
      日本バイオインフォマティクス学会2023年年会, 第12回 生命医薬情報学連合大会 (IIBMP 2023)
  • [学会発表] タンパク質の多要素の最適化にむけたマルチタスク学習手法の開発2023

    • 著者名/発表者名
      鬼塚 智大, 齋藤 裕
    • 学会等名
      日本バイオインフォマティクス学会2023年年会, 第12回 生命医薬情報学連合大会 (IIBMP 2023)
  • [学会発表] Enhancing PacBio DNA 5-methylcytosine detection by semi-supervised learning2023

    • 著者名/発表者名
      Jichen Zhang, Yutaka Saito
    • 学会等名
      日本バイオインフォマティクス学会2023年年会, 第12回 生命医薬情報学連合大会 (IIBMP 2023)
  • [学会発表] Imaged-based profiling of epigenetic changes in VPA-treated HEK293 cells using machine learning and high-speed super-resolution microscopy2023

    • 著者名/発表者名
      Nur Syatila Ab Ghani, Yicheng Wang, Munmee Dutta, Shungo Adachi, Kaoru Katoh, Masakazu Namihira, Toutai Mitsuyama, Yutaka Saito
    • 学会等名
      日本バイオインフォマティクス学会2023年年会, 第12回 生命医薬情報学連合大会 (IIBMP 2023)
  • [学会発表] Development of AI-driven digital twins for motion control learning in laboratory automation2023

    • 著者名/発表者名
      Yicheng Wang, Toutai Mitsuyama, Yutaka Saito
    • 学会等名
      日本バイオインフォマティクス学会2023年年会, 第12回 生命医薬情報学連合大会 (IIBMP 2023)

URL: 

公開日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi