• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

タンパク質の機能改良のための「省データ」機械学習技術の開発

Research Project

Project/Area Number 23K24946
Project/Area Number (Other) 22H03691 (2022-2023)
Research Category

Grant-in-Aid for Scientific Research (B)

Allocation TypeMulti-year Fund (2024)
Single-year Grants (2022-2023)
Section一般
Review Section Basic Section 62010:Life, health and medical informatics-related
Research InstitutionKitasato University (2024)
National Institute of Advanced Industrial Science and Technology (2022-2023)

Principal Investigator

齋藤 裕  北里大学, 未来工学部, 教授 (60721496)

Project Period (FY) 2022-04-01 – 2026-03-31
Project Status Granted (Fiscal Year 2024)
Budget Amount *help
¥17,160,000 (Direct Cost: ¥13,200,000、Indirect Cost: ¥3,960,000)
Fiscal Year 2025: ¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2024: ¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2023: ¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2022: ¥4,680,000 (Direct Cost: ¥3,600,000、Indirect Cost: ¥1,080,000)
Keywordsバイオインフォマティクス / 機械学習 / タンパク質工学 / 指向性進化 / 分子シミュレーション / 生体分子設計
Outline of Research at the Start

本研究では、タンパク質の機能改良を効率化することを目的として、少数の教師データで変異効果予測を高精度に行うための「省データ」機械学習技術を開発する。画像処理や自然言語処理において提案されてきたゼロショット予測、データ拡張、弱教師あり学習などの手法を参考にしながら、さらに、タンパク質という生体分子ならではの特性である「進化」を考慮することで、独自性の高い省データ機械学習技術を創出する。本研究は、機械学習支援タンパク質工学において頻出する「教師データが少ない」という重要問題に挑むものであり、様々な機能性タンパク質の開発にブレイクスルーをもたらすと期待される。

Outline of Annual Research Achievements

本研究では、少数の教師データで変異効果予測を高精度に行うための「省データ」機械学習技術として、ゼロショット予測、データ拡張、弱教師あり学習の3つの手法を開発する。
今年度は、主に弱教師あり学習について手法開発を行った。分子シミュレーション手法であるRosettaやGROMACSによって計算される結合親和性や構造安定性などの機能計算値を機械学習の「弱い」教師データと考え、実験によって取得された教師データに追加することで、機械学習の予測精度の向上を試みた。公開されているリガンド結合タンパク質および酵素の活性データをベンチマークとして本手法の性能を評価した。その結果、本手法は実験データのみを用いる従来の機械学習に比べて高い予測精度を達成した。特に、利用できる実験データ量が100個以下と少数の場合には、弱教師データの追加によって顕著な精度向上が得られることがわかった。また、単変異体の弱教師データを利用することで、2重変異体の予測精度を向上できるなど、タンパク質工学への応用面でも重要な結果が得られた。以上の結果について学会発表を行った。
手法開発と並行して、実験系研究者との共同研究による手法の応用展開も進めている。今年度は酵素FMOの機能改変に関して論文発表を行った。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

ゼロショット予測、データ拡張、弱教師あり学習いずれについても予定通り進行している。ゼロショット予測については、昨年度に論文発表を行った。データ拡張、弱教師あり学習についても今年度に学会発表を行っており、来年度以降、論文化に向けて取りまとめる予定である。

Strategy for Future Research Activity

データ拡張、弱教師あり学習の手法開発を継続して進め、結果を取りまとめて論文化を目指す。また、実験系研究者との共同研究による手法の応用展開も継続して進める。

Report

(2 results)
  • 2023 Annual Research Report
  • 2022 Annual Research Report
  • Research Products

    (46 results)

All 2024 2023 2022

All Journal Article (9 results) (of which Peer Reviewed: 9 results,  Open Access: 4 results) Presentation (37 results) (of which Int'l Joint Research: 3 results,  Invited: 4 results)

  • [Journal Article] Extensive antibody search with whole spectrum black-box optimization2024

    • Author(s)
      Tucs Andrejs、Ito Tomoyuki、Kurumida Yoichi、Kawada Sakiya、Nakazawa Hikaru、Saito Yutaka、Umetsu Mitsuo、Tsuda Koji
    • Journal Title

      Scientific Reports

      Volume: 14 Issue: 1 Pages: 552-552

    • DOI

      10.1038/s41598-023-51095-z

    • Related Report
      2023 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] VeloPro: A pipeline integrating Ribo‐seq and AlphaFold deciphers association patterns between translation velocity and protein structure features2023

    • Author(s)
      Bian Bian、Kumagai Toshitaka、Saito Yutaka
    • Journal Title

      iMeta

      Volume: 2 Issue: 4

    • DOI

      10.1002/imt2.148

    • Related Report
      2023 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] A Multiomics Atlas of Brown Adipose Tissue Development Over Time2023

    • Author(s)
      Kumagai Yutaro、Saito Yutaka、Kida Yasuyuki S
    • Journal Title

      Endocrinology

      Volume: 164 Issue: 6

    • DOI

      10.1210/endocr/bqad064

    • Related Report
      2023 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] Protein language models2023

    • Author(s)
      山口 秀輝、齋藤 裕
    • Journal Title

      JSBi Bioinformatics Review

      Volume: 4 Issue: 1 Pages: 52-67

    • DOI

      10.11234/jsbibr.2023.1

    • ISSN
      2435-7022
    • Related Report
      2023 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] Engineering the Substrate Specificity of Toluene Degrading Enzyme XylM Using Biosensor XylS and Machine Learning2023

    • Author(s)
      Ogawa Yuki、Saito Yutaka、Yamaguchi Hideki、Katsuyama Yohei、Ohnishi Yasuo
    • Journal Title

      ACS Synthetic Biology

      Volume: 12 Issue: 2 Pages: 572-582

    • DOI

      10.1021/acssynbio.2c00577

    • Related Report
      2022 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Selection of target-binding proteins from the information of weakly enriched phage display libraries by deep sequencing and machine learning2023

    • Author(s)
      Ito Tomoyuki、Nguyen Thuy Duong、Saito Yutaka、Kurumida Yoichi、Nakazawa Hikaru、Kawada Sakiya、Nishi Hafumi、Tsuda Koji、Kameda Tomoshi、Umetsu Mitsuo
    • Journal Title

      mAbs

      Volume: 15 Issue: 1

    • DOI

      10.1080/19420862.2023.2168470

    • Related Report
      2022 Annual Research Report
    • Peer Reviewed
  • [Journal Article] 深層学習によるタンパク質の機能予測と設計2022

    • Author(s)
      齋藤 裕
    • Journal Title

      Seibutsu-kogaku Kaishi

      Volume: 100 Issue: 11 Pages: 589-592

    • DOI

      10.34565/seibutsukogaku.100.11_589

    • ISSN
      0919-3758, 2435-8630
    • Year and Date
      2022-11-25
    • Related Report
      2022 Annual Research Report
    • Peer Reviewed
  • [Journal Article] EvoOpt: an MSA-guided, fully unsupervised sequence optimization pipeline for protein design2022

    • Author(s)
      Hideki Yamaguchi, Yutaka Saito
    • Journal Title

      Machine Learning in Structural Biology Workshop, The 36th Conference on Neural Information Processing Systems (NeurIPS 2022)

      Volume: -

    • Related Report
      2022 Annual Research Report
    • Peer Reviewed
  • [Journal Article] AI and computational chemistry-accelerated development of an alotaketal analogue with conventional PKC selectivity2022

    • Author(s)
      Maki Jumpei、Oshimura Asami、Tsukano Chihiro、Yanagita Ryo C、Saito Yutaka、Sakakibara Yasubumi、Irie Kazuhiro
    • Journal Title

      Chemical Communications

      Volume: 58 Issue: 47 Pages: 6693-6696

    • DOI

      10.1039/d2cc01759h

    • Related Report
      2022 Annual Research Report
    • Peer Reviewed
  • [Presentation] 生体分子設計のインフォマティクス2023

    • Author(s)
      齋藤 裕
    • Organizer
      CBI学会 2023年大会
    • Related Report
      2023 Annual Research Report
    • Invited
  • [Presentation] 機械学習によるタンパク質の機能予測と設計2023

    • Author(s)
      齋藤 裕
    • Organizer
      公益社団法人新化学技術推進協会ライフサイエンス技術部会反応分科会 技術セミナー「タンパク質の予測・設計を学ぶ」
    • Related Report
      2023 Annual Research Report
    • Invited
  • [Presentation] タンパク質工学における機械学習の利用2023

    • Author(s)
      齋藤 裕
    • Organizer
      大阪大学インタラクティブ物質科学・カデットプログラム 第9回 インタラクティブ交流会
    • Related Report
      2023 Annual Research Report
    • Invited
  • [Presentation] ranslation velocity harmonization: an innovative approach towards mRNA design through the integration of ribosome profiling and deep learning2023

    • Author(s)
      Bian Bian, Jichen Zhang, Yutaka Saito
    • Organizer
      The 22nd International Conference on Bioinformatics (InCoB 2023)
    • Related Report
      2023 Annual Research Report
    • Int'l Joint Research
  • [Presentation] Protein-compound interaction prediction using microbial chemical communication network2023

    • Author(s)
      Hongyi Shen, Yutaka Saito
    • Organizer
      情報処理学会 第76回 BIO合同研究発表会
    • Related Report
      2023 Annual Research Report
  • [Presentation] 機械学習でタンパク質の変異効果を予測する2023

    • Author(s)
      齋藤 裕
    • Organizer
      「集え、他分野研究者!」感染症キャンプ in 宮崎
    • Related Report
      2023 Annual Research Report
  • [Presentation] 適応度地形の代数学:自然進化と指向性進化の統合に向けて2023

    • Author(s)
      齋藤 裕
    • Organizer
      第46回 日本分子生物学会
    • Related Report
      2023 Annual Research Report
  • [Presentation] 抗原情報を考慮した機械学習によるタンパク質結合力予測の精度向上2023

    • Author(s)
      来見田 遥一, 齋藤 裕
    • Organizer
      第2回 日本抗体学会学術大会
    • Related Report
      2023 Annual Research Report
  • [Presentation] MDシミュレーション・レプリカ交換モンテカルロ法と機械学習によるデータ効率的なタンパク質機能改良2023

    • Author(s)
      出口 鉄平, 飯田 慎仁, 齋藤 裕
    • Organizer
      第61回 日本生物物理学会年会
    • Related Report
      2023 Annual Research Report
  • [Presentation] Imaged-based profiling of epigenetic changes in VPA-treated HEK293 cells using machine learning and high-speed super-resolution microscopy2023

    • Author(s)
      Yicheng Wang, Nur Syatila Ab Ghani, Munmee Dutta, Shungo Adachi, Kaoru Katoh, Masakazu Namihira, Toutai Mitsuyama, Yutaka Saito
    • Organizer
      第32回 日本バイオイメージング学会学術集会
    • Related Report
      2023 Annual Research Report
  • [Presentation] Protein sequence design based on large-scale language models and reinforcement learning optimization2023

    • Author(s)
      Dingnan Jin, Yutaka Saito
    • Organizer
      日本バイオインフォマティクス学会2023年年会, 第12回 生命医薬情報学連合大会 (IIBMP 2023)
    • Related Report
      2023 Annual Research Report
  • [Presentation] ホモログ適応度地形のトランスロケーションによる変異効果予測の精度向上2023

    • Author(s)
      勝木 陸, 福永 秀蔵, 山口 秀輝, 齋藤 裕
    • Organizer
      日本バイオインフォマティクス学会2023年年会, 第12回 生命医薬情報学連合大会 (IIBMP 2023)
    • Related Report
      2023 Annual Research Report
  • [Presentation] Enhancing mRNA sequence design in diverse organisms by deep learning and genetic algorithm for translation velocity harmonization2023

    • Author(s)
      Bian Bian, Jichen Zhang, Yutaka Saito
    • Organizer
      日本バイオインフォマティクス学会2023年年会, 第12回 生命医薬情報学連合大会 (IIBMP 2023)
    • Related Report
      2023 Annual Research Report
  • [Presentation] Data efficient protein function improvement by machine learning with MD simulation and replica exchange Monte Carlo method2023

    • Author(s)
      Teppei Deguchi, Shinji Iida, Yutaka Saito
    • Organizer
      日本バイオインフォマティクス学会2023年年会, 第12回 生命医薬情報学連合大会 (IIBMP 2023)
    • Related Report
      2023 Annual Research Report
  • [Presentation] タンパク質の多要素の最適化にむけたマルチタスク学習手法の開発2023

    • Author(s)
      鬼塚 智大, 齋藤 裕
    • Organizer
      日本バイオインフォマティクス学会2023年年会, 第12回 生命医薬情報学連合大会 (IIBMP 2023)
    • Related Report
      2023 Annual Research Report
  • [Presentation] Enhancing PacBio DNA 5-methylcytosine detection by semi-supervised learning2023

    • Author(s)
      Jichen Zhang, Yutaka Saito
    • Organizer
      日本バイオインフォマティクス学会2023年年会, 第12回 生命医薬情報学連合大会 (IIBMP 2023)
    • Related Report
      2023 Annual Research Report
  • [Presentation] Imaged-based profiling of epigenetic changes in VPA-treated HEK293 cells using machine learning and high-speed super-resolution microscopy2023

    • Author(s)
      Nur Syatila Ab Ghani, Yicheng Wang, Munmee Dutta, Shungo Adachi, Kaoru Katoh, Masakazu Namihira, Toutai Mitsuyama, Yutaka Saito
    • Organizer
      日本バイオインフォマティクス学会2023年年会, 第12回 生命医薬情報学連合大会 (IIBMP 2023)
    • Related Report
      2023 Annual Research Report
  • [Presentation] Development of AI-driven digital twins for motion control learning in laboratory automation2023

    • Author(s)
      Yicheng Wang, Toutai Mitsuyama, Yutaka Saito
    • Organizer
      日本バイオインフォマティクス学会2023年年会, 第12回 生命医薬情報学連合大会 (IIBMP 2023)
    • Related Report
      2023 Annual Research Report
  • [Presentation] 機械学習が導くタンパク質の指向性進化.2022

    • Author(s)
      齋藤 裕.
    • Organizer
      令和4年度 日本環境変異原ゲノム学会 公開シンポジウム「環境変異原ゲノム研究を革新する解析技術~基礎から最先端まで~」
    • Related Report
      2022 Annual Research Report
    • Invited
  • [Presentation] Increasing the training dataset for improving 6mA fraction estimation.2022

    • Author(s)
      Jichen Zhang, Yutaka Saito.
    • Organizer
      The 20th Asia Pacific Bioinformatics Conference (APBC 2022).
    • Related Report
      2022 Annual Research Report
    • Int'l Joint Research
  • [Presentation] 大規模配列解析と機械学習を連携させたファージ提示法:抗体断片の親和性成熟を目指して.2022

    • Author(s)
      河田 早矢, 来見田 遥一, 伊藤 智之, グエン トゥイ ズオン, 中澤 光, 西 羽美, 齋藤 裕, 亀田 倫史, 津田 宏治, 梅津 光央.
    • Organizer
      生物工学会北日本支部シンポジウム 2022.
    • Related Report
      2022 Annual Research Report
  • [Presentation] Machine-learning-guided library design cycle for directed evolution of enzymes: the effects of training data composition on sequence space exploration.2022

    • Author(s)
      Yutaka Saito, Misaki Oikawa, Takumi Sato, Hikaru Nakazawa, Tomoyuki Ito, Tomoshi Kameda, Koji Tsuda, Mitsuo Umetsu.
    • Organizer
      日本バイオインフォマティクス学会2022年年会, 第11回 生命医薬情報学連合大会 (IIBMP 2022).
    • Related Report
      2022 Annual Research Report
  • [Presentation] Machine-learning-assisted phage display applications: functional variant mining from next generation sequence library.2022

    • Author(s)
      Tomoyuki Ito, Thuy Duong Nguyen, Yutaka Saito, Yoichi Kurumida, Hikaru Nakazawa, Sakiya Kawada, Hafumi Nishi, Koji Tsuda, Tomoshi Kameda, Mitsuo Umetsu.
    • Organizer
      PEGS Europe 2022.
    • Related Report
      2022 Annual Research Report
    • Int'l Joint Research
  • [Presentation] タンパク質の異種発現のためのmRNA配列設計.2022

    • Author(s)
      齋藤 裕.
    • Organizer
      RNAインフォマティクス道場2022.
    • Related Report
      2022 Annual Research Report
  • [Presentation] Large-scale association analysis of translation velocity and protein features among diverse organisms: towards mRNA design optimizing co-translational folding.2022

    • Author(s)
      Bian Bian, Toshitaka Kumagai, Yutaka Saito.
    • Organizer
      RNAインフォマティクス道場2022.
    • Related Report
      2022 Annual Research Report
  • [Presentation] 機械学習を指針とした進化分子工学による抗体断片の結合機能創出.2022

    • Author(s)
      河田 早矢, 来見田 遥一, 伊藤 智之, Thuy Duong Nguyen, 中澤 光, 西 羽美, 齋藤 裕, 亀田 倫史, 津田 宏治, 梅津 光央.
    • Organizer
      化学工学会 第88年会.
    • Related Report
      2022 Annual Research Report
  • [Presentation] 機械学習を取り入れた進化分子工学による非抗体タンパク質の分子認識機能化.2022

    • Author(s)
      伊藤 智之, Thuy Duong Nguyen, 齋藤 裕, 来見田 遥一, 中澤 光, 河田 早矢, 西 羽美, 津田 宏治, 亀田 倫史, 梅津 光央.
    • Organizer
      化学工学会 第88年会.
    • Related Report
      2022 Annual Research Report
  • [Presentation] 機械学習を組み入れたファージライブラリー法の開発:パニング情報からのリード分子の成熟化操作.2022

    • Author(s)
      河田 早矢, 来見田 遥一, 伊藤 智之, グエン トゥイ ズオン, 中澤 光, 西 羽美, 齋藤 裕, 亀田 倫史, 津田 宏治, 梅津 光央.
    • Organizer
      第1回 日本抗体学会学術大会.
    • Related Report
      2022 Annual Research Report
  • [Presentation] 機械学習を組み入れたファージライブラリー法の開発:低指向な進化情報からのプロテインマイニング.2022

    • Author(s)
      伊藤 智之, Thuy Duong Nguyen, 齋藤 裕, 来見田 遥一, 中澤 光, 河田 早矢, 西 羽美, 津田 宏治, 亀田 倫史, 梅津 光央.
    • Organizer
      第1回 日本抗体学会学術大会.
    • Related Report
      2022 Annual Research Report
  • [Presentation] Machine-learning application for in vitro selection of antibody fragments from a phage display library.2022

    • Author(s)
      Sakiya Kawada, Yoichi Kurumida, Tomoyuki Ito, Thuy Duong Nguyen, Hikaru Nakazawa, Hafumi Nishi, Yutaka Saito, Tomoshi Kameda, Koji Tsuda, Mitsuo Umetsu.
    • Organizer
      第60回 日本生物物理学会年会.
    • Related Report
      2022 Annual Research Report
  • [Presentation] Machine-learning-assisted molecular evolution with a phage display library of antibody mimetic.2022

    • Author(s)
      Tomoyuki Ito, Thuy Duong Nguyen, Yutaka Saito, Yoichi Kurumida, Hikaru Nakazawa, Sakiya Kawada, Hafumi Nishi, Koji Tsuda, Tomoshi Kameda, Mitsuo Umetsu.
    • Organizer
      第60回 日本生物物理学会年会.
    • Related Report
      2022 Annual Research Report
  • [Presentation] Multiple sequence alignmentにより制約されたデータ効率的なタンパク質配列設計.2022

    • Author(s)
      山口 秀輝, 齋藤 裕.
    • Organizer
      日本バイオインフォマティクス学会2022年年会, 第11回 生命医薬情報学連合大会 (IIBMP 2022).
    • Related Report
      2022 Annual Research Report
  • [Presentation] Large-scale association analysis of translation velocity and protein features among diverse organisms: towards mRNA design optimizing co-translational folding.2022

    • Author(s)
      Bian Bian, Toshitaka Kumagai, Yutaka Saito.
    • Organizer
      日本バイオインフォマティクス学会2022年年会, 第11回 生命医薬情報学連合大会 (IIBMP 2022).
    • Related Report
      2022 Annual Research Report
  • [Presentation] Image-based epigenetic profiling combining machine learning and high-speed super-resolution microscopy.2022

    • Author(s)
      Yicheng Wang, Shungo Adachi, Kaoru Katoh, Masakazu Namihira, Toutai Mitsuyama, Yutaka Saito.
    • Organizer
      日本バイオインフォマティクス学会2022年年会, 第11回 生命医薬情報学連合大会 (IIBMP 2022).
    • Related Report
      2022 Annual Research Report
  • [Presentation] 生物―化合物ネットワーク情報を利用したタンパク質化合物相互作用予測手法の精度向上.2022

    • Author(s)
      Hongyi Shen, Yutaka Saito.
    • Organizer
      日本バイオインフォマティクス学会2022年年会, 第11回 生命医薬情報学連合大会 (IIBMP 2022).
    • Related Report
      2022 Annual Research Report
  • [Presentation] BERTを用いたヌクレオソーム親和性の予測.2022

    • Author(s)
      Seiji Toki, Yutaka Saito.
    • Organizer
      日本バイオインフォマティクス学会2022年年会, 第11回 生命医薬情報学連合大会 (IIBMP 2022).
    • Related Report
      2022 Annual Research Report
  • [Presentation] Image-based epigenetic profiling combining machine learning and high-speed super-resolution microscopy.2022

    • Author(s)
      Yicheng Wang, Shungo Adachi, Kaoru Katoh, Masakazu Namihira, Toutai Mitsuyama, Yutaka Saito.
    • Organizer
      第31回 日本バイオイメージング学会学術集会.
    • Related Report
      2022 Annual Research Report

URL: 

Published: 2022-04-19   Modified: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi