2023 Fiscal Year Annual Research Report
タンパク質の機能改良のための「省データ」機械学習技術の開発
Project/Area Number |
22H03691
|
Allocation Type | Single-year Grants |
Research Institution | National Institute of Advanced Industrial Science and Technology |
Principal Investigator |
齋藤 裕 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (60721496)
|
Project Period (FY) |
2022-04-01 – 2026-03-31
|
Keywords | タンパク質工学 / 機械学習 / 分子シミュレーション / バイオインフォマティクス |
Outline of Annual Research Achievements |
本研究では、少数の教師データで変異効果予測を高精度に行うための「省データ」機械学習技術として、ゼロショット予測、データ拡張、弱教師あり学習の3つの手法を開発する。 今年度は、主に弱教師あり学習について手法開発を行った。分子シミュレーション手法であるRosettaやGROMACSによって計算される結合親和性や構造安定性などの機能計算値を機械学習の「弱い」教師データと考え、実験によって取得された教師データに追加することで、機械学習の予測精度の向上を試みた。公開されているリガンド結合タンパク質および酵素の活性データをベンチマークとして本手法の性能を評価した。その結果、本手法は実験データのみを用いる従来の機械学習に比べて高い予測精度を達成した。特に、利用できる実験データ量が100個以下と少数の場合には、弱教師データの追加によって顕著な精度向上が得られることがわかった。また、単変異体の弱教師データを利用することで、2重変異体の予測精度を向上できるなど、タンパク質工学への応用面でも重要な結果が得られた。以上の結果について学会発表を行った。 手法開発と並行して、実験系研究者との共同研究による手法の応用展開も進めている。今年度は酵素FMOの機能改変に関して論文発表を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
ゼロショット予測、データ拡張、弱教師あり学習いずれについても予定通り進行している。ゼロショット予測については、昨年度に論文発表を行った。データ拡張、弱教師あり学習についても今年度に学会発表を行っており、来年度以降、論文化に向けて取りまとめる予定である。
|
Strategy for Future Research Activity |
データ拡張、弱教師あり学習の手法開発を継続して進め、結果を取りまとめて論文化を目指す。また、実験系研究者との共同研究による手法の応用展開も継続して進める。
|