Research Project
Grant-in-Aid for Scientific Research (B)
本研究では、タンパク質の機能改良を効率化することを目的として、少数の教師データで変異効果予測を高精度に行うための「省データ」機械学習技術を開発する。画像処理や自然言語処理において提案されてきたゼロショット予測、データ拡張、弱教師あり学習などの手法を参考にしながら、さらに、タンパク質という生体分子ならではの特性である「進化」を考慮することで、独自性の高い省データ機械学習技術を創出する。本研究は、機械学習支援タンパク質工学において頻出する「教師データが少ない」という重要問題に挑むものであり、様々な機能性タンパク質の開発にブレイクスルーをもたらすと期待される。