2023 Fiscal Year Annual Research Report
機械学習とベイズ推論の融合による免疫受容体タンパク質の設計手法の開発
Project/Area Number |
22K18003
|
Research Institution | Aichi Cancer Center Research Institute |
Principal Investigator |
郭 中梁 愛知県がんセンター(研究所), システム解析学分野, 研究員 (20875819)
|
Project Period (FY) |
2022-04-01 – 2024-03-31
|
Keywords | タンパク質間相互作用予測 / 機械学習 / 結合能予測 / マルチモーダル学習 / トポロジカルデータ解析 |
Outline of Annual Research Achievements |
本研究は,機械学習とベイズ推論を組み合わせて,高精度かつ効率的な免疫受容体タンパク質の設計手法の確立を目指している.提案手法は,タンパク質設計問題を統計のサンプリング問題と捉え,機械学習モデルを用いてTCR配列から結合能を予測し,TCR配列空間をサンプリングして高い結合能を持つTCR配列を発見する.しかしながら,これまで提案されたpHLAとTCRの結合能予測モデルはいずれも精度が低かったため,新な高精度なタンパク質間結合能予測モデルを開発する必要があった. 近年,機械学習分野においてタンパク質設計の問題が非常に注目されているが,設計されたタンパク質の結合能などの性質を予測するモデルの精度が実用化に至っていないことが十分に認識されていない.そのため,我々はまず初年度にこの問題に深く掘り下げ,解決策を模索するためのデータセットや新しい手法について論じた論文を出版した(Guo and Yamaguchi, 2022). 従来のタンパク質間結合能予測では,タンパク質の立体構造またアミノ酸配列のどちらか一つにフォーカスしたモデルが構築され,結合能予測が行われる.われわれは,マルチモーダル学習を利用し,タンパク質の立体構造とアミノ酸配列の双方の情報を統合し,高精度なタンパク質結合能予測手法を開発した.抗原抗体結合能のベンチマークデータセットでの予測精度は,従来のモデルと比較して顕著な改善を達成し、Pearsonの相関係数が0.684から0.904に向上した.この研究成果をまとめた論文は国際学会であるGIW ISCB Asia conference 2023にアクセプトされ,口頭発表を行った.また国際純粋および応用生物物理学連合会議2024(IUPAB 2023)でポスター発表する予定である.国内学会である第6回日本メディカルAI学会学術集会でも口頭発表する予定である.
|