機械学習とベイズ推論の融合による免疫受容体タンパク質の設計手法の開発
Project/Area Number |
22K18003
|
Research Category |
Grant-in-Aid for Early-Career Scientists
|
Allocation Type | Multi-year Fund |
Review Section |
Basic Section 62010:Life, health and medical informatics-related
|
Research Institution | Aichi Cancer Center Research Institute |
Principal Investigator |
郭 中梁 愛知県がんセンター(研究所), システム解析学分野, 研究員 (20875819)
|
Project Period (FY) |
2022-04-01 – 2024-03-31
|
Project Status |
Completed (Fiscal Year 2023)
|
Budget Amount *help |
¥4,680,000 (Direct Cost: ¥3,600,000、Indirect Cost: ¥1,080,000)
Fiscal Year 2023: ¥2,340,000 (Direct Cost: ¥1,800,000、Indirect Cost: ¥540,000)
Fiscal Year 2022: ¥2,340,000 (Direct Cost: ¥1,800,000、Indirect Cost: ¥540,000)
|
Keywords | タンパク質間相互作用予測 / 機械学習 / 結合能予測 / マルチモーダル学習 / トポロジカルデータ解析 / TCR / タンパク質設計 / サンプリング / ベイズ推論 |
Outline of Research at the Start |
T細胞が受容体タンパク質(TCR)を通じてがん細胞やウイルス感染細胞を認識し,攻撃する.近年,この機構を利用してがん細胞認識能の高い受容体をT細胞に導入することでがんを治療するT細胞受容体遺伝子改変T細胞輸注療法が注目されている.しかしながら,がん抗原の個別性および多様性より,抗原に合わせた受容体分子の高精度かつ高効率な設計手法の開発は治療法の実現に不可欠である.本研究は機械学習とベイズ推論を組み合わせ,高精度かつTCR分子の設計手法の確立を目指す.
|
Outline of Annual Research Achievements |
本研究は,機械学習とベイズ推論を組み合わせて,高精度かつ効率的な免疫受容体タンパク質の設計手法の確立を目指している.提案手法は,タンパク質設計問題を統計のサンプリング問題と捉え,機械学習モデルを用いてTCR配列から結合能を予測し,TCR配列空間をサンプリングして高い結合能を持つTCR配列を発見する.しかしながら,これまで提案されたpHLAとTCRの結合能予測モデルはいずれも精度が低かったため,新な高精度なタンパク質間結合能予測モデルを開発する必要があった. 近年,機械学習分野においてタンパク質設計の問題が非常に注目されているが,設計されたタンパク質の結合能などの性質を予測するモデルの精度が実用化に至っていないことが十分に認識されていない.そのため,我々はまず初年度にこの問題に深く掘り下げ,解決策を模索するためのデータセットや新しい手法について論じた論文を出版した(Guo and Yamaguchi, 2022). 従来のタンパク質間結合能予測では,タンパク質の立体構造またアミノ酸配列のどちらか一つにフォーカスしたモデルが構築され,結合能予測が行われる.われわれは,マルチモーダル学習を利用し,タンパク質の立体構造とアミノ酸配列の双方の情報を統合し,高精度なタンパク質結合能予測手法を開発した.抗原抗体結合能のベンチマークデータセットでの予測精度は,従来のモデルと比較して顕著な改善を達成し、Pearsonの相関係数が0.684から0.904に向上した.この研究成果をまとめた論文は国際学会であるGIW ISCB Asia conference 2023にアクセプトされ,口頭発表を行った.また国際純粋および応用生物物理学連合会議2024(IUPAB 2023)でポスター発表する予定である.国内学会である第6回日本メディカルAI学会学術集会でも口頭発表する予定である.
|
Report
(2 results)
Research Products
(4 results)