2020 Fiscal Year Research-status Report
Development, validation and application of machine learning system for TCR epitope prediction
Project/Area Number |
20K06610
|
Research Institution | Osaka University |
Principal Investigator |
寺口 俊介 大阪大学, 免疫学フロンティア研究センター, 特任准教授(常勤) (00467276)
|
Co-Investigator(Kenkyū-buntansha) |
榊原 修平 大阪大学, 免疫学フロンティア研究センター, 寄附研究部門准教授 (10618838)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | T細胞受容体 / エピトープ / 機械学習 / クラスタリング / 深層学習 / 検証実験 |
Outline of Annual Research Achievements |
当該年度には、以下のような研究を行った。 1、T細胞受容体クラスタリングシステムを用いた複数の実データ解析と解析結果の検証実験。開発しているシステムに基づいて、CMV感染者のT細胞受容体のβ鎖の配列、COVID-19感染した患者由来の公開データ、さらには共同研究者から提供されたCOVID-19患者の一細胞シークエンシングから得られたT細胞受容体配列の両鎖の配列のクラスタリングを行った。特に、最後のデータ解析に関しては、同じ共同研究者の協力のもと、クラスタリング結果の実験的な検証を進めている。これにより、現行のシステムの実データに対する精度が推定可能になり、今後の研究開発を進めていくうえで貴重なデータが得られる予定である。 2、T細胞受容体クラスタリングシステムの精度向上及び高速化のための研究。研究計画時に予定していた複数の立体構造予測モデルを同時に使用することによるT細胞受容体クラスタリングシステムの改良に関して研究を進めた。残念ながら、精度の向上はわずかなものに留まったため、複数のモデルを利用するアイデア自体は不採用となったが、その際に用いた実装上の工夫を利用して、同システムの10倍以上の速度向上につながった。 3、実験による訓練データ取得。最新の1細胞シークエンシング技術を利用した訓練データの取得も進めている。こちらに関しては、試薬メーカーの不手際や、機械の不調によるトラブルがあり、理想的な結果とはならなかったものの、実験に関わる習熟度とデータの蓄積を進めている。 4、次世代のエピトープ予測システムの開発。次世代のT細胞受容体エピトープ予測システムのプロトタイプとして、複数のアーキテクチャを検証し、現在アテンション機構に基づく深層学習モデルの実装と改良を進めているところである。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
もともと構想していた、複数の立体構造モデル候補の利用や、深層学習の利用、トレーニングデータの取得等を進めることができ、さらにその先の実データの解析とその検証にまで取り組めている。 概要に記載した通り、結果については必ずしも期待通りといかない部分もあったが、一方で、計算速度の大幅な改善などの想定外の成果や、新たな共同研究といった進展もあり、全体としては当初の計画以上に進展していると考えている。
|
Strategy for Future Research Activity |
今後も、基本的には当初の計画に従って研究を進めていく予定であるが、現在進めている実データに対するシステムの精度検証の結果次第で、方向性を改めて検討する予定である。精度が想定以上によいようであれば、現行システムの実データに対する積極的な活用を進める。逆に、精度が想定に届かないようであれば、次世代のシステム開発や新たな訓練データの取得によりフォーカスしていく必要がある。 また、次年度からの大きな変化として、研究代表者の異動による研究環境、業務内容、及び、共同研究環境の変化があげられる。研究代表者は情報システムの開発を担当しているため、実験環境に対する影響は軽微であるが、共同研究者間の対面のコミュニケーションは難しくなる。この部分は、ICT技術を利用することでカバーする予定である。また、業務内容の変化により、研究代表者がこれまでと同じだけのエフォートを本研究に割けるかどうかは未知数の部分がある。極端に研究時間の捻出が難しい場合には、研究期間の延長も視野に入れる。
|
Causes of Carryover |
本年度は、主に、1細胞シークエンシングを用いた訓練データの取得と、実験による検証に予算を使用することを想定していた。しかし、所属研究室の別プロジェクトで1細胞シークエンシングを行うことになったため、本年度は、本研究の予算を用いた1細胞シークエンシングは実行しなかった。一方で、別プロジェクトの実験により、実験への習熟が可能になるとともに、本プロジェクトで利用可能な訓練データも得られた。1細胞シークエンシングに関しては、今後も、当該研究室の状況や費用対効果なども検討しながら、次年度、もしくは、次々年度に遂行することを予定している。 また、実験による検証に関して計上していた予算に関しても、共同研究を通じた検証が可能になったことから、本年度はそちらを優先させた。こちらも、今後の検証実験で利用していく予定である。 また、コロナの影響で、研究会等がキャンセルとなったことから、旅費として計上していた予算も使用しなかった。こちらは、今後のコロナや研究会の動向により、旅費として用いるか、別途活用していくかを検討する。
|