Project/Area Number |
23K19996
|
Research Category |
Grant-in-Aid for Research Activity Start-up
|
Allocation Type | Multi-year Fund |
Review Section |
1002:Human informatics, applied informatics and related fields
|
Research Institution | The University of Tokyo |
Principal Investigator |
高橋 智栄 東京大学, 大学院理学系研究科(理学部), 特任研究員 (10980691)
|
Project Period (FY) |
2023-08-31 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥2,860,000 (Direct Cost: ¥2,200,000、Indirect Cost: ¥660,000)
Fiscal Year 2024: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Fiscal Year 2023: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
|
Keywords | タンパク質デザイン / 周辺尤度最大化 / 確率伝搬法 / 頑健性 / 情報統計力学 |
Outline of Research at the Start |
本研究では、タンパク質デザインというタンパク質立体構造予測の逆問題に取り組む。現在、タンパク質デザイン分野の最前線では深層学習によ る手法が多くの人工タンパク質のデザインに成功している一方で、生物らしい機能を持つタンパ ク質のデザインの成功例は限定的である。申請者は、現実のタンパク質はスピングラス的であり フラストレーションをうまく使って機能を発現しているという着想によって、この問題に対して、 情報統計力学と呼ばれる、不規則系の統計力学を情報学の問題に応用するアプローチを行う。
|
Outline of Annual Research Achievements |
令和6年度は、本タンパク質デザイン手法のハイパーパラメータ推定およびその推定結果に基づく全ての2次元の格子タンパク質模型のパターンのうちより現実のタンパク質の特徴を捉えた構造の分類に関する研究を行った。 前者のハイパーパラメータ推定では、周辺尤度最大化基準によって、格子タンパク質の疎水性アミノ酸残基数の期待値に関する等式と分散に関する不等式を得、確率伝搬法(Cavity法)によってそれらの量を計算することによりハイパーパラメータであるタンパク質の周囲に分布する水の化学ポテンシャルを構造(アミノ酸同士の相互作用ネットワーク)ごとに推定することに成功した。 後者では、前者の研究で導出したアミノ酸残基数の分散に関する不等式を満たす格子タンパク質の構造と満たさない構造があることに気づいたことを基に、その不等式条件を満たす構造/満たさない構造とに2次元の全ての格子タンパク質模型を分類した。導出した不等式条件はタンパク質構造の頑健性を要求する条件となっており、これは頑健性が高い構造をそうでない構造から選び取る条件を周辺尤度極大化条件から自然に導出できたことを意味する。 以上の研究は今後の研究を進める上で不可欠な基礎となる。また以上の結果は日本物理学会やその他の国際会議や国内の研究会において発表している。現在論文化の最中であり、次年度中の出版を目指す。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初の計画では、 (1)タンパク質デザインの性能評価 (2)Cavity法によるタンパク質デザイン手法の確立 (3)アミノ酸配列の事前分布の検証 (4)西森ラインとタンパク質デザインの関係の解明 のうち、令和5年度は(1) の研究を完了する計画であった。しかし現時点で実施している研究は(1)から(4)の全ての研究の基礎となるハイパーパラメータの決定法の確立とタンパク質らしい特徴を持つ格子タンパク質構造の分類である。したがって、当初の計画通りに研究を進められてはいないが、全ての研究トピックに共通する基盤を形成したという意味でおおむね順調に進んでいるといえる。
|
Strategy for Future Research Activity |
令和6年度の前半の期間は、これまでの研究の実施状況を踏まえ、(1)タンパク質デザインの性能評価(2)Cavity法によるタンパク質デザイン手法の確立(3)アミノ酸配列の事前分布の検証(4)西森ラインとタンパク質デザインの関係の解明のトピックのうちより達成が容易なトピックである(2),(4) に取り組む。(2) はハイパーパラメータ推定方式が完成しているため、ほとんど完成している。残りは推定したハイパーパラメータを使ったタンパク質デザイン結果をまとめるなどの作業が残っている。 令和6年度の後半は(1)と(3)の研究を進める。具体的には、(1)ではスピングラス模型によって我々のタンパク質デザイン手法を表現し、レプリカ法によって典型的な性能評価を行う。(3)では生成AI手法である拡散モデルで実際にアミノ酸配列の生成モデルをデータベースを基に構成する。
|