研究領域 | 生体反応の集積・予知・創出を基盤としたシステム生物合成科学 |
研究課題/領域番号 |
22H05126
|
研究種目 |
学術変革領域研究(A)
|
配分区分 | 補助金 |
審査区分 |
学術変革領域研究区分(Ⅱ)
|
研究機関 | 東京大学 |
研究代表者 |
寺田 透 東京大学, 大学院農学生命科学研究科(農学部), 教授 (40359641)
|
研究分担者 |
森脇 由隆 東京医科歯科大学, 難治疾患研究所, 准教授 (70751303)
|
研究期間 (年度) |
2022-06-16 – 2027-03-31
|
研究課題ステータス |
交付 (2024年度)
|
配分額 *注記 |
83,200千円 (直接経費: 64,000千円、間接経費: 19,200千円)
2024年度: 17,550千円 (直接経費: 13,500千円、間接経費: 4,050千円)
2023年度: 18,460千円 (直接経費: 14,200千円、間接経費: 4,260千円)
2022年度: 12,480千円 (直接経費: 9,600千円、間接経費: 2,880千円)
|
キーワード | 分子動力学シミュレーション / 量子化学計算 / 立体構造予測 / 複合体構造予測 / 触媒機構 / 生合成関連酵素 / 機能予測 / 触媒機構解析 / データベース / AlphaFold / 酵素・基質複合体 |
研究開始時の研究の概要 |
配列データベースに埋もれた有用な酵素を見つけ出すため、二次代謝産物生合成酵素と予測されたアミノ酸配列について、その立体構造を網羅的に予測する。さらに、この立体構造に基づいて、酵素の基質特異性と反応特異性を予測する方法を開発する。ここでは、機能既知酵素との基質ポケットの構造類似性に基づく経験的アプローチと、酵素・基質複合体の構造予測と分子動力学シミュレーション、量子化学計算に基づく理論的アプローチの2つのアプローチにより予測を行う。
|
研究実績の概要 |
経験的アプローチでは、酵素のペアが与えられたときに、全長の配列類似度と配列一致度、ドメインの構造類似度とRMSD、配列一致度、ポケット周辺残基のRMSDと配列一致度を特徴量として、機能の一致・不一致を判別する判別器を開発した。ここでは、アミノ酸配列データベースSwissProtに登録され、酵素反応データベースRheaに関連付けられたタンパク質について、AlphaFold Protein Structure Database(AFDB)から予測構造を取得し、アミノ酸配列が類似したペアの中から、Rhea IDが一致するペアを正例、異なるペアを負例として、それぞれ5万ペアをランダムに抽出した。また、Predicted Aligned Error(PAE)に基づいて予測構造をドメインに分割した。これらの特徴量を用いて、LightGBMなど8つのモデルを訓練した結果、いずれも全長の配列類似度のみを用いる場合に比べて高い予測性能を示した。また、AFDBには配列長が2,700を超えるタンパク質の予測構造は登録されていないため、このようなタンパク質の立体構造を、PAEに基づいて立体構造上独立した領域に分割して予測する方法を開発した。生合成関連遺伝子クラスタのデータベースMIBiGに登録された40,999のタンパク質のうち、33,296について、AFDBから予測構造を取得した。残りの7,703のうち、配列長が1,600未満の3,946についてLocalColabFoldを用いて立体構造を予測し、3,757について、分割して立体構造を予測した。 理論的アプローチでは、前年度に選定した3つの酵素について、引き続き酵素-基質複合体のモデリングを行った。1つの系について変異体実験を行い、モデルの妥当性を確認した。また、予備的な量子化学計算を行い、遷移状態の安定化に必要な相互作用を検討した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究の目的は、経験的アプローチと理論的アプローチにより、生合成関連酵素の基質特異性・反応特異性予測法の開発を行うことである。経験的アプローチでは、Rheaと関連付けられたSwissProtのエントリのうち、アミノ酸配列が類似した10万ペア程度をランダムに抽出し、立体構造の比較、タンパク質表面のポケット検出、ポケット周辺の立体構造とアミノ酸の比較の実施を計画した。立体構造比較は、全長の構造を用いて行う予定であったが、タンパク質が複数のドメインから成る場合、ドメインの相対配置の違いによって、立体構造を適切に比較できないことがわかった。このため、PAEに基づいて予測構造をドメインに分割し、ドメインごとに立体構造比較を行った。さらに、当初の計画を超えて、これを含む7つの特徴量を学習したモデルを用いて、Rhea IDの一致・不一致を判別する判別器を開発した。これは、全長の配列類似度のみを用いる場合に比べて高い予測性能を示した。また、MIBiGに登録された40,999のタンパク質のうち、AFDBから取得した33,296と、LocalColabFoldを用いて予測した3,946の予測構造を、本研究で構築しているWebサーバにて公開した。 理論的アプローチでは、2022年度に着手した3つの系について、引き続き酵素-基質複合体構造のモデリングと、量子化学計算を用いた触媒機構解析を行うことを計画した。1つの系については、モデルから基質認識に関わると予想された3つのアミノ酸を置換する変異体実験を行い、いずれの変異体も活性が失われることを確認した。また、それぞれの系について、予備的な量子化学計算を行い、遷移状態を求めた。現時点では、活性化エネルギーが高いため、遷移状態を安定化させるにはどのような相互作用が必要か検討を行った。 以上から、本研究の目的に向けて、順調に進展しているといえる。
|
今後の研究の推進方策 |
2023年度は、タンパク質のペアについて、配列の類似性、ドメインの立体構造類似性、ポケットの立体構造とこれを構成するアミノ酸の類似性に基づいて、同一の基質に対して同一の反応を触媒するかどうかを判別する判別器を開発した。この判別器を用いて、任意のタンパク質の機能(基質と触媒する反応)を予測するためには、比較対象となる機能既知のタンパク質のデータベースを整備する必要がある。そこで、Rhea IDが付与されたSwissProtのエントリについて、AFDBから予測構造を取得し、ドメインへの分割とポケットの検出を行う。この結果をデータベース化し、タンパク質が与えられたら、機能が一致するタンパク質の候補を、そのスコアとともに出力するシステムを構築する。また、2023年度は、長いアミノ酸配列を持つタンパク質について、ドメインに分割して立体構造を予測する方法を開発し、MIBiGに登録されたタンパク質のうち、AFDBから予測構造が取得できないタンパク質について立体構造予測を行った。今後、これらの予測構造を、2022年度から開発している独自のデータベースに登録し、公開する。 理論的アプローチについては、3つの系について、引き続き酵素-基質複合体構造のモデリングと、量子化学計算を用いた触媒機構解析を行う。これらの系については、2022年度から取り組んでいるが、これまでのところ、常温で進行可能な妥当な反応経路が得られていない。うち1つの系については、領域内のディスカッションを通じて、異なる機構で反応するという示唆が得られたため、この反応機構の妥当性を重点的に検証する。他の2つの系については、反応経路やエネルギー地形の探索範囲を広げ、常温で反応が進行しうる反応経路を探索する。また、領域内で共同研究を行い、複数想定されている反応経路から妥当な反応経路を、理論的アプローチにより推定する研究に取り組む。
|