2022 Fiscal Year Research-status Report
Machine-learning prediction of the protein plasticity regions related to denaturation and aggregation
Project/Area Number |
22K05431
|
Research Institution | Fukui Prefectural University |
Principal Investigator |
日び 隆雄 福井県立大学, 生物資源学部, 教授 (00285181)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Keywords | 立体構造予測 |
Outline of Annual Research Achievements |
1)可塑性領域予測モデルの構築 予測モデル中の各アミノ酸残基の溶媒アクセス可能表面積(SASA)を求めるアルゴリズムを検討し、Pythonと相性が良いFreeSASA(Simon Mitternacht (2016))を計算に使用し、結晶構造PDBファイルを用いて結晶構造モデルとAlphafold2モデルのSASA差を計算で求められるようにした。現在、各アミノ酸残基のSASAの差と各アミノ酸残基の疎水性、極性との相関を予測する機械学習モデルについて基本設計を行なっている。
2)モデルタンパク質の変異体構築と構造解析 強化学習のための酵素変異体ライブラリーを作製した。ニワトリ由来のオボアルブミン(OVA)の人工遺伝子を発現プラスミドに組み込み、error-prone PCR法を用いてオボアルブミン遺伝子にランダムに変異を導入し、26変異体遺伝子ライブラリーを構築した。微量精製した酵素について、熱安定性の指標であるTm値 を測定した結果、42.1℃から67.1℃と最大25℃差であった。ただし、一部の変異体についてゲル化しやすく、アフィニティ精製が困難であった。ゲル化は興味深い現象だが、プログラム構築に必要なモデルタンパク質としては、必要数のデータを得るのに多くの時間が必要となる。そこで、OVAは強化学習に用いることとし、初期モデル酵素を好熱性放線菌Thermobifida fusca AHK119由来クチナーゼ(CutA、ポリエステルヒドロラーゼ)に変更した。OVAと同様にして36変異体酵素を作製し、Tm値が52.8℃から65.8℃の変異体からなる酵素ライブラリーを得た。得られた酵素について順次精製および結晶化を開始した。現在、得られた2変異体酵素についてX線結晶構造解析を行なっている。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
1)可塑性領域予測モデルの構築 当初計画の令和4年度は、PDBデータをもとに、ASAを計算するとともに、各アミノ酸残基について様々な物理化学的な特徴量を求め、データセットを準備するとした。 既存のAlphaFold2とFreeSASAを利用し、機械学習に必要なデータセットを構築する基本部分については順調に進んでいるが、入力用データの欠損部分の補完工程など重要な前処理工程がさらに必要であり、その部分の検討を進めている。 多説明変数となる様々な特徴量に対して変量連関図を作成し、主要な特徴量を抽出する予定については、現在、SOD1の既知データを使っているが、数が少ないため、2)のモデルサンプルの酵素変異体ライブラリーの構造解析結果を待って、令和5年度に取り掛かることとした。 2)モデルタンパク質の変異体構築と構造解析 当初計画の令和4年度は、人工遺伝子による変異体発現DNAライブラリーを作製し、無細胞合成系を使ってタンパク質合成を行うとした。予算の都合上、無細胞合成系を大腸菌発現系に変更した。作製目標数は50変異体であるのに対し、OVAについては26変異体、CutAについては34変異体の発現DNAライブラリーが得られた。いずれも大腸菌発現系でタンパク質の発現を確認し、NTAアフィニティカラムを用いた一段階精製により得られた粗精製サンプルについて熱安定性を評価することができた。CutAライブラリーからは、陰イオン交換クロマトグラフィーにより最終精製したCutAの9変異体が現在得られている。既に2変異体について結晶化を完了し、X線結晶構造解析を行なっている。
|
Strategy for Future Research Activity |
1)可塑性領域予測モデルの構築 初期データセットについて、計算に欠かせない前処理工程の自動化を図る。プログラミングについてはChat GPTなども活用することで、効率化を進めていく。
2)モデルタンパク質の変異体構築と構造解析 CutAについて、残り25変異体の精製を進め、熱安定性試験、結晶化およびX線結晶構造解析を行い、立体構造モデルを構築する。構造データが揃い次第、機械学習プログラムをテストし、構造予測モデルを構築させる。また、OVAのライブラリーについても精製、熱安定性試験、X線結晶構造解析をすすめ、強化学習に用いる。強化学習を経たのち、既存のPDBデータベースを利用して、プログラムの評価を行う。
|