2022 Fiscal Year Research-status Report
Prediction and validation of regulatory variants based on DNA/RNA-protein complex structures
Project/Area Number |
22K12241
|
Research Institution | Tohoku University |
Principal Investigator |
城田 松之 東北大学, 医学系研究科, 講師 (00549462)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Keywords | タンパク質構造 / ゲノムバリアント / 制御領域 / 遺伝子発現 / スプライシング |
Outline of Annual Research Achievements |
2022年度にはDNA・RNAとタンパク質が結合したPDBの構造およびAlphaFoldDBの予測構造を網羅的に収集し、タンパク質と塩基の相互作用に影響しうるゲノム変異を評価する予測手法を開発の基盤を構築した。まず、転写因子やDNA・RNA結合タンパク質とそれらが認識する塩基配列モチーフをSELEX、JASPAR、CIS-BP、ENCODEなどのデータベースから取得した。これらの遺伝子がコードするタンパク質をPDBにおいて検索し、DNA・RNAとの結合状態での立体構造を(ホモログを含めて)網羅的に収集し、結合しているDNA・RNA配列とモチーフを比較し、精度の高いデータセットを作成した。DNA・RNAとタンパク質との複合体構造に含まれる個々の塩基(対)について、タンパク質原子とのコンタクトや水素結合を網羅的に評価し、塩基変異が起こった時にタンパク質構造と衝突や水素結合の消失等の不安定化がおこりうる塩基を同定し、塩基配列モチーフにおいてDNA・RNA-タンパク質相互作用を障害しうる塩基変異を推定するためのデータを構築した。DNA・RNA結合タンパク質には構造解析がまだされていないものも多くあるため、これらについては、AlphaFoldDBの予測構造を用いることを検討している。AlphaFoldDBは単一サブユニットのタンパク質の状態で構造予測を行っているため、DNA・RNAとの結合構造をモデリングする必要があり、ロイシンジッパーやZincフィンガーについては既知のDNA結合構造モチーフを鋳型としてDNA結合構造の作成を試み、これらの結合構造についてもゲノム変異をタンパク質に結合した塩基と関連付け、変異の効果予測を行う。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
2022年度に目的としていたDNA・RNAとタンパク質の結合構造の立体構造を用いたデータセットの構築と、ゲノム配列のなかからタンパク質に認識されるDNA・RNA塩基を抽出して、塩基置換の効果を予測するための基盤をつくることができたため。また、PDBの構造だけでなくAlphaFoldDBの予測構造についてもDNA・RNA結合ドメインについての評価を行っており、今後AlphaFold予測構造と相互作用するゲノム変異の評価についても可能となる予定である。
|
Strategy for Future Research Activity |
これまで蓄積した情報を全ゲノムシークエンスからの疾患バリアントの推定や、ゲノムワイド関連解析(GWAS)や発現量量的形質座位(eQTL)の生物学的解釈に活用するために、制御領域のゲノムバリアントについて、DNA・RNA結合タンパク質から結合される残基とその結合相手・結合形式などをゲノム全体にアノテーションできる手法を構築する。これらは既存のアノテーションツールであるANNOVARやVEPなどで用いられるようにすることを目指している。また、AlphaFoldDBの予測タンパク質構造についてもDNA・RNA結合構造の推定を行い、制御領域のバリアント解釈に利用できるデータを作成する。
|
Causes of Carryover |
今年度は解析用PCを既存のもので賄ったことと、また解析補助のための人員を今年度の範囲では利用することなく研究を進めることができたため次年度利用分が生じた。 次年度は解析用計算機の購入やサーバ利用料、また人件費として利用予定である。
|
Research Products
(4 results)