Prediction and validation of regulatory variants based on DNA/RNA-protein complex structures
Project/Area Number |
22K12241
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 62010:Life, health and medical informatics-related
|
Research Institution | Tohoku University |
Principal Investigator |
城田 松之 東北大学, 医学系研究科, 講師 (00549462)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2024: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Fiscal Year 2023: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Fiscal Year 2022: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
|
Keywords | タンパク質構造 / ゲノムバリアント / 制御領域 / 遺伝子発現 / スプライシング |
Outline of Research at the Start |
個人がもつゲノム配列の違いは身体的特徴や疾患へのかかりやすさなどさまざまな表現型の違いを生み出すもととなっている。遺伝子の発現やmRNAのスプライシングなどに関与するいわゆる制御領域のゲノム配列変化はタンパク質配列変化を伴うものに比べて解析が難しかった。本研究では制御領域のゲノム変化をタンパク質とDNA・RNAとの複合体構造をもとにその影響を評価する手法を開発する。これによって制御領域変化が表現型に与える影響を理解し、ゲノム配列の違いが表現型の違いを生み出す分子レベルでのメカニズムを予測・検証することを可能とすることを目指す。
|
Outline of Annual Research Achievements |
2022年度にはDNA・RNAとタンパク質が結合したPDBの構造およびAlphaFoldDBの予測構造を網羅的に収集し、タンパク質と塩基の相互作用に影響しうるゲノム変異を評価する予測手法を開発の基盤を構築した。まず、転写因子やDNA・RNA結合タンパク質とそれらが認識する塩基配列モチーフをSELEX、JASPAR、CIS-BP、ENCODEなどのデータベースから取得した。これらの遺伝子がコードするタンパク質をPDBにおいて検索し、DNA・RNAとの結合状態での立体構造を(ホモログを含めて)網羅的に収集し、結合しているDNA・RNA配列とモチーフを比較し、精度の高いデータセットを作成した。DNA・RNAとタンパク質との複合体構造に含まれる個々の塩基(対)について、タンパク質原子とのコンタクトや水素結合を網羅的に評価し、塩基変異が起こった時にタンパク質構造と衝突や水素結合の消失等の不安定化がおこりうる塩基を同定し、塩基配列モチーフにおいてDNA・RNA-タンパク質相互作用を障害しうる塩基変異を推定するためのデータを構築した。DNA・RNA結合タンパク質には構造解析がまだされていないものも多くあるため、これらについては、AlphaFoldDBの予測構造を用いることを検討している。AlphaFoldDBは単一サブユニットのタンパク質の状態で構造予測を行っているため、DNA・RNAとの結合構造をモデリングする必要があり、ロイシンジッパーやZincフィンガーについては既知のDNA結合構造モチーフを鋳型としてDNA結合構造の作成を試み、これらの結合構造についてもゲノム変異をタンパク質に結合した塩基と関連付け、変異の効果予測を行う。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
2022年度に目的としていたDNA・RNAとタンパク質の結合構造の立体構造を用いたデータセットの構築と、ゲノム配列のなかからタンパク質に認識されるDNA・RNA塩基を抽出して、塩基置換の効果を予測するための基盤をつくることができたため。また、PDBの構造だけでなくAlphaFoldDBの予測構造についてもDNA・RNA結合ドメインについての評価を行っており、今後AlphaFold予測構造と相互作用するゲノム変異の評価についても可能となる予定である。
|
Strategy for Future Research Activity |
これまで蓄積した情報を全ゲノムシークエンスからの疾患バリアントの推定や、ゲノムワイド関連解析(GWAS)や発現量量的形質座位(eQTL)の生物学的解釈に活用するために、制御領域のゲノムバリアントについて、DNA・RNA結合タンパク質から結合される残基とその結合相手・結合形式などをゲノム全体にアノテーションできる手法を構築する。これらは既存のアノテーションツールであるANNOVARやVEPなどで用いられるようにすることを目指している。また、AlphaFoldDBの予測タンパク質構造についてもDNA・RNA結合構造の推定を行い、制御領域のバリアント解釈に利用できるデータを作成する。
|
Report
(1 results)
Research Products
(4 results)