2018 Fiscal Year Research-status Report
Development of information system for functional annotation of genomic sequence alterations by using protein 3D structures
Project/Area Number |
18K06194
|
Research Institution | Tohoku University |
Principal Investigator |
城田 松之 東北大学, 医学系研究科, 講師 (00549462)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Keywords | 非同義置換 / タンパク質立体構造 / 機能解析 |
Outline of Annual Research Achievements |
本研究では大規模ゲノム解析の結果得られる大量のゲノム塩基配列変化(バリアント)の機能解析のために、非同義変異の効果をProtein Data Bank (PDB)の蛋白質立体構造を用いて推定する手法を開発している。今年度はまずゲノムバリアントの座標情報から対応するPDBエントリの残基を検索する手法を開発した。加えてPDBの立体構造について機能解析に必要な二次構造や埋もれ度、タンパク質間相互作用、低分子との相互作用などの重要な構造的特徴を各残基について計算し、バリアントの機能注釈として利用可能なデータベースを作成した。これらの注釈をゲノム解析において一般的に用いられるVCFフォーマット等で記述されたゲノムワイドのバリアントデータについて高速で付与する手法を開発した。この手法を用いて東北メディカル・メガバンク機構で解析された日本人のバリアントや、世界の様々な集団のゲノム解析の集合体であるgnomADのバリアントなどについて立体構造を用いた評価を行った。その結果、健康な個人のゲノムに存在するタンパク質の構造や機能に影響しうる多数の非同義バリアントを同定することができた。また、PDBは毎週新規のタンパク質立体構造が登録されることがあり、常に最新の更新情報を利用できるようにすることで、既存のバリアント情報から新しい発見が生まれる可能性がある。この点について開発手法について毎週アップデート可能な機能を構築して、構造生物学情報を用いたゲノムバリアント解析の高度化を目指した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
ゲノム非同義バリアントのタンパク質立体構造を用いた機能アノテーション手法の開発について以下のような進捗を得た。 (1) 立体構造検索:ヒト参照ゲノム配列の塩基配列変化を蛋白質コード領域情報を用いてヒト蛋白質配列変化への変換を行う機構を作成した。ヒトの蛋白質配列とPDB立体構造のアミノ酸配列の網羅的対応付けをBLASTを用いて行った。これらの情報からゲノム座標とPDB立体構造の残基の対応のデータベース構築を行った。 (2) 構造情報からの特徴抽出と統合化:二次構造、埋もれ度、溶媒接触表面積、水素結合、天然変性領域などの計算をすべてのPDB構造に対して行った。また、リガンドや他の蛋白質サブユニットとの相互作用の定量化した。これらの構造特徴量をデータベースに追加して拡張し、複数の構造特徴量情報の統合解析を可能とした。 (3) ゲノムワイド解析:ゲノム解析結果(VCFファイル等)への高速なアノテーション方法および残基の構造特徴によるゲノムワイド変異の絞り込みアルゴリズムを構築した。 (4) アップデート機能作成:ゲノム配列とPDB立体構造残基、構造特徴量のデータベースの更新機能を作成し、PDBエントリごとに登録日情報による管理とタイムスタンプ化を行い、最終更新分からの差分の取得とバリアントの評価を行える機能の追加を行った。
|
Strategy for Future Research Activity |
今後の研究方針として、ゲノムバリアントのタンパク質構造を用いたアノテーション手法の高度化を行う。構造特徴としてアミノ酸変化の折りたたみ自由エネルギーの変化などの予測値を検討する。変異のある遺伝子について近年の大規模ゲノム解析によって分かってきた機能欠失への不寛容さの指標を用いて、バリアントの選択に使えるようにする。また、この手法を公開し、様々なゲノム解析を行った研究者がゲノムバリアントの一覧からタンパク質の構造と機能に影響しうるものを抽出し、機能変化について考察できるようにする。集団に見つかった機能に影響するゲノム変化については実験的検証を検討する。
|
Causes of Carryover |
当該研究のための計算機資源の一部を既存の設備及び共用計算機資源としてのスーパーコンピュータなどでまかなったために物品費の次年度利用額が生じた。これらは次年度以降に人件費・謝金・学会参加費・論文投稿料などに利用する予定である。
|
Research Products
(4 results)