2019 Fiscal Year Research-status Report
Development of information system for functional annotation of genomic sequence alterations by using protein 3D structures
Project/Area Number |
18K06194
|
Research Institution | Tohoku University |
Principal Investigator |
城田 松之 東北大学, 医学系研究科, 講師 (00549462)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Keywords | 蛋白質構造 / ゲノム配列変化 / 蛋白質機能 |
Outline of Annual Research Achievements |
ゲノムワイドで網羅的なヒトのゲノム塩基配列変化(バリアント)の蛋白質立体構造を用いた機能解析のために、ヒトゲノムとProtein Data Bank (PDB)のタンパク質構造を対応付ける手法の開発を行った。ゲノムバリアントの座標情報から対応するPDBエントリの残基を検索し、複数の構造情報を統合解析し、ゲノム全体の変異をランク付けし、かつPDBの更新に対応できるゲノムワイド蛋白質立体構造情報アノテーションツールの開発を行っており、これにより、構造生物学に疎いゲノム解析者でも構造情報をもとに効果の推定されるバリアントを選択し、機能解析を行うことができるような情報基盤を構築している。特にPDBの立体構造情報から推定される機能残基の情報をゲノム配列上のタンパク質コード領域の塩基のそれぞれに対応づけ、アミノ酸変化を起こすゲノムの一塩基バリアントがどのPDB構造のどのような場所にあるアミノ酸に変異を起こすかを容易に検索できる手法を開発した。PDBは毎週更新されるデータベースであり、最新の知見を反映させるために毎週データをアップデートする仕組みが必要であるため、このようなパイプラインを構築した。これらの手法を既存の一般集団のバリアントおよび疾患関連バリアントについて適用し、また遺伝子の機能欠失への不耐性などを考慮することで機能に関連すると推定されるバリアントの抽出を行なった。また、PDBが毎週更新することでどの様なタンパク質について新たに構造情報が得られる様になったかを把握できるようにすることができた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
ゲノム配列変化から蛋白質構造を検索するツールとして(1) 立体構造検索、(2) 構造情報からの特徴抽出と統合化、(3) ゲノムワイド解析、(4) アップデートの機能の開発について順調に進んでいるため。 (1) 立体構造検索についてはヒト参照ゲノム配列の塩基配列変化をCCDSの蛋白質コード領域情報を用いてヒト蛋白質配列変化へ変換し、ヒトの蛋白質配列とPDB立体構造のアミノ酸配列の網羅的対応付けを行い、ゲノム座標とProtein Data Bank (PDB)立体構造の残基の対応のデータベース構築とその手法を確立した。(2) 構造情報からの特徴抽出と統合化について、二次構造、埋もれ度、溶媒接触表面積、水素結合、天然変性領域などの計算、リガンドや他の蛋白質サブユニットとの相互作用の定量化、データベースに構造特徴量を追加した拡張、複数の構造特徴量情報の統合アルゴリズムの構築を行った。これにより、蛋白質内部・相互作用面・リガンド結合部位・活性部位などの立体構造に基づく機能情報をアミノ酸残基変化に付与することができた。(3) ゲノムワイド解析についてはゲノム解析結果(VCFファイル等)へのアノテーション方法を構築し、残基の構造特徴によるゲノムワイド変異の絞り込みを可能にした。(4) アップデート機能作成はゲノム配列とPDB立体構造残基、構造特徴量のデータベースの更新機能の作成、PDBエントリごとに登録日情報による管理とタイムスタンプ化、最終更新分からの差分の取得とバリアントの評価を行える機能の追加を行なった。PDBは毎週更新されているデータベースであり、近年クライオ電子顕微鏡技術の発達などにより生物学的・医学的に重要な蛋白質の構造解析が相次いでいる。このような毎週のアップデートに対応することで、一旦解析したゲノム解析結果から時間の経過によって新たな構造情報による示唆を得ることができる。
|
Strategy for Future Research Activity |
本研究で開発しているゲノム配列からのタンパク質立体構造情報検索ツールについて機能を拡充するとともに、ヒトの一般集団および疾患関連バリアントについて応用し、疾患原因の解明や機能変化をもたらすバリアントの同定に応用する。機能拡充については与えられたバリアントセットについて毎週新着のPDB構造情報をレポートする様な機能を考えている。これにより、クリニカルシークエンシングなどで過去に見つかった患者由来のバリアントを持ったタンパク質の立体構造が新たに発見された時にその構造をもとに疾患発生メカニズムを推定できる様にすることを目指す。また、応用についてはこれまでの疾患関連エクソーム解析でみつかった主にde novo、つまり両親が持っておらず患者に発生したものについて適用し、各々の疾患の発症に関与するバリアントを絞り込むとともに疾患の発症機序を推定する。これらの解析や開発を通してゲノムバリアントの機能解析を推進する。
|
Causes of Carryover |
当該研究のための計算機資源の一部を既存の設備及び共用計算機資源としてのスーパーコンピュータなどでまかなったために物品費の次年度利用額が生じた。これらは次年度以降に人件費・謝金・物品費等に利用する予定である。
|