ゲノム解析技術の革新にともない、数十万から数百万人規模でヒトの全エクソームまたは全ゲノム解析が進行し、ヒトゲノムの大量の塩基配列変化(バリアント)の情報が蓄積している。このような状況の中でタンパク質の機能変化や疾患感受性などの表現型への影響のあるバリアントを抽出することが課題となっている。本研究ではバリアントがタンパク質のアミノ酸配列を変化させる場合に立体構造の安定性や機能を変化させるかどうかをProtein Data Bank(PDB)のタンパク質立体構造を用いて網羅的に評価することを目的とした。これまでに毎週更新されるPDBの情報をヒトゲノムと対応づけ、立体構造から各残基のタンパク質の安定性、相互作用に関わる特徴量を計算し、与えられたバリアントの評価を行うゲノムワイド蛋白質立体構造情報アノテーションツールの開発を行った。このツールはhttps://wupsivus.sb.ecei.tohoku.ac.jp/で公開しており、バリアントのリストをアップロードすると、タンパク質のアミノ酸変異を引き起こすバリアントに対して、PDBの構造情報を検索し、アミノ酸残基の埋もれやタンパク質・リガンドとの相互作用の情報を抽出し、絞り込みを可能とする。また、本研究の成果は東北メディカル・メガバンク機構のJapanese Multi-Omics Reference Panelの一部として公開しており、日本人が持つゲノム変異やGenome Aggregation Database (gnomAD)の多様な集団が持つゲノム変異についてあらかじめ構造情報を参照できるように公開している。これにより、構造生物学に疎いゲノム解析者でも構造情報をもとに効果の推定されるバリアントを選択し、機能解析を行うことができるような情報基盤を構築した。
|