ゲノム配列解析技術の進展に伴い、個人ゲノムの配列決定が容易となってきたが、解釈の困難な意義不明バリアント(VUS)が多数見つかっている。これらVUSを正しく評価することは、遺伝子型と表現型との間の関係性を理解するだけでなく、ゲノム変異による疾患発症メカニズムの理解に繋がる。本研究では、タンパク質をコードする領域に見つかるVUSの、そのタンパク質の分子機能への影響を評価するための、タンパク質高次構造に立脚した情報解析手法の開発を目的とする。昨年度までに、立体構造情報のみから定義される、アミノ酸残基の空間的環境記述子(LSED: Local Structural Environment Descriptor)を、定量的かつ統計的に評価する手法の開発を行い、疾患関連タンパク質の各残基について抽出しデータベース化した。本年度は、これらのデータに基づきさらに詳細な解析を進めた。 疾患変異残基のLSED及び中立変異残基のLSEDを総当たりで比較したところ、疾患―疾患ペアまたは中立―中立ペアの類似性の方が、疾患―中立ペアと比べて有意に高かった。このことが意味することは、類縁フォールドの垣根を超えて共通した分子局所構造因子の存在を示唆するものである。次に、がん抑制遺伝子における網羅的変異機能実験データを組み合わせた解析を行った。もし対象アミノ酸残基のLSEDが、置換先のアミノ酸を基準とするLSEDと類似していれば、そのアミノ酸置換は許容されると想定して解析したところ、想定通り、置換先のアミノ酸残基LSEDと高い類似性スコアを示した場合、そのアミノ酸置換は機能に影響を与えない場合が有意に多い結果となった。 本研究の結果は、VUSを評価する上で、LSEDを用いた解析が有効であるだけでなく、タンパク質の構造―機能相関を理解する上でも重要な知見である。
|