2015 Fiscal Year Research-status Report
ミスセンス変異の分子機能及び表現型への影響を予測する手法の開発
Project/Area Number |
15K21487
|
Research Institution | Nagahama Institute of Bio-Science and Technology |
Principal Investigator |
土方 敦司 長浜バイオ大学, バイオサイエンス学部, プロジェクト特任講師 (80415273)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 疾患変異解析 / ミスセンス変異 / 構造バイオインフォマティクス |
Outline of Annual Research Achievements |
ヒト疾患関連変異のデータベース(ClinVarデータベース)をダウンロードし、約2500遺伝子の変異データ(約10万件)を抽出し、既に構築しているMutation@A Glanceのリレーショナルデータベース(RDB)に格納し、ヒトタンパク質のアミノ酸配列上にマッピングした。同時に、数万人規模の健常人の全エクソンシークエンスデータから抽出した1塩基バリアントデータ(ExACデータベース)および、がん組織から抽出した体細胞変異データ(COSMICデータベース)をダウンロードし、同様にRDBに格納した(それぞれ、約1000万件、約300万件)。本年度は、複数の異なる遺伝性疾患と関連付けられている80遺伝子に焦点を当て、文献情報および公開されているデータベース(OMIM、ClinVar)及びProTherm, PMDから情報の抽出を行い、データベース上で統合した。 各変異部位の構造および機能部位を網羅的に解析可能とするプラグインをMutation@A Glance上に開発した。このことによって、約2000種類の疾患関連変異の構造および機能的な特徴を、疾患との関連がないバリアント及びがん化に関連する変異と網羅的に比較が容易にできるようになった。 これらの統合データを用いて解析したところ、遺伝様式(優性・劣性)とタンパク質立体構造上の特徴との間に明確な関連性があることが明らかとなった。すなわち、劣性変異は、タンパク質内部に多く、逆に優性変異はタンパク質表面または分子間相互作用面に多いことがわかった。この結果は、米国のグループによる網羅的な変異実験の結果(Sahni et al. Cell, 2015)と矛盾しない。また、がん化に関する変異部位は、常染色体優性の遺伝様式を取る変異に共通の特徴を有することがわかった。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
平成27年度の計画では、(1)Mutation@A Glanceへの公的データの統合、(2)統合データに基づく変異部位と分子機能及び表現型との相関解析を行うことを目標とした。(1)に関しては、タンパク質機能に対する変異の影響についてまとめられたデータベース(ProTherm及びPMD)のデータや文献情報、タンパク質間相互作用データベース(BioGRID)のデータなどをMutation@A Glance上に取り込むと同時に、健常人の全エクソン配列解析によって得られた、疾患との関連性がないバリアントなどについてもデータを統合した。複数疾患との関連性が明らかとなっている遺伝子数は当初の予定よりも多い80遺伝子存在したが、構築した解析システムを用いることで、より多くのミスセンス変異について効率よくタンパク質の構造と機能との関連性を解析することが可能となり、疾患の遺伝様式とタンパク質機能との関連性を明らかにすることができた。このことから、(2)についても当初の目標は概ね達成できたと判断した。
|
Strategy for Future Research Activity |
平成28年度の計画は、平成27年度に統合化した、ヒト疾患関連ミスセンス変異とタンパク質の構造・機能情報データベースを用いて、各ミスセンス変異がどのような表現型(疾患の種類)と関連するかを予測するための手法の開発に着手する。より具体的には、ある遺伝子が複数の疾患と関わっている場合、新しく見つかった変異が、疾患と関係するか否か、あるとすればどの疾患と関わっているかを推定する手法を開発する。データベース上の疾患関連変異及び中立変異のデータを基にして学習セットを作成し、機械学習アルゴリズムを適用して予測器を構築する。様々なアルゴリズムを試すことにより、各アルゴリズムの汎化性能を評価する。 タンパク質の分子機能によって、予測性能に差が出る可能性があるので、標的遺伝子セットを転写因子、シグナル伝達分子及び細胞表面レセプターなど分子機能、あるいは立体構造ファミリーによって分類し、予測性能の違いとの関係について精査する。また、実験研究協力者の協力を得て実際の実験データと照らして予測性能を評価することを試みる予定である。
|
Causes of Carryover |
ヒト疾患変異に関する文献調査を行うにあたり、その資料整理を行う者を雇用するための謝金として20万円、また文献複写等の費用として5万円を計上していたが、当初の想定よりも少ない時間で完了したため、支払予定額と実支払額に差が生じた。
|
Expenditure Plan for Carryover Budget |
データベースの構築及び解析、さらにその成果として公開するためのウェブサーバーの構築に当たって、ストレージ並びにメモリを増強する必要性があることがわかった。そのため、平成28年度予算で購入予定のサーバーのハードウェアスペックを増強する目的で使用する。
|
Research Products
(2 results)