2015 Fiscal Year Annual Research Report
ヒトゲノム低頻度変異の第一原理的理解に向けた基盤構築
Project/Area Number |
15H02773
|
Research Institution | Tohoku University |
Principal Investigator |
木下 賢吾 東北大学, 情報科学研究科, 教授 (60332293)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | バイオインフォマティクス / ヒトゲノム / 変異 / 蛋白質立体構造 |
Outline of Annual Research Achievements |
近年、国内外で数多くのゲノムコホート研究が展開されつつある。ゲノムコホート研究では、従来型コホート研究に加えてゲノム解析を行い、遺伝型と環境要因の相互作用を解析し、疾患の原因を明らかにすることが試みられるが、産出された変異データを解釈する基盤がまだ不十分なため、ゲノムデータが十分に活用されているとは言いがたい。そこで本研究では、ヒトのゲノム情報とタンパク質の構造情報を統合し、レアバリアントの解釈を行う基盤を構築する。 初年度は特にゲノム情報とタンパク質立体構造情報をつなぐ手法の開発を行った。具体的には、ゲノムとトランスクリプトームの対応付けに応じて、ゲノム上の位置とトランスクリプトの位置の対応付けを行い、平行して連携研究者の太田・白井らが開発を行ったモデリングパイプラインを利用して、RefSeq配列と構造情報の対応付けを行う基盤を構築した。NHLBIが公開している6500人の変異データを構造にマップし変異の登場頻度との関係の解析を行った。その結果、タンパク質相互作用部位に予想に反して、立体構造上は重篤に見えるが頻度が高くヒトには影響の無いと思われる興味深い変異を見つけることができた。関連する実験情報を集めることで、この変異が確かに相互作用を弱めることが確認出来ると同時に、相互作用が弱まっても、生体内でのタンパク質の存在量を考えると、複合体の形成自体は可能であることが明らかになった。これは、構造情報だけでは意味づけ困難な変異であるが、全体としては非常にまれなケースであることも確認することができた(Nishi et al, Protein Sci)。また、低分子結合部位周辺の変異も同様に解析を行い、概ね構造情報から予想される変異頻度であることが確認でき、我々のアプローチの妥当性が見えてきた(Yamada et al, BPPB, 2016, in press)。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
初年度は特にゲノム情報とタンパク質立体構造情報をつなぐ手法の開発を行い、6500人エクソームのタンパク質立体構造へのマッピングを行い、データ解析を行うことができた。手法の開発に関しては、連携研究者の太田・白井らが開発を行っているSAHGの構造モデリングパイプラインを、来年度以降データベースの構築と公開の基盤として利用する東大医科研のスパコン環境で利用可能にすることができた。データ解析に関しては、当初、頻度の高い変異はタンパク質の分子的な機能に影響しないという作業仮説の下で解析を進めた。その際、分子的な機能として、立体構造から意味づけがしやすいタンパク質間相互作用部位と低分子の相互作用部位を対象として解析を行った。その結果、低分子の結合部位は概ね予想通りで、作業仮説との齟齬はほとんど無かった。一方、タンパク質間相互作用部位に関しては、予想に反する変異を一つ見いだした。その後、関連する実験情報を収集し、精査することで、タンパク質立体構造だけでは理解できず、そのタンパク質が生体内でどれぐらいの量存在するかという情報も合わせて考えると、仮説と矛盾しないケースであるということが分かった。これらの結果は、予想と違い非常に深い例であったので、原著論文として報告を行った。これらの結果は、ある意味ではタンパク質立体構造だけで機能に関して理解しようという本研究のアプローチの限界を示しているとも言えるが、一方で、非常に例外的なケースであることも判明したので、我々のアプローチの妥当性が見えてきたと考え、今後も計画に従って研究を進めることとした。一方で、解析におもったよりも時間がかかったので、ユーザインターフェースの開発が少し遅れ気味であるが、大きな問題になるほどではないと考えている。 以上のように、計画通りに研究は進捗していると共に予想外の結果を得て報告することもでき、順調な進捗であると考えている。
|
Strategy for Future Research Activity |
28年度には、前年度に開発をしたモデリングパイプラインをベースにユーザインターフェースの開発を進める。またユーザインターフェースは早い段階で実験研究者に評価を依頼し、問題点の洗い出しと改良を行う。また、次年度に向けて解析基盤の構築を開始する。解析基盤は基本的には公開基盤の内部利用のためのパッケージという位置づけで構築を行うので、比較的短期間での構築が可能であると考えている。Webインターフェースに関しては経験豊かな業者への外注を念頭に、専門家の協力を仰ぐことで、実験研究者が直感的に使いやすいインターフェースのデザインを行う。具体的には、以下の項目に分けて研究開発を進める。 (1)ゲノム情報とタンパク質立体構造情報をつなぐ内部用ツールの改良 手法の基本的な部分の開発は27年度に開発を終了するというスケジュールで進めるが、27年度末頃にはヒト参照ゲノムの新しいバージョン(GRCh38, 2013年12月リリース)に対応したアノテーションも充実してくると思われる。そこで、マッピングの更新を行うと共に、今後のゲノム情報、タンパク質立体構造情報も常に最新のバージョンに追随できるように開発を進める。 (2)内部用解析用、解析基盤の開発 ゲノムコホートのデータは、統計データとしては公開可能であるが、ごく少数のヒトしか持たない変異情報は個人特定の恐れがあるため公開が困難になると予想される。また、個々人の変異データは機微性の高いデータであり、倫理審査を経た特定の研究者がセキュアな領域でしかアクセス出来ないデータである。このような環境でも我々が開発した手法を利用できるように、公開基盤の開発と並行して、これまで開発してきたすべての手法を内部環境でも同じように利用できるような解析基盤の開発を進める。
|