2016 Fiscal Year Annual Research Report
ヒトゲノム低頻度変異の第一原理的理解に向けた基盤構築
Project/Area Number |
15H02773
|
Research Institution | Tohoku University |
Principal Investigator |
木下 賢吾 東北大学, 情報科学研究科, 教授 (60332293)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | ゲノム変異 / 蛋白質立体構造 / バイオインフォマティクス / レアバリアント |
Outline of Annual Research Achievements |
28年度以降:機能アノテーションの拡充、公開基盤の改良及び解析基盤の準備 27年度には前年度に開発をした公開基盤のプロトタイプとしての公開基盤の公開を行うと同時に、実験研究者に評価を依頼し、改良点の洗い出しと改良を行う。また、次年度に向けて解析基盤の構築を開始する。解析基盤は基本的には公開基盤の内部利用のためのパッケージという位置づけで構築を行うので、比較的短期間での構築が期待できる。Webインターフェースに関しては経験豊かな業者への外注を念頭に、専門家の協力を仰ぐことで実験研究者が直感的に使いやすいインターフェースのデザインを目指す。具体的には、以下の項目に分けて研究開発を進める。 (1)ゲノム情報とタンパク質立体構造情報をつなぐ内部用ツールの改良 ツールの基本的な部分は27年度に開発を終了するというスケジュールで進めるが、27年度末頃にはヒト参照ゲノムの新しいバージョン(GRCh38, 2013年12月リリース)に対応したアノテーションも充実してくると思われる。そこで、マッピングの更新を行うと共に、今後のゲノム情報、タンパク質立体構造情報も常に最新のバージョンに追随できるように開発を進める(当初の開発はアノテーションが充実しているhg19をベースとして開発を行う予定であるが、27年度当初の国内外の状況を調査した上で決定する)。なお、最近は多くのデータベースがRDF化されデータが提供されていることを念頭に、情報ソースとしてRDF化されたもの、特にUniProt, PDBjのRDF版を積極的に利用していく。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
28年度には前年度に開発をした公開基盤のプロトタイプ版の内部評価を行うと同時に、実験研究者に評価を依頼し、問題点の洗い出しと改良を行う予定であった。また、最終年度に向けて解析基盤の構築を開始する。解析基盤は基本的には公開基盤の内部利用のためのパッケージという位置づけで構築を行うので、比較的短期間での構築が可能であると考えている。Webインターフェースに関しては経験豊かな業者への外注を念頭に、専門家の協力を仰ぎ、実験研究者が直感的に使いやすいインターフェースのデザインを行ってきた。具体的には、以下の項目に分けて研究開発を進めた。(1)ゲノム情報とタンパク質立体構造情報をつなぐ内部用ツールの改良、(2)内部用解析用、解析基盤の開発、 (3)非コード領域・構造を持たない領域を中心とした機能情報の拡充。 (1)に関しては、28年度末頃にはヒト参照ゲノムの新しいバージョン(GRCh38, 2013年12月リリース)に対応したアノテーションも充実してくると予想していたが、予想以上にGRCh38のアノテーション情報がそろわないので、マッピングの更新は29年度へと持ち越すこととした。(2)に関しては、公開基盤の開発と並行して、これまで開発してきたすべての手法を内部環境でも同じように利用できるような解析基盤の開発を進めることができた。(3)に関しては、新たにChIP-seqのデータを活用する道筋が見えてきたので、予想以上に進展した。以上のように、公開基盤に関してはwebインターフェースの構築に予想以上に時間が掛かっており、若干遅れているが最終年度に当初目的は達成できる範囲内だと思われるため、全体としては、概ね順調に進展していると判断した。
|
Strategy for Future Research Activity |
ゲノムコホート研究では、一定数の健常人の健康状態を追跡することで疾患の原因を探る従来型コホート研究に加え、ゲノム解析を行い、遺伝型と環境要因の相互作用を解析し、疾患の原因を明らかにすることが試みられている。このような動きは、ゲノム配列解読のコストが大幅に低下したことを受けてのことであるが、コストの低下の一方、産出されたデータを解釈し、活用する基盤がない。特に、近年疾患との関連から注目されている「低頻度変異(レアバリアント)」の解析では、変異の観察頻度が低いため、従来のような統計的手法を適用するには、非常に大規模なコホートの形成を行う必要がありコストがかかる。そこで本研究では、ヒトのゲノム情報とタンパク質の構造情報を統合することで、レアバリアントの解釈を行う基盤となるデータベースとツールの開発を行い、ゲノムコホートから生み出される変異情報を最大限に活用する基盤を構築することを目指す。 当初計画は概ね順調に進展しており、大きな問題点等は発生していない。
|
Research Products
(6 results)