2017 Fiscal Year Annual Research Report
Study on the data structure of the reference genome graph for handling all human genome variations
Project/Area Number |
16K12531
|
Research Institution | 大学共同利用機関法人情報・システム研究機構(機構本部施設等) |
Principal Investigator |
片山 俊明 大学共同利用機関法人情報・システム研究機構(機構本部施設等), データサイエンス共同利用基盤施設, 特任助教 (60396869)
|
Project Period (FY) |
2016-04-01 – 2018-03-31
|
Keywords | ゲノムグラフ / セマンティック・ウェブ / データ統合 / ハッカソン |
Outline of Annual Research Achievements |
当研究では、多数のゲノムをグラフ構造として束ねることにより、今後大幅に増加する個人ゲノムの解析の効率化や、個人差・個体差の大きいゲノム領域やリファレンス配列にない領域を扱えないといった問題を解決するため、ゲノムグラフのデータ構造と、そのデータベースとの連携のための仕組みの開発に取り組んだ。とくに、これまで構築してきた、ゲノムのアノテーション情報をセマンティック・ウェブ技術のResource Description Framework (RDF)で統合したグラフデータベースとの連携を目指した。 初年度にはゲノムグラフを構築する代表的なツールであるvgについて、ゲノムグラフの構造をRDFで表現するためのデータモデルを国際連携のもとで開発した。この結果、vgコマンドにRDF形式でゲノムグラフ構造を出力する機能が取り込まれた。 最終年度となる次年度では、RDFで構築されたゲノムデータベースのアノテーションをゲノムグラフと共に扱うことで、アノテーションの充実した生物種のゲノムと、近縁種ながらアノテーションの少ないゲノムを同時に扱い、アノテーション情報の近縁種へのマッピングが効率的に行えることを確認した。 これらはライフサイエンス統合データベースセンターの主催する国際開発者会議BioHackathonやRDF summitを通じて、国内外のvgやデータベース開発者と合宿形式で開発を行うとともに、Global Alliance for Genomics and Health (GA4GH)のゲノムグラフ開発グループとの連携を推進した。この結果、今後ヒトゲノム等への利活用につながる基盤技術開発ができたと考えられる。また、国内の若手研究者とともに日本ゲノムグラフ研究会を発足し、これらの技術の発展と研究を促進するための活動を開始することができた。
|
Research Products
(11 results)