2020 Fiscal Year Research-status Report
日本人のゲノム・健康・診療情報と公共知識ベースのセマンティック統合システムの開発
Project/Area Number |
18K11545
|
Research Institution | 大学共同利用機関法人情報・システム研究機構(機構本部施設等) |
Principal Investigator |
片山 俊明 大学共同利用機関法人情報・システム研究機構(機構本部施設等), データサイエンス共同利用基盤施設, 特任准教授 (60396869)
|
Co-Investigator(Kenkyū-buntansha) |
荻島 創一 東北大学, 東北メディカル・メガバンク機構, 教授 (40447496)
川島 秀一 大学共同利用機関法人情報・システム研究機構(機構本部施設等), データサイエンス共同利用基盤施設, 特任准教授 (50314274)
藤原 豊史 大学共同利用機関法人情報・システム研究機構(機構本部施設等), データサイエンス共同利用基盤施設, 特任助教 (80815176)
|
Project Period (FY) |
2018-04-01 – 2022-03-31
|
Keywords | 日本人ゲノム / ゲノムグラフ / セマンティック・ウェブ / データベース / 情報統合 |
Outline of Annual Research Achievements |
本研究では、日本人のゲノム情報を活用するための技術基盤構築および健康情報や診断情報のセマンティクスに基づいたデータ統合を目指している。このため日本人ゲノム情報および健康情報・診断情報をもつdbTMMを開発している東北大学東北メディカル・メガバンク機構(ToMMo)および、セマンティック・ウェブ技術によるデータベース統合のための技術開発を進めているライフサイエンス統合データベースセンター(DBCLS)が協力し研究開発を進めている。今年度は、継続してゲノムグラフのヒトゲノムおよび日本人ゲノムへの適用を検討してきたが、ようやく国際プロジェクトであるツールvgの開発が進展し、ようやくヒトゲノムレベルの巨大なゲノムグラフ構築が実用化される見込みが立ってきた。一方で、ゲノムグラフとその座標系に対するアノテーション等の知識のマッピングについては、ロングリードシーケンサーによる大規模な構造変異SVとの対応もあわせて標準化することが望ましく、バリアント情報標準化研究会を立ち上げて国内の主要なバリアントデータベースTogoVar, MGeND, JVar, DPV等の実務者と検討を進めた。健康情報・診療情報については、オントロジーのマッピングを東北大学dbTMMの調査項目およびデータ利用契約を進めている英国のUK Biobankに対して適用することで、国内外のコホートによる調査項目で共通に扱える部分についての標準化を進めている。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
当初の見込みより遅れていたリファレンスとなるゲノムグラフの構築について、国際プロジェクトであるvgの開発が進展し、ようやくヒトゲノムレベルの巨大なゲノムグラフ構築が実用化される見込みが立ってきた。またゲノムの変異について単純なSNPやindelに加え、ロングリードシーケンサーによる大規模な構造変異SVのデータも増えてきている。このため、バリアント情報標準化研究会を立ち上げ、ゲノムグラフ技術と構造変異のアノテーションの融合および標準化について検討した。これをもとに日本人ゲノム変異のRDFによるデータ表現の標準化を国内の主要なバリアントデータベースTogoVarおよびMGeND, JVar, DPVと連携して進めてきている。一方で、コホート研究の調査項目である健康情報や診療情報の統合利用のためにUK Biobankの情報に対しても、東北大学のdbTMMとのマッピングによる比較解析の基盤整備に着手した。本研究では、この2つの課題の統合的な利用を目指しているが、国際連携における技術開発の進展に依存している部分もあり、現状では十分な完成を見ることができないと判断し、研究機関を1年間延長してしっかりとした成果につなげることとした。
|
Strategy for Future Research Activity |
ヒトゲノムレベルでのゲノムグラフ構築の目処が立ってきたため、リファレンスとなるデータの整備を進め、バリアント情報標準化研究会で進めてきたゲノムグラフとアノテーションの標準化による統合を行う。とくに構造変異についてはgnomAD SVやdbVarなどをもとに独自のRDF設計を検討していたが、汎用的に表現するためにはゲノムグラフを利用したRDFモデルを構築すること標準化につながる。これはゲノムグラフに対するアノテーションと同義であり、今年度の研究開発によって情報統合のベストプラクティスとなる標準化を実現したい。またdbTMMとUK Biobankに対するオントロジーのマッピングおよび共通項目の標準化を進めることで、ゲノム情報とコホート研究を統合的に扱うための技術開発をまとめていく。マッピングされたオントロジーの組み合わせからセマンティックな類似度を計算するための手法および、質的な情報と量的な情報をあわせて評価関数とする手法の開発を継続し、ゲノム情報と複数のバイオバンクの情報を統合して類似のサンプルを統合的に解析する手法の完成を目指す。
|
Causes of Carryover |
研究年度を1年延長することとしたため、次年度の研究打ち合わせ等にかかる費用を予算として残した。
|
Research Products
(21 results)