2019 Fiscal Year Research-status Report
日本人のゲノム・健康・診療情報と公共知識ベースのセマンティック統合システムの開発
Project/Area Number |
18K11545
|
Research Institution | 大学共同利用機関法人情報・システム研究機構(機構本部施設等) |
Principal Investigator |
片山 俊明 大学共同利用機関法人情報・システム研究機構(機構本部施設等), データサイエンス共同利用基盤施設, 特任准教授 (60396869)
|
Co-Investigator(Kenkyū-buntansha) |
荻島 創一 東北大学, 東北メディカル・メガバンク機構, 教授 (40447496)
川島 秀一 大学共同利用機関法人情報・システム研究機構(機構本部施設等), データサイエンス共同利用基盤施設, 特任准教授 (50314274)
藤原 豊史 大学共同利用機関法人情報・システム研究機構(機構本部施設等), データサイエンス共同利用基盤施設, 特任助教 (80815176)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Keywords | 日本人ゲノム / ゲノムグラフ / セマンティック・ウェブ / データベース / 情報統合 |
Outline of Annual Research Achievements |
本研究では、日本人のゲノム情報を活用するための技術基盤構築および健康情報や診断情報のセマンティクスに基づいたデータ統合を目指している。このため日本人ゲノム情報および健康情報・診断情報をもつdbTMMを開発している東北大学東北メディカル・メガバンク機構および、セマンティック・ウェブ技術によるデータベース統合のための技術開発を進めているライフサイエンス統合データベースセンターが協力し研究開発を進めている。今年度は、継続してゲノムグラフのヒトゲノムおよび日本人ゲノムへの適用を検討したが、現状ではまだリファレンスとなる大規模なゲノムグラフの構築を完了するには技術的な課題が多く、利用可能な個人ゲノムの長鎖シーケンスも限られるため、引き続き技術動向をフォローしていく必要がある。ゲノムグラフとその座標系に対するアノテーション等の知識のマッピングについては、RDFを用いた微生物のゲノムグラフに対するアノテーショントランスファーの実験を行うなどの準備を進めた。一方で、健康情報・診療情報については、dbTMMの調査項目と既存のオントロジーのマッピングを行った。これにより、血液学検査・生化学的検査・尿検査・検査データ項目についてはClinical Measurement Ontology (CMO)を用いることで、また飲酒・喫煙・メンタルヘルスなどについては表現系と環境曝露を扱うPhenX toolkitのプロジェクトで開発しているオントロジーを用いることで記述できることが分かった。既存のオントロジーでdbTMMの調査項目を同じ粒度ですべてカバーすることはできないが、国内外のコホートによる調査項目で共通に扱える部分については標準化を進められる目処が立ってきたといえる。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
ヒトゲノムのゲノムグラフ化と健康情報や診療情報との統合は挑戦的な課題であるが、本年度の計画にあった公共データベースにおけるエピゲノミクスや変異と疾患の情報をRDFで連携するための基盤整備は、Med2RDF、TogoVar、MGeND、JVarなど医科学データベースおよびバリアントのデータベースにおけるRDFの標準化に取り組みある程度進めることができた。またゲノムグラフのRDF化とそれに対するアノテーション等の対応付けについても実験を進めることができた。さらに、コホート研究から得られる健康情報や診療情報を複数のバイオバンクをまたいで対応させるためのオントロジーの調査およびマッピングを進めることができた。リファレンスとなる良いゲノムグラフの構築については、国際的な技術開発の進展に依存するところがあり当初計画より遅れている部分もあるが、将来的には必ず役に立つ技術であると期待されるため今後も継続的に取り組む。
|
Strategy for Future Research Activity |
まずはヒトゲノムのリファレンスとなるゲノムグラフの構築に継続して取り組む。並行してヒトゲノムにおいてゲノムグラフとアノテーションをRDFでマッピングすることで、日本人ゲノム固有の領域等についても外部情報との連携ができるよう整備を進める。健康情報・診療情報については、本年度に検討したオントロジーへのマッピングをdbTMMの実データに適用することでRDF化を進める。これをもとに、国内外のコホートによる調査項目で共通に扱える部分について統合的な解析を実現するために、UK Biobankの情報を入手しdbTMMと同様のマッピングを行うことで統合・比較解析のための基盤整備を進める。この際に、マッピングされたオントロジーの組み合わせからセマンティックな類似度を計算するための手法を開発する。さらに、オントロジーの階層分類を利用する既存の手法だけでは数値データを含むような量的な形質が類似度に反映されないため、質的な情報と量的な情報をあわせて評価関数とできるような手法の開発に取り組む。これらをもとに、複数のバイオバンクの情報を統合して類似のサンプルを検索し、ゲノム情報との対応を試みる解析手法の開発を目指す。
|
Causes of Carryover |
基本的には出張や国際連携等、海外での学会参加も含め計画通り支出を行っているが、今年度ライセンス購入予定であったUK Biobankのデータベースについては、利用を開始するための研究準備を先行させたため、来年度に繰り越すこととした。
|
Research Products
(53 results)