研究課題/領域番号 |
18K11545
|
研究機関 | 大学共同利用機関法人情報・システム研究機構(機構本部施設等) |
研究代表者 |
片山 俊明 大学共同利用機関法人情報・システム研究機構(機構本部施設等), データサイエンス共同利用基盤施設, 特任助教 (60396869)
|
研究分担者 |
荻島 創一 東北大学, 東北メディカル・メガバンク機構, 教授 (40447496)
川島 秀一 大学共同利用機関法人情報・システム研究機構(機構本部施設等), データサイエンス共同利用基盤施設, 特任助教 (50314274)
藤原 豊史 大学共同利用機関法人情報・システム研究機構(機構本部施設等), データサイエンス共同利用基盤施設, 特任研究員 (80815176)
|
研究期間 (年度) |
2018-04-01 – 2021-03-31
|
キーワード | 日本人ゲノム / ゲノムグラフ / セマンティック・ウェブ / データベース / 情報統合 |
研究実績の概要 |
本研究では、日本人のゲノム情報を活用するための技術基盤構築および健康情報や診断情報のセマンティクスに基づいたデータ統合を目指している。このため日本人ゲノム情報および健康情報・診断情報をもつdbTMMを開発している東北大学東北メディカル・メガバンク機構および、セマンティック・ウェブ技術によるデータベース統合のための技術開発を進めているライフサイエンス統合データベースセンターが協力し研究開発を進めている。初年度となる今年度は、日本人ゲノム情報については、世界的にも最先端の取り組みであるゲノムグラフ技術を応用した、国際標準ゲノム配列と日本人のリファレンスゲノム配列を同時に扱えるゲノムグラフの構築に取り組んだ。このためゲノムグラフ技術を開発している国際チームとの国際会議BioHackathonでの技術交流およびカリフォルニア大学で開催された研究会への参加を行い、染色体レベルでのゲノムグラフ構築の様々な手法を検討した。この中で、様々な課題が出てきており、変異情報をもつVCFファイルの情報を含めたグラフにおけるハプロタイプの扱いについては現状ではまだ技術的に開発途上であることが分かってきたほか、グラフ構築の手法ごとに生成されるグラフの粒度が異なるため、今後引き続きユースケースに応じた適切な手法の検討を進める必要がある。これらの中間成果の一部については2019年3月に開催した第10回ゲノムグラフ研究会で報告した。並行して、dbTMMのデータを統合利用するために、健康調査情報項目から解析に利用する項目の調査、および既存オントロジーとの対応について検討を続けている。今後は、まずは特定の疾患遺伝子に対応するゲノム領域をターゲットとした解析フローの構築に取り組み、関連情報との統合的解釈が可能なシステム開発を目指す。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本年度の研究計画は、ゲノム情報については、ゲノム・グラフを構築するためのツールvgを利用して日本人ゲノムへの適用を行い、実用上の問題点を検証する。健康情報・診療情報については、dbTMMに含まれるデータのうち外部のデータとリンク可能なものを選択し、利用可能なオントロジーを調査するとともにRDFによるデータモデルを検討するものであった。前者についてはvgを用いた日本人ゲノムグラフの構築に実際に取り組み、グラフデータの作成を行っており、目的とする到達点には達しているといえる。一方で、ゲノムグラフ自体がまだ発展途上の技術であり、よりよいグラフの構築のための手法の改善および実利用を考えた場合の課題は数多く残されており、次年度の目標であるゲノムグラフにおける座標系のセマンティクスの標準化とあわせて対応を進める。後者についてはdbTMMで利用可能な項目の検証および対応するオントロジーとの連携について打ち合わせを重ねている。現状では対象となるデータセット毎に利用可能な項目が異なる状況があるが次年度には解決されると見込んでいる。
|
今後の研究の推進方策 |
2019年2月に、東北大学より新バージョンの日本人ゲノムリファレンス配列JG1が公開されたため、これをベースにしたゲノムグラフの構築を行い、今後の解析フローの開発に進むことを予定している。一方ゲノムグラフ上でのハプロタイプの扱いについては国際開発チームとの連携を継続し、最新技術にキャッチアップしつつ標準化や可視化などの応用を課題として取り組む予定である。医科学データとの連携においては、とくにAMEDとGA4GHの連携で3月に開催したGEM Japan Workshopにおいて、これまで開発してきたMed2RDFの主要医科学データベースのモデルと、国際的に利用されているSEPIOオントロジーとのすり合わせが検討課題として挙げられた。この点を踏まえつつ、利用可能な健康調査情報項目との統合を進めていく。
|
次年度使用額が生じた理由 |
研究開発のために購入予定だったコンピュータが、今年度はスパコン等を利用して作業を進めることで不要となり物品費が予定より少額となったため。一方で、研究開発に国際連携が増えてきていることもあり、計画より前倒しで国際学会への参加を行った。次年度使用額は研究分担者の海外出張および学会参加のための費用に充て、さらなる国際連携および成果発表を図ることを予定している。
|