• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2019 Fiscal Year Annual Research Report

Development of novel directory function for efficient integration and retrieval of life science distributed metadata

Research Project

Project/Area Number 17K00424
Research InstitutionInstitute of Physical and Chemical Research

Principal Investigator

小林 紀郎  国立研究開発法人理化学研究所, 情報システム本部, 開発ユニットリーダー (20415160)

Co-Investigator(Kenkyū-buntansha) 山本 泰智  大学共同利用機関法人情報・システム研究機構(機構本部施設等), データサイエンス共同利用基盤施設, 特任准教授 (50470076)
Project Period (FY) 2017-04-01 – 2020-03-31
KeywordsSPARQL / SPARQLエンドポイント / RDF / 連合検索 / メタデータ / 生命科学データ / 上位オントロジー
Outline of Annual Research Achievements

これまでの研究で生命科学のRDFデータセットに含まれるクラスは、同種のデータであってもデータセット毎に付与するクラスが異なることがあり、連合検索等の障害になっていることが分かっていた。このクラスの差異を解消するため、平成30年度の研究により、上位概念をまとめたオントロジー(以下、上位オントロジー)としてOnline Mendelian Inheritance in Man (OMIM)を用いてクラスの集約を行うプログラムの開発を進めていた。令和元年度においては、より多面的かつより多くのクラスに集約できるよう、Semanticscience Integrated Ontology (SIO)やMedical Subject Headings (MeSH)を含む6種のオントロジーに対応するよう拡張し、特にSIOとMeSHにより多くのクラスが集約されることが分かった。
YummyData.org と呼ぶ生命科学系のSPARQLエンドポイントの稼働率や高速性等を評価しランキングするサイトに掲載されている上位50のSPARQLエンドポイントを対象に、クラスやクラス間関係を含むメタデータを取得するとともに、上記6種の上位オントロジーのクラスでまとめ上げた結果も合わせてメタデータとして扱えるようメタデータスキーマを定義した。ここで、上位オントロジーでまとめることができたクラス数は、今のところ上記50のSPARQLエンドポイントが持つクラスの約10%にとどまっているが、これはクラス名のみを用いた単純なマッチングによるもので、表記ゆれ等の対応が必要であるという課題が残された。
しかしながら、以上の研究成果により、目標であった生命科学分散メタデータの高効率な統合と検索のための新規ディレクトリ機能に必要なメタデータの仕様が確立できた。さらに、本研究の成果物を理研メタデータベースと呼ぶメタデータ公開基盤より公開した。

  • Research Products

    (5 results)

All 2020 2019

All Presentation (5 results) (of which Int'l Joint Research: 4 results)

  • [Presentation] LOD Surfer: クラス間関係に基づく連合検索を利用したLOD探索2020

    • Author(s)
      山口敦子、小林紀郎、山本泰智、桝屋啓志、古崎晃司
    • Organizer
      2020年度 人工知能学会全国大会(第34回)
  • [Presentation] UmakaData extension: Toward Realization of a Practical SPARQL Endpoint Discovery Service for Life Sciences.2019

    • Author(s)
      Norio Kobayashi, Yasunori Yamamoto, and Atsuko Yamaguchi
    • Organizer
      Semantic Web Applications and Tools for Health Care and Life Sciences (SWAT4HCLS) 2019
    • Int'l Joint Research
  • [Presentation] OME Core Ontology: An OWL-based Life Science Imaging Data Model2019

    • Author(s)
      Norio Kobayashi, Josh Moore, Shuichi Onami and Jason R. Swedlow
    • Organizer
      Semantic Web Applications and Tools for Health Care and Life Sciences (SWAT4HCLS) 2019
    • Int'l Joint Research
  • [Presentation] On Bringing Bioimaging Data into the Open(-World)2019

    • Author(s)
      Josh Moore, Norio Kobayashi, Susanne Kunis, Shuichi Onami and Jason R. Swedlow
    • Organizer
      Semantic Web Applications and Tools for Health Care and Life Sciences (SWAT4HCLS) 2019
    • Int'l Joint Research
  • [Presentation] Finding the best RDF data by Umaka Suite.2019

    • Author(s)
      Yasunori Yamamoto and Atsuko Yamaguchi
    • Organizer
      Semantic Web Applications and Tools for Health Care and Life Sciences (SWAT4HCLS) 2019
    • Int'l Joint Research

URL: 

Published: 2021-01-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi