2021 Fiscal Year Research-status Report
Development of research data packaging method for data-driven research
Project/Area Number |
21K18024
|
Research Institution | National Institute for Materials Science |
Principal Investigator |
田辺 浩介 国立研究開発法人物質・材料研究機構, 統合型材料開発・情報基盤部門, 主任エンジニア (70409788)
|
Project Period (FY) |
2021-04-01 – 2023-03-31
|
Keywords | 研究データ管理 / データパッケージング / 機関リポジトリ / RO-Crate / オープンサイエンス |
Outline of Annual Research Achievements |
2021年度は、研究代表者の所属組織のデータリポジトリである「Materials Data Repository (MDR)」(https://mdr.nims.go.jp)上で公開されている実験データのファイルを対象として、RO-crateによる研究データパッケージの作成を行った。作成した研究データパッケージには、パッケージの作成対象である実験データのファイルに加えて、データ登録者やデータ名称のようなデータ流通に関するメタデータ、ならびに実験の測定値などの材料関係のメタデータを含んでいる。 また、同データリポジトリに対して、RO-crateパッケージファイルのインポート機能の追加開発を行い、リポジトリの試験環境において前述のパッケージファイルの登録を行えることを確認した。 RO-crateの仕様では、パッケージの内容を表すメタデータはRDF(JSON-LD)で記述するようになっている。これはメタデータの記述の柔軟性と表現力の高さを備えており、データリポジトリの管理者が定める登録や検索のための情報の記述には優れるものの、材料関係の多様なメタデータを最初からすべてRDFで記述できるとは限らないという点が、研究データパッケージの作成の際の課題として挙げられる。このため、すでにMDRに材料研究データを登録している研究者に対してヒアリングを行い、材料関係のメタデータを記述するための簡易メタデータスキーマである「MDR Schema」(https://doi.org/10.48505/nims.3239)を新たに作成した。このスキーマに準拠したYAMLファイルをRO-crateのパッケージ内に含めることで、パッケージの作成時に必要な材料データの記述を容易に行えるようにしている。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
RO-crateファイルの作成とデータリポジトリへのインポートを行うためのスクリプト、ならびにデータリポジトリ側でのRO-crateファイルのインポート機能の開発は順調に実施されている。 一方、報告書記述時点では対象となる研究データの種類が少なく、本研究で目的としている多様な材料データの記述を試行するまでには至っていない。また、現状ではすでに公開されているデータのみが対象となっており、実験によるデータの取得時にパッケージを作成するユースケースが検証できていない。
|
Strategy for Future Research Activity |
研究者への材料研究データ作成・登録の協力依頼のもと、研究データパッケージの作成対象とするデータの種類・事例を増やすことで、材料科学における研究データパッケージ、ならびに材料情報の簡易記述スキーマであるMDR Schemaの有効性や、パッケージ作成に関わる課題を明らかにしていく。
|
Causes of Carryover |
当初外部発注を予定していたアプリケーション開発の一部を自主開発に切り替えたため。残額はごく僅少であり、次年度への影響は想定していない。
|