本研究は,オープンサイエンスへの取り組みを支援することを目的に,学術情報(特に自然言語で記述されたテキスト情報)のLinked Data化を実施した. 具体的には,論文や特許,プロジェクト情報等を対象に文書の構造を解析し,Linked Dataを構成する要素(主語,述語,目的語,場所,時間など)を抽出,抽出語句をノードとするグラフ上のネットワーク(Linked Data)を構築するにあたり,ネットワークのスキーマ設計,およびノードへのオントロジーのアノテーション等に関する研究開発を行った.これにより非構造化データであった学術情報の意味的な分析や計量的な分析を容易にするものである. 研究成果としては,論文の引用情報に依らない技術的な内容に基づいた科学技術マップ(Mapping Science)の構築手法を確立し,IEEE論文やNSF-科研のプロジェクト情報など,更にWeb of Scienceにおけるトップ1%論文を対象としたマップを複数作成し,インターネット上で公開した(https://jipsti.jst.go.jp/foresight/mapping_science/). また昨今,人工知能研究において重要なトピックとなりつつある説明可能なAIシステムの実現にむけて,論理推論と機械学習を組み合わせた新しいアプローチを研究開発するための評価セットとなるナレッジグラフの構築にも応用した.
|