2022 Fiscal Year Annual Research Report
A Method of Reasoning and Learning for Various Data on the Semantic Web
Project/Area Number |
18K11547
|
Research Institution | The University of Electro-Communications |
Principal Investigator |
兼岩 憲 電気通信大学, 大学院情報理工学研究科, 教授 (00342626)
|
Project Period (FY) |
2018-04-01 – 2023-03-31
|
Keywords | セマンティックウェブ / RDFデータ |
Outline of Annual Research Achievements |
最終年度は、これまで開発した学習型推論システムを用いて推論や学習の検証実験を行った。この検証実験は、(i)リンクトデータによるRDFデータに対するオントロジーの推論タスク、および(ii)グラフ構造をもつデータセットに対するクラス分類タスク、といった機械学習について2つのタスクの評価を行っている。 1つ目の検証実験では、RDFデータ形式上のOWLオントロジーとして記述されているGO(遺伝オントロジー)、FoodOn(食品オントロジー)、HeLiS(健康オントロジー)を用いて実用的なオントロジーデータで学習型推論システムの有効性を評価した。本研究の成果として、オントロジーから記述論理による推論アルゴリズムによって推論できない、機械学習による包含関係の推定を実現している。特に、オントロジーに含まれる注釈文(自然言語文)から単語の共起や文脈を抽出する埋め込み手法や、オントロジーの論理的な公理を使って機械学習する精度の向上を提案している。その結果、従来手法よりも高い正解率でオントロジー上の推論タスクを実現させている。 2つ目の検証実験では、科学論文の引用関係、Web上のリンク関係、Wikipedia内の人物などの関係を表すグラフデータセット(Pubmed, Texas, Actorなど)を用いて各ノードに対するクラス属性を推定する能力を評価した。本研究の学習型推論システムは、グラフデータからグラフ構造を直接的に抽出し有益な情報だけを特徴選択する手法を提案している。この手法をグラフニューラルネットワーク(GNN)へ適用したとき、クラス属性の分類タスクで高い正解率を実現することを確認した。この成果の大きな意義は、グラフデータ上で隣接するノードが異なるクラス属性をもつ異種性グラフと呼ばれるデータセットでも機械学習の精度を低下させない点にある。
|