2021 Fiscal Year Research-status Report
セマンティックWebデータの多様性に対する推論と学習の基盤技術
Project/Area Number |
18K11547
|
Research Institution | The University of Electro-Communications |
Principal Investigator |
兼岩 憲 電気通信大学, 大学院情報理工学研究科, 教授 (00342626)
|
Project Period (FY) |
2018-04-01 – 2023-03-31
|
Keywords | セマンティックウェブ / RDFデータ |
Outline of Annual Research Achievements |
2021年度は、RDFデータやオントロジーによる2つの異なるレベルのセマンティックWebデータを学習して、リンク関係、論理的関係、およびクラス属性を推定する学習型推論システムを開発した。
リンクトデータを表現するRDFデータ(主語、述語、目的語からなるトリプル)に対する埋め込み学習とともに、オントロジーを表現する記述論理の知識ベースに対する埋め込み学習を実装した。これにより、セマンティックWebデータから記述論理の推論アルゴリズムを使って論理的に推論するだけでなく、訓練済みの学習器から実データに不足している知識を新たに推定できるようになっている。即ち、従来の推論システムでは論理的な帰結しか導けないのに対して、学習型推論システムでは知識ベースに含まれていない概念のインスタンスデータ、個体間の二項関係、概念間の包含関係などを導くことができる。今回、RDFデータとオントロジーの両タイプに機械学習を適用することで、ドメインオントロジーをリンクトデータに融合させた知識ベースでの推論が期待できる。
さらに、前年度までに開発した特徴抽出の手法により、リンクトデータと類似性の高いグラフデータベースに対して、不要な知識をスキップしてデータを特徴ベクトル化する手法を適用した。これは人間関係や科学論文関係などのようなネットワーク構造で表されるグラフデータにおいて、各対象物(人間や科学論文)がどのようなクラスに属すか学習する。本分野で用いられているグラフニューラルネットワーク(GNN)と本研究が提案している特徴抽出の手法を組み合わせて高い推定能力(正解率)を実現した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
RDFデータセット(リンクトデータ)に限らずオントロジーのような知識を合わせて機械学習に適用するためには、グラフ構造だけでなく論理構造をも埋め込んだ学習方法が必要になってくる。本年度は記述論理の知識ベースを学習して、そこから概念のインスタンスデータ、個体間の二項関係、概念間の包含関係などを正しく導けるように機械学習のプロセスを改善することができた。
|
Strategy for Future Research Activity |
次年度以降は、セマンティックWebデータから検索や推論できなかった知識を補うために、訓練済みの学習器を用いて実データに不足している情報や知識を推定 できる学習型推論システムを開発していく予定である。
|
Causes of Carryover |
前年度から研究論文の投稿費用や一部実験用計算機の購入時期が遅れている。次年度の評価実験で使用する実験用計算機の充実のために使用する予定である。
|
Research Products
(3 results)