2022 Fiscal Year Research-status Report
意味的な妥当性・検索性能・学習精度を考慮したイベント情報のナレッジグラフ化の研究
Project/Area Number |
22K18008
|
Research Institution | National Institute of Advanced Industrial Science and Technology |
Principal Investigator |
江上 周作 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 研究員 (20846000)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Keywords | 知識グラフ / メタデータ表現モデル / グラフ表現学習 / イベント知識グラフ / リンク予測 / セマンティックWeb |
Outline of Annual Research Achievements |
様々なデータを「主語,述語,目的語」の三つ組み(トリプル)形式で関連付けるナレッジグラフ(KG)は,観測データなどの時空間的に生起する事象(イベント)の記述にも用いることができ,このようなKGをイベント中心ナレッジグラフやイベントナレッジグラフ(イベントKG)と称する.イベントKG化には,イベントノードを中心にして主語,述語,目的語,その他の情報をリンクするパターン(イベント中心モデル)や,トリプルごとに述語のインスタンスを作成するパターン(Singleton Property),トリプルを1つのリソースとして扱い,トリプルのトリプルを作成するパターン(RDF-star)など,異なるメタデータ表現モデルが存在する.本研究では,これらのメタデータ表現モデルの実用上の利点と欠点の特性を明らかにすることを目指す.今年度は,KGの機械学習応用のためのベクトル空間埋め込みの観点から分析するため,イベントKGに各メタデータ表現モデルを適用したデータセットを作成した.さらに,各メタデータ表現モデルを適用したデータに,KG埋め込みモデル(TransE)を適用し,トリプルのリンク予測の実験を行った.その結果,リンク予測においてRDF-starやSingleton Propertyモデルが優れていることが明らかとなり,その要因を分析して考察した.実験と考察の過程で,全てのメタデータ表現モデルの意味表現を同等に正しく学習できるKG埋め込みモデルが存在しないことが判明したため,新たな埋め込みモデルの開発に取り組むこととなった.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初一年目に行う予定であった,検索効率やデータ格納の観点からの実験は,直近に類似の研究が増加したため,この観点での実験の新規性と必要性が薄れることとなった.そこで,計画を前倒しして,当初2年目に行う予定であった機械学習応用の観点からの実験を開始し,おおむね当初の計画通りに達成している.また,当初予期していなかった埋め込みモデル側の課題が明らかになり,これを解決するための手法の提案にも着手したことで,当初の計画を超えた成果が期待できるようになった.
|
Strategy for Future Research Activity |
各メタデータ表現モデルの意味表現を適切に学習することができるモデルの開発を行い,これを用いてイベントKGの埋め込みにおける,各メタデータ表現モデルの特性差を分析する.
|
Causes of Carryover |
当初初年度に行う予定であった実験については,直近に類似の研究が増加したため実験の優先度が下がり,次年度に行う予定であった実験を前倒しして着手した.これにより,当該年度の使用予算額に変更が生じた.実験を前倒ししたことで,当初予期していなかった新たな課題が明らかになり,翌年度分として請求した助成金と合わせて追加実験に使用する予定である.
|