2023 Fiscal Year Research-status Report
意味的な妥当性・検索性能・学習精度を考慮したイベント情報のナレッジグラフ化の研究
Project/Area Number |
22K18008
|
Research Institution | National Institute of Advanced Industrial Science and Technology |
Principal Investigator |
江上 周作 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 研究員 (20846000)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Keywords | 知識グラフ / メタデータ表現モデル / グラフ表現学習 / イベント中心知識グラフ / セマンティックWeb / ナレッジグラフ / オントロジー / RDF-star |
Outline of Annual Research Achievements |
様々なデータを「主語,述語,目的語」の三つ組み(トリプル)形式で関連付けるナレッジグラフ(KG)は,観測データなどの時空間的に生起する事象(イベント)の記述にも用いることができ,このようなKGをイベント中心ナレッジグラフやイベントナレッジグラフ(イベントKG)と称する.イベントKG化には,イベントノードを中心にして主語,述語,目的語,その他の情報をリンクするイベント中心モデルや,トリプルごとに述語のインスタンスを作成するSingleton Property(SP),トリプルのトリプルを作成するRDF-starなど,異なるメタデータ表現モデル(MRM)が存在する.本研究では,これらのMRMの実用上の利点と欠点の特性を明らかにすることを目指す.初年度はKGの機械学習応用のためのベクトル空間埋め込みの観点から分析するため,イベントKGに各MRMを適用したデータセットを作成し,各データセットに埋め込みモデル(TransE)を適用することでリンク予測タスクの評価を行った.その結果,リンク予測ではRDF-starとSPが優れていることが明らかとなった.実験と考察の過程で,全てのMRMの意味表現を公平に学習できる埋め込みモデルが存在しないことが判明した.そこで,今年度は様々なMRMに適応可能な新たな埋め込みモデルの開発を中心に研究を進めた.具体的には,これまで困難であったRDF-starの持つ引用符トリプル(QT)とその多層ネスト構造の埋め込みが可能な世界初のモデルを開発し,ノードの分類,クラスタリング等のタスクで既存手法を上回る性能を達成した.さらに後続の研究のためのベンチマーク環境を構築した.これにより,「トリプルのトリプルのトリプル」のような複雑なKGの意味表現を学習したデータマイニングが可能になり,さらに今後我々のモデルをベースラインとした新たなモデルの開発が期待できる.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
機械学習応用の観点での評価実験において,当初予期していなかった埋め込みモデル側の課題が明らかになったが,これを解決する新たな埋込モデルとベンチマーキングデータセットの開発に成功したため,概ね当初の計画通りに進展している.
|
Strategy for Future Research Activity |
提案したナレッジグラフ埋め込みモデルを用いた広範な実験を行い、各メタデータ表現モデルの特性を分析する。また、類似のモデルや評価実験の研究が発表された場合にはそれらを再利用した拡張や比較実験を検討する。
|
Causes of Carryover |
当初予期していなかった新たな課題が明らかになり、追加の実験を優先したため物品費に予算を割り当てた。研究成果発表のための旅費・掲載費を翌年度分として使用する予定である。また、最終年度でローカルの計算機と電子計算機を利用した実験が増加するため、これに使用する予定である。
|
Research Products
(12 results)