2023 Fiscal Year Annual Research Report
A study on technologies for utilizing multi-granular distributed knowledge graphs
Project/Area Number |
22H03694
|
Allocation Type | Single-year Grants |
Research Institution | University of Tsukuba |
Principal Investigator |
天笠 俊之 筑波大学, 計算科学研究センター, 教授 (70314531)
|
Co-Investigator(Kenkyū-buntansha) |
北川 博之 筑波大学, 国際統合睡眠医科学研究機構, 教授 (00204876)
橋本 武彦 (BouSavong) 筑波大学, 計算科学研究センター, 助教 (80910760)
塩川 浩昭 筑波大学, 計算科学研究センター, 准教授 (90775248)
|
Project Period (FY) |
2022-04-01 – 2026-03-31
|
Keywords | RDF / 知識グラフ / データ統合 |
Outline of Annual Research Achievements |
【研究項目1 MD知識グラフの構造的・意味的要約生成】(担当:天笠,サポート:塩川)エンティティに対応する頂点を類似したグループごとにスーパーノードとしてまとめることで,階層的な索引を構築する.この初期的な検討結果を,国内学会で発表した. 【研究項目2 高速かつ分散透過なMD知識グラフ検索】(担当:塩川,サポート:天笠)(1) フォグ環境における分散RDF推論を対象に,フォグノードとクラウドサーバの間で動的に不可分散を行う手法を開発した.(2) PCクラスタ環境を想定し,Apache Spark SQLを対象に,高速なRDF問合せ処理のためのデータ分割手法を開発した.いずれの成果も,査読付き国際会議論文として発表した. 【研究項目3 MD知識グラフと異種データの連携】(担当:北川,サポート:天笠)エンティティの直接的なマッチング(エンティティリンキング)だけではなく,エンティティの意味的な特徴に着目したマッチングを検討した.(1) 大規模言語モデルを用いた実体マッチングにおいて,モデルの学習コストを低減することを可能にするアダプタを導入した手法を提案し,その有効性を実験によって示した.(2) リレーショナルデータベースを対象に,これらを仮想的なRDF知識グラフとしてアクセス可能にする手法を提案した.特に,各レコードの識別子に着目し,これらを適切なURIに変換するための関数をユーザ定義可能にする枠組みを提案し,その有効性を実験により確認した.これらの成果は,いずれも査読付き国際会議論文として発表した. 【研究項目4 プロトタイプ構築および性能評価】(担当:Bou,サポート:全員)プロトタイプシステム構築に向けて,他の研究項目と連携し,各手法の基礎的な部分を実装,評価した.その成果はぞれぞれの対応する論文にて公表済みである.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
【研究項目1 MD知識グラフの構造的・意味的要約生成】(担当:天笠,サポート:塩川)【研究項目2 高速かつ分散透過なMD知識グラフ検索】(担当:塩川,サポート:天笠)【研究項目3 MD知識グラフと異種データの連携】(担当:北川,サポート:天笠)については,基本的な手法を検討するとともに,その成果をそれぞれ国内,国外の学会にて発表済みである. 【研究項目4 プロトタイプ構築および性能評価】(担当:Bou,サポート:全員)については,ぞれぞれの研究項目においてプロトタイプを実装し,その有効性を検証している.
|
Strategy for Future Research Activity |
【研究項目1 MD知識グラフの構造的・意味的要約生成】(担当:天笠,サポート:塩川)【研究項目2 高速かつ分散透過なMD知識グラフ検索】(担当:塩川,サポート:天笠)【研究項目3 MD知識グラフと異種データの連携】(担当:北川,サポート:天笠)については,当初の計画に基づき手法のブラッシュアップを進めるとともに,最終的な統合に向けて準備を進める. 【研究項目4 プロトタイプ構築および性能評価】(担当:Bou,サポート:全員)については,上記の成果をもとに最終的な評価に向けて,システムの開発並びに評価用のデータセットの選定,並びに,環境構築を行う予定である,.
|