• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

A study on technologies for utilizing multi-granular distributed knowledge graphs

Research Project

Project/Area Number 23K24949
Project/Area Number (Other) 22H03694 (2022-2023)
Research Category

Grant-in-Aid for Scientific Research (B)

Allocation TypeMulti-year Fund (2024)
Single-year Grants (2022-2023)
Section一般
Review Section Basic Section 62020:Web informatics and service informatics-related
Research InstitutionUniversity of Tsukuba

Principal Investigator

天笠 俊之  筑波大学, 計算科学研究センター, 教授 (70314531)

Co-Investigator(Kenkyū-buntansha) 北川 博之  筑波大学, 国際統合睡眠医科学研究機構, 教授 (00204876)
橋本 武彦 (BouSavong)  筑波大学, 計算科学研究センター, 助教 (80910760)
塩川 浩昭  筑波大学, 計算科学研究センター, 准教授 (90775248)
Project Period (FY) 2022-04-01 – 2026-03-31
Project Status Granted (Fiscal Year 2024)
Budget Amount *help
¥16,640,000 (Direct Cost: ¥12,800,000、Indirect Cost: ¥3,840,000)
Fiscal Year 2025: ¥4,420,000 (Direct Cost: ¥3,400,000、Indirect Cost: ¥1,020,000)
Fiscal Year 2024: ¥4,030,000 (Direct Cost: ¥3,100,000、Indirect Cost: ¥930,000)
Fiscal Year 2023: ¥4,030,000 (Direct Cost: ¥3,100,000、Indirect Cost: ¥930,000)
Fiscal Year 2022: ¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Keywords知識グラフ / RDF / データ統合 / 多粒度 / 索引 / 多粒度分散知識グラフ / 分散問合せ
Outline of Research at the Start

【研究項目1】エンティティに対応する頂点を類似したグループごとにスーパーノードとしてまとめることで,階層的な索引を構築する.今年度は,前年度までに検討した知識グラフ概要構築の効率化について検討を進める.
【研究項目2】大規模知識グラフに対する分散問合せにおける,統計情報を利用した問合せプランニングの問題として定式化し,手法を具体化する.
【研究項目3】大規模言語モデル(LLM)を用いた実体リンキング手法をベースとして,実体を対象として,複数の知識グラフを連携する.
【研究項目4】プロトタイプシステム構築に向けて,他の研究項目と連携し,各手法の基礎的な部分を実装,評価を進める.

Outline of Annual Research Achievements

【研究項目1 MD知識グラフの構造的・意味的要約生成】(担当:天笠,サポート:塩川)エンティティに対応する頂点を類似したグループごとにスーパーノードとしてまとめることで,階層的な索引を構築する.この初期的な検討結果を,国内学会で発表した.
【研究項目2 高速かつ分散透過なMD知識グラフ検索】(担当:塩川,サポート:天笠)(1) フォグ環境における分散RDF推論を対象に,フォグノードとクラウドサーバの間で動的に不可分散を行う手法を開発した.(2) PCクラスタ環境を想定し,Apache Spark SQLを対象に,高速なRDF問合せ処理のためのデータ分割手法を開発した.いずれの成果も,査読付き国際会議論文として発表した.
【研究項目3 MD知識グラフと異種データの連携】(担当:北川,サポート:天笠)エンティティの直接的なマッチング(エンティティリンキング)だけではなく,エンティティの意味的な特徴に着目したマッチングを検討した.(1) 大規模言語モデルを用いた実体マッチングにおいて,モデルの学習コストを低減することを可能にするアダプタを導入した手法を提案し,その有効性を実験によって示した.(2) リレーショナルデータベースを対象に,これらを仮想的なRDF知識グラフとしてアクセス可能にする手法を提案した.特に,各レコードの識別子に着目し,これらを適切なURIに変換するための関数をユーザ定義可能にする枠組みを提案し,その有効性を実験により確認した.これらの成果は,いずれも査読付き国際会議論文として発表した.
【研究項目4 プロトタイプ構築および性能評価】(担当:Bou,サポート:全員)プロトタイプシステム構築に向けて,他の研究項目と連携し,各手法の基礎的な部分を実装,評価した.その成果はぞれぞれの対応する論文にて公表済みである.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

【研究項目1 MD知識グラフの構造的・意味的要約生成】(担当:天笠,サポート:塩川)【研究項目2 高速かつ分散透過なMD知識グラフ検索】(担当:塩川,サポート:天笠)【研究項目3 MD知識グラフと異種データの連携】(担当:北川,サポート:天笠)については,基本的な手法を検討するとともに,その成果をそれぞれ国内,国外の学会にて発表済みである.
【研究項目4 プロトタイプ構築および性能評価】(担当:Bou,サポート:全員)については,ぞれぞれの研究項目においてプロトタイプを実装し,その有効性を検証している.

Strategy for Future Research Activity

【研究項目1 MD知識グラフの構造的・意味的要約生成】(担当:天笠,サポート:塩川)【研究項目2 高速かつ分散透過なMD知識グラフ検索】(担当:塩川,サポート:天笠)【研究項目3 MD知識グラフと異種データの連携】(担当:北川,サポート:天笠)については,当初の計画に基づき手法のブラッシュアップを進めるとともに,最終的な統合に向けて準備を進める.
【研究項目4 プロトタイプ構築および性能評価】(担当:Bou,サポート:全員)については,上記の成果をもとに最終的な評価に向けて,システムの開発並びに評価用のデータセットの選定,並びに,環境構築を行う予定である,.

Report

(2 results)
  • 2023 Annual Research Report
  • 2022 Annual Research Report
  • Research Products

    (30 results)

All 2024 2023 2022

All Journal Article (17 results) (of which Int'l Joint Research: 3 results,  Peer Reviewed: 17 results,  Open Access: 2 results) Presentation (13 results)

  • [Journal Article] AdapterEM: Pre-trained Language Model Adaptation for Generalized Entity Matching using Adapter-tuning2023

    • Author(s)
      Mugeni John Bosco、Lynden Steven、Amagasa Toshiyuki、Matono Akiyoshi
    • Journal Title

      IDEAS 2023

      Volume: - Pages: 140-147

    • DOI

      10.1145/3589462.3589498

    • Related Report
      2023 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Integration of Knowledge Bases and External Information Sources via Magic Properties and Query-driven Entity Linking2023

    • Author(s)
      Yuuki Ohmori, Hiroyuki Kitagawa, Toshiyuki Amagasa, Akiyoshi Matono
    • Journal Title

      Information Integration and Web Intelligence (iiWAS2023)

      Volume: 14416 Pages: 309-324

    • DOI

      10.1007/978-3-031-48316-5_30

    • ISBN
      9783031483158, 9783031483165
    • Related Report
      2023 Annual Research Report
    • Peer Reviewed
  • [Journal Article] RDF Data Partitioning for?Efficient SPARQL Query Processing with Spark SQL2023

    • Author(s)
      Yamasaki Kosuke、Amagasa Toshiyuki
    • Journal Title

      iiWAS 2023

      Volume: - Pages: 92-106

    • DOI

      10.1007/978-3-031-48316-5_12

    • ISBN
      9783031483158, 9783031483165
    • Related Report
      2023 Annual Research Report
    • Peer Reviewed
  • [Journal Article] TraPM: A Framework for Online Pattern Matching Over Trajectory Streams2023

    • Author(s)
      Trisminingsih, R., Shaikh, S.A., Amagasa, T., Kitagawa, H., Matono, A
    • Journal Title

      iiWAS2023

      Volume: - Pages: 510-525

    • Related Report
      2023 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Efficient Missing Value Imputation by Maximum Distance Likelihood2023

    • Author(s)
      Savong Bou, Toshiyuki Amagasa, Hiroyuki Kitagawa, Salman Ahmed Shaikh, Akiyoshi Matono
    • Journal Title

      2023 IEEE International Conference on Big Data (BigData)

      Volume: - Pages: 331-338

    • DOI

      10.1109/bigdata59044.2023.10386584

    • Related Report
      2023 Annual Research Report
    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] CSER: Enhancing Cybersecurity Entity Recognition Through Multidimensional Feature Fusion2023

    • Author(s)
      Marjan Md Abu、Amagasa Toshiyuki
    • Journal Title

      IEEE Big Data 2023

      Volume: - Pages: 1214-1221

    • DOI

      10.1109/bigdata59044.2023.10386941

    • Related Report
      2023 Annual Research Report
    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] Supporting Practical URI Mappings in Virtual Knowledge Graph-based Relational Data Integration2023

    • Author(s)
      Sato Shogo、Masuda Tadashi、Amagasa Toshiyuki
    • Journal Title

      IEEE Big Data 2023

      Volume: - Pages: 2958-2964

    • DOI

      10.1109/bigdata59044.2023.10386274

    • Related Report
      2023 Annual Research Report
    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] Online Optimized Product Quantization for ANN Queries over Dynamic Database using SVD-Updating2022

    • Author(s)
      Yukawa Kota、Amagasa Toshiyuki
    • Journal Title

      Transactions on Large-Scale Data- and Knowledge-Centered Systems

      Volume: 13470 Pages: 86-102

    • DOI

      10.1007/978-3-662-66146-8_4

    • ISBN
      9783662661451, 9783662661468
    • Related Report
      2022 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] A Graph-Based Blocking Approach for Entity Matching Using Contrastively Learned Embeddings2022

    • Author(s)
      Mugeni John Bosco、Amagasa Toshiyuki
    • Journal Title

      ACM SIGAPP Applied Computing Review

      Volume: 22 Issue: 4 Pages: 37-46

    • DOI

      10.1145/3584014.3584017

    • Related Report
      2022 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] A graph-based blocking approach for entity matching using pre-trained contextual embedding models2022

    • Author(s)
      Mugeni John Bosco、Amagasa Toshiyuki
    • Journal Title

      SAC2022

      Volume: - Pages: 357-364

    • DOI

      10.1145/3477314.3507689

    • Related Report
      2022 Annual Research Report
    • Peer Reviewed
  • [Journal Article] InTrans: Fast Incremental Transformer for Time Series Data Prediction2022

    • Author(s)
      Savong Bou, Toshiyuki Amagasa, Hiroyuki Kitagawa
    • Journal Title

      Proc. 33rd International Conference on Database and Expert Systems Applications (DEXA 2022)

      Volume: 2 Pages: 47-61

    • DOI

      10.1007/978-3-031-12426-6_4

    • ISBN
      9783031124259, 9783031124266
    • Related Report
      2022 Annual Research Report
    • Peer Reviewed
  • [Journal Article] BLOCK-OPTICS: An Efficient Density-Based Clustering Based on OPTICS2022

    • Author(s)
      Yukawa Kota、Amagasa Toshiyuki
    • Journal Title

      DEXA2022

      Volume: - Pages: 291-296

    • DOI

      10.1007/978-3-031-12426-6_26

    • ISBN
      9783031124259, 9783031124266
    • Related Report
      2022 Annual Research Report
    • Peer Reviewed
  • [Journal Article] GPU-Accelerated Reverse K-Nearest Neighbor Search for High-Dimensional Data2022

    • Author(s)
      Tsuihiji Kyohei、Amagasa Toshiyuki
    • Journal Title

      DEMoC-2022

      Volume: - Pages: 279-288

    • DOI

      10.1007/978-3-031-14314-4_28

    • ISBN
      9783031143137, 9783031143144
    • Related Report
      2022 Annual Research Report
    • Peer Reviewed
  • [Journal Article] PR-MVI: Efficient Missing Value Imputation over Data Streams by Distance Likelihood2022

    • Author(s)
      Savong Bou, Toshiyuki Amagasa, Hiroyuki Kitagawa, Salman Ahmed Shaikh, Akiyoshi Matono
    • Journal Title

      Proc. 24th International Conference on Information Integration and Web Intelligence (iiWAS2022)

      Volume: - Pages: 338-351

    • DOI

      10.1007/978-3-031-21047-1_28

    • ISBN
      9783031210464, 9783031210471
    • Related Report
      2022 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Streaming Augmented Lineage: Traceability of Complex Stream Data Analysis2022

    • Author(s)
      Masaya Yamada, Hiroyuki Kitagawa, Salman Ahmed Shaikh, Toshiyuki Amagasa, Akiyoshi Matono
    • Journal Title

      Proc. 24th International Conference on Information Integration and Web Intelligence (iiWAS2022)

      Volume: - Pages: 224-236

    • DOI

      10.1007/978-3-031-21047-1_20

    • ISBN
      9783031210464, 9783031210471
    • Related Report
      2022 Annual Research Report
    • Peer Reviewed
  • [Journal Article] An FPGA-based Accelerator for Regular Path Queries over Edge-labeled Graphs2022

    • Author(s)
      Kento Miura, Ryohei Kobayashi, Toshiyuki Amagasa, Hiroyuki Kitagawa, Norihisa Fujita, and Taisuke Boku
    • Journal Title

      Proceedings of 2022 IEEE International Conference on Big Data (IEEE BigData2022)

      Volume: - Pages: 415-422

    • DOI

      10.1109/bigdata55660.2022.10020406

    • Related Report
      2022 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Region-based Sub-Snapshot (RegSnap): Enhanced Fault Tolerance in Distributed Stream Processing with Partial Snapshot2022

    • Author(s)
      Takdir, Hiroyuki Kitagawa, and Toshiyuki Amagasa
    • Journal Title

      Proceedings of 2022 IEEE International Conference on Big Data (IEEE BigData2022)

      Volume: - Pages: 3374-3382

    • DOI

      10.1109/bigdata55660.2022.10020607

    • Related Report
      2022 Annual Research Report
    • Peer Reviewed
  • [Presentation] SparkSQLによる効率的な問合せ処理のためのワークロードに基づくRDFデータ分割手法2024

    • Author(s)
      山﨑 昂輔,天笠 俊之
    • Organizer
      第16回データ工学と情報マネジメントに関するフォーラム(DEIMフォーラム2024)
    • Related Report
      2023 Annual Research Report
  • [Presentation] ラベルの出現頻度に着目したFPGAを用いた正規パス問合せの提案2024

    • Author(s)
      溝谷 祐大,小林 諒平,藤田 典久,朴 泰祐,天笠 俊之
    • Organizer
      第16回データ工学と情報マネジメントに関するフォーラム(DEIMフォーラム2024)
    • Related Report
      2023 Annual Research Report
  • [Presentation] グラフ要約に基づく知識グラフ索引の提案2024

    • Author(s)
      小倉 勇大,天笠 俊之
    • Organizer
      第16回データ工学と情報マネジメントに関するフォーラム(DEIMフォーラム2024)
    • Related Report
      2023 Annual Research Report
  • [Presentation] テキスト及び構造に基づく効率的な類似部分木検索手法2024

    • Author(s)
      溝上 拓也, Bou Savong, 天笠 俊之
    • Organizer
      第16回データ工学と情報マネジメントに関するフォーラム(DEIMフォーラム2024)
    • Related Report
      2023 Annual Research Report
  • [Presentation] ユーザ定義の述語とエンティティリンキングを利用した知識ベースと外部情報源の統合利用2024

    • Author(s)
      大森 雄基,北川 博之,天笠 俊之
    • Organizer
      第16回データ工学と情報マネジメントに関するフォーラム(DEIMフォーラム2024)
    • Related Report
      2023 Annual Research Report
  • [Presentation] LSiX:ストリームデータに関する複数連続的集2024

    • Author(s)
      川上 隼, Bou Savong, 天笠 俊之
    • Organizer
      第16回データ工学と情報マネジメントに関するフォーラム(DEIMフォーラム2024)
    • Related Report
      2023 Annual Research Report
  • [Presentation] テキスト及び構造に基づいた類似部分木検索2024

    • Author(s)
      溝上拓也,天笠俊之,橋本武彦
    • Organizer
      情報処理学会第86回全国大会
    • Related Report
      2023 Annual Research Report
  • [Presentation] エンティティリンキング機能を有する知識ベースと外部情報源の統合利用手法2023

    • Author(s)
      大森 雄基, 北川 博之, 天笠 俊之
    • Organizer
      第15回データ工学と情報マネジメントに関するフォーラム(DEIMフォーラム2023)
    • Related Report
      2022 Annual Research Report
  • [Presentation] SPARQLを対象としたクエリ書き換えによる異種データ統合2023

    • Author(s)
      佐藤 祥吾, 天笠 俊之
    • Organizer
      第15回データ工学と情報マネジメントに関するフォーラム(DEIMフォーラム2023)
    • Related Report
      2022 Annual Research Report
  • [Presentation] 特徴選択を用いた高次元データに対する逆k最近傍検索の高速化2023

    • Author(s)
      対比地 恭平, 天笠 俊之
    • Organizer
      第15回データ工学と情報マネジメントに関するフォーラム(DEIMフォーラム2023)
    • Related Report
      2022 Annual Research Report
  • [Presentation] FPGA間通信フレームワークCIRCUSを利用した複数FPGAによるグラフ幅優先探索の提案2023

    • Author(s)
      溝谷 祐大, 小林 諒平, 藤田 典久, 朴 泰祐, 天笠 俊之
    • Organizer
      第15回データ工学と情報マネジメントに関するフォーラム(DEIMフォーラム2023)
    • Related Report
      2022 Annual Research Report
  • [Presentation] 複合的ストリーム処理に対するトレーサビリティの研究2023

    • Author(s)
      山田 真也, 北川 博之, Salman Ahmed Shaikh, 天笠 俊之, 的野 晃整
    • Organizer
      第15回データ工学と情報マネジメントに関するフォーラム(DEIMフォーラム2023)
    • Related Report
      2022 Annual Research Report
  • [Presentation] フォグの負荷及び通信状況を考慮したコストに基づく推論処理の動的負荷分散2023

    • Author(s)
      小久保 柚真, 天笠 俊之
    • Organizer
      第15回データ工学と情報マネジメントに関するフォーラム(DEIMフォーラム2023)
    • Related Report
      2022 Annual Research Report

URL: 

Published: 2022-04-19   Modified: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi