• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

多粒度分散知識グラフ活用のための基盤技術に関する研究

研究課題

研究課題/領域番号 23K24949
補助金の研究課題番号 22H03694 (2022-2023)
研究種目

基盤研究(B)

配分区分基金 (2024)
補助金 (2022-2023)
応募区分一般
審査区分 小区分62020:ウェブ情報学およびサービス情報学関連
研究機関筑波大学

研究代表者

天笠 俊之  筑波大学, 計算科学研究センター, 教授 (70314531)

研究分担者 北川 博之  筑波大学, 国際統合睡眠医科学研究機構, 教授 (00204876)
橋本 武彦 (BouSavong)  筑波大学, 計算科学研究センター, 助教 (80910760)
塩川 浩昭  筑波大学, 計算科学研究センター, 准教授 (90775248)
研究期間 (年度) 2022-04-01 – 2026-03-31
研究課題ステータス 交付 (2024年度)
配分額 *注記
16,640千円 (直接経費: 12,800千円、間接経費: 3,840千円)
2025年度: 4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2024年度: 4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2023年度: 4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2022年度: 4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
キーワード知識グラフ / RDF / データ統合 / 多粒度 / 索引 / 多粒度分散知識グラフ / 分散問合せ
研究開始時の研究の概要

【研究項目1】エンティティに対応する頂点を類似したグループごとにスーパーノードとしてまとめることで,階層的な索引を構築する.今年度は,前年度までに検討した知識グラフ概要構築の効率化について検討を進める.
【研究項目2】大規模知識グラフに対する分散問合せにおける,統計情報を利用した問合せプランニングの問題として定式化し,手法を具体化する.
【研究項目3】大規模言語モデル(LLM)を用いた実体リンキング手法をベースとして,実体を対象として,複数の知識グラフを連携する.
【研究項目4】プロトタイプシステム構築に向けて,他の研究項目と連携し,各手法の基礎的な部分を実装,評価を進める.

研究実績の概要

【研究項目1 MD知識グラフの構造的・意味的要約生成】(担当:天笠,サポート:塩川)エンティティに対応する頂点を類似したグループごとにスーパーノードとしてまとめることで,階層的な索引を構築する.この初期的な検討結果を,国内学会で発表した.
【研究項目2 高速かつ分散透過なMD知識グラフ検索】(担当:塩川,サポート:天笠)(1) フォグ環境における分散RDF推論を対象に,フォグノードとクラウドサーバの間で動的に不可分散を行う手法を開発した.(2) PCクラスタ環境を想定し,Apache Spark SQLを対象に,高速なRDF問合せ処理のためのデータ分割手法を開発した.いずれの成果も,査読付き国際会議論文として発表した.
【研究項目3 MD知識グラフと異種データの連携】(担当:北川,サポート:天笠)エンティティの直接的なマッチング(エンティティリンキング)だけではなく,エンティティの意味的な特徴に着目したマッチングを検討した.(1) 大規模言語モデルを用いた実体マッチングにおいて,モデルの学習コストを低減することを可能にするアダプタを導入した手法を提案し,その有効性を実験によって示した.(2) リレーショナルデータベースを対象に,これらを仮想的なRDF知識グラフとしてアクセス可能にする手法を提案した.特に,各レコードの識別子に着目し,これらを適切なURIに変換するための関数をユーザ定義可能にする枠組みを提案し,その有効性を実験により確認した.これらの成果は,いずれも査読付き国際会議論文として発表した.
【研究項目4 プロトタイプ構築および性能評価】(担当:Bou,サポート:全員)プロトタイプシステム構築に向けて,他の研究項目と連携し,各手法の基礎的な部分を実装,評価した.その成果はぞれぞれの対応する論文にて公表済みである.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

【研究項目1 MD知識グラフの構造的・意味的要約生成】(担当:天笠,サポート:塩川)【研究項目2 高速かつ分散透過なMD知識グラフ検索】(担当:塩川,サポート:天笠)【研究項目3 MD知識グラフと異種データの連携】(担当:北川,サポート:天笠)については,基本的な手法を検討するとともに,その成果をそれぞれ国内,国外の学会にて発表済みである.
【研究項目4 プロトタイプ構築および性能評価】(担当:Bou,サポート:全員)については,ぞれぞれの研究項目においてプロトタイプを実装し,その有効性を検証している.

今後の研究の推進方策

【研究項目1 MD知識グラフの構造的・意味的要約生成】(担当:天笠,サポート:塩川)【研究項目2 高速かつ分散透過なMD知識グラフ検索】(担当:塩川,サポート:天笠)【研究項目3 MD知識グラフと異種データの連携】(担当:北川,サポート:天笠)については,当初の計画に基づき手法のブラッシュアップを進めるとともに,最終的な統合に向けて準備を進める.
【研究項目4 プロトタイプ構築および性能評価】(担当:Bou,サポート:全員)については,上記の成果をもとに最終的な評価に向けて,システムの開発並びに評価用のデータセットの選定,並びに,環境構築を行う予定である,.

報告書

(2件)
  • 2023 実績報告書
  • 2022 実績報告書
  • 研究成果

    (30件)

すべて 2024 2023 2022

すべて 雑誌論文 (17件) (うち国際共著 3件、 査読あり 17件、 オープンアクセス 2件) 学会発表 (13件)

  • [雑誌論文] AdapterEM: Pre-trained Language Model Adaptation for Generalized Entity Matching using Adapter-tuning2023

    • 著者名/発表者名
      Mugeni John Bosco、Lynden Steven、Amagasa Toshiyuki、Matono Akiyoshi
    • 雑誌名

      IDEAS 2023

      巻: - ページ: 140-147

    • DOI

      10.1145/3589462.3589498

    • 関連する報告書
      2023 実績報告書
    • 査読あり
  • [雑誌論文] Integration of Knowledge Bases and External Information Sources via Magic Properties and Query-driven Entity Linking2023

    • 著者名/発表者名
      Yuuki Ohmori, Hiroyuki Kitagawa, Toshiyuki Amagasa, Akiyoshi Matono
    • 雑誌名

      Information Integration and Web Intelligence (iiWAS2023)

      巻: 14416 ページ: 309-324

    • DOI

      10.1007/978-3-031-48316-5_30

    • ISBN
      9783031483158, 9783031483165
    • 関連する報告書
      2023 実績報告書
    • 査読あり
  • [雑誌論文] RDF Data Partitioning for?Efficient SPARQL Query Processing with Spark SQL2023

    • 著者名/発表者名
      Yamasaki Kosuke、Amagasa Toshiyuki
    • 雑誌名

      iiWAS 2023

      巻: - ページ: 92-106

    • DOI

      10.1007/978-3-031-48316-5_12

    • ISBN
      9783031483158, 9783031483165
    • 関連する報告書
      2023 実績報告書
    • 査読あり
  • [雑誌論文] TraPM: A Framework for Online Pattern Matching Over Trajectory Streams2023

    • 著者名/発表者名
      Trisminingsih, R., Shaikh, S.A., Amagasa, T., Kitagawa, H., Matono, A
    • 雑誌名

      iiWAS2023

      巻: - ページ: 510-525

    • 関連する報告書
      2023 実績報告書
    • 査読あり
  • [雑誌論文] Efficient Missing Value Imputation by Maximum Distance Likelihood2023

    • 著者名/発表者名
      Savong Bou, Toshiyuki Amagasa, Hiroyuki Kitagawa, Salman Ahmed Shaikh, Akiyoshi Matono
    • 雑誌名

      2023 IEEE International Conference on Big Data (BigData)

      巻: - ページ: 331-338

    • DOI

      10.1109/bigdata59044.2023.10386584

    • 関連する報告書
      2023 実績報告書
    • 査読あり / 国際共著
  • [雑誌論文] CSER: Enhancing Cybersecurity Entity Recognition Through Multidimensional Feature Fusion2023

    • 著者名/発表者名
      Marjan Md Abu、Amagasa Toshiyuki
    • 雑誌名

      IEEE Big Data 2023

      巻: - ページ: 1214-1221

    • DOI

      10.1109/bigdata59044.2023.10386941

    • 関連する報告書
      2023 実績報告書
    • 査読あり / 国際共著
  • [雑誌論文] Supporting Practical URI Mappings in Virtual Knowledge Graph-based Relational Data Integration2023

    • 著者名/発表者名
      Sato Shogo、Masuda Tadashi、Amagasa Toshiyuki
    • 雑誌名

      IEEE Big Data 2023

      巻: - ページ: 2958-2964

    • DOI

      10.1109/bigdata59044.2023.10386274

    • 関連する報告書
      2023 実績報告書
    • 査読あり / 国際共著
  • [雑誌論文] Online Optimized Product Quantization for ANN Queries over Dynamic Database using SVD-Updating2022

    • 著者名/発表者名
      Yukawa Kota、Amagasa Toshiyuki
    • 雑誌名

      Transactions on Large-Scale Data- and Knowledge-Centered Systems

      巻: 13470 ページ: 86-102

    • DOI

      10.1007/978-3-662-66146-8_4

    • ISBN
      9783662661451, 9783662661468
    • 関連する報告書
      2022 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] A Graph-Based Blocking Approach for Entity Matching Using Contrastively Learned Embeddings2022

    • 著者名/発表者名
      Mugeni John Bosco、Amagasa Toshiyuki
    • 雑誌名

      ACM SIGAPP Applied Computing Review

      巻: 22 号: 4 ページ: 37-46

    • DOI

      10.1145/3584014.3584017

    • 関連する報告書
      2022 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] A graph-based blocking approach for entity matching using pre-trained contextual embedding models2022

    • 著者名/発表者名
      Mugeni John Bosco、Amagasa Toshiyuki
    • 雑誌名

      SAC2022

      巻: - ページ: 357-364

    • DOI

      10.1145/3477314.3507689

    • 関連する報告書
      2022 実績報告書
    • 査読あり
  • [雑誌論文] InTrans: Fast Incremental Transformer for Time Series Data Prediction2022

    • 著者名/発表者名
      Savong Bou, Toshiyuki Amagasa, Hiroyuki Kitagawa
    • 雑誌名

      Proc. 33rd International Conference on Database and Expert Systems Applications (DEXA 2022)

      巻: 2 ページ: 47-61

    • DOI

      10.1007/978-3-031-12426-6_4

    • ISBN
      9783031124259, 9783031124266
    • 関連する報告書
      2022 実績報告書
    • 査読あり
  • [雑誌論文] BLOCK-OPTICS: An Efficient Density-Based Clustering Based on OPTICS2022

    • 著者名/発表者名
      Yukawa Kota、Amagasa Toshiyuki
    • 雑誌名

      DEXA2022

      巻: - ページ: 291-296

    • DOI

      10.1007/978-3-031-12426-6_26

    • ISBN
      9783031124259, 9783031124266
    • 関連する報告書
      2022 実績報告書
    • 査読あり
  • [雑誌論文] GPU-Accelerated Reverse K-Nearest Neighbor Search for High-Dimensional Data2022

    • 著者名/発表者名
      Tsuihiji Kyohei、Amagasa Toshiyuki
    • 雑誌名

      DEMoC-2022

      巻: - ページ: 279-288

    • DOI

      10.1007/978-3-031-14314-4_28

    • ISBN
      9783031143137, 9783031143144
    • 関連する報告書
      2022 実績報告書
    • 査読あり
  • [雑誌論文] PR-MVI: Efficient Missing Value Imputation over Data Streams by Distance Likelihood2022

    • 著者名/発表者名
      Savong Bou, Toshiyuki Amagasa, Hiroyuki Kitagawa, Salman Ahmed Shaikh, Akiyoshi Matono
    • 雑誌名

      Proc. 24th International Conference on Information Integration and Web Intelligence (iiWAS2022)

      巻: - ページ: 338-351

    • DOI

      10.1007/978-3-031-21047-1_28

    • ISBN
      9783031210464, 9783031210471
    • 関連する報告書
      2022 実績報告書
    • 査読あり
  • [雑誌論文] Streaming Augmented Lineage: Traceability of Complex Stream Data Analysis2022

    • 著者名/発表者名
      Masaya Yamada, Hiroyuki Kitagawa, Salman Ahmed Shaikh, Toshiyuki Amagasa, Akiyoshi Matono
    • 雑誌名

      Proc. 24th International Conference on Information Integration and Web Intelligence (iiWAS2022)

      巻: - ページ: 224-236

    • DOI

      10.1007/978-3-031-21047-1_20

    • ISBN
      9783031210464, 9783031210471
    • 関連する報告書
      2022 実績報告書
    • 査読あり
  • [雑誌論文] An FPGA-based Accelerator for Regular Path Queries over Edge-labeled Graphs2022

    • 著者名/発表者名
      Kento Miura, Ryohei Kobayashi, Toshiyuki Amagasa, Hiroyuki Kitagawa, Norihisa Fujita, and Taisuke Boku
    • 雑誌名

      Proceedings of 2022 IEEE International Conference on Big Data (IEEE BigData2022)

      巻: - ページ: 415-422

    • DOI

      10.1109/bigdata55660.2022.10020406

    • 関連する報告書
      2022 実績報告書
    • 査読あり
  • [雑誌論文] Region-based Sub-Snapshot (RegSnap): Enhanced Fault Tolerance in Distributed Stream Processing with Partial Snapshot2022

    • 著者名/発表者名
      Takdir, Hiroyuki Kitagawa, and Toshiyuki Amagasa
    • 雑誌名

      Proceedings of 2022 IEEE International Conference on Big Data (IEEE BigData2022)

      巻: - ページ: 3374-3382

    • DOI

      10.1109/bigdata55660.2022.10020607

    • 関連する報告書
      2022 実績報告書
    • 査読あり
  • [学会発表] SparkSQLによる効率的な問合せ処理のためのワークロードに基づくRDFデータ分割手法2024

    • 著者名/発表者名
      山﨑 昂輔,天笠 俊之
    • 学会等名
      第16回データ工学と情報マネジメントに関するフォーラム(DEIMフォーラム2024)
    • 関連する報告書
      2023 実績報告書
  • [学会発表] ラベルの出現頻度に着目したFPGAを用いた正規パス問合せの提案2024

    • 著者名/発表者名
      溝谷 祐大,小林 諒平,藤田 典久,朴 泰祐,天笠 俊之
    • 学会等名
      第16回データ工学と情報マネジメントに関するフォーラム(DEIMフォーラム2024)
    • 関連する報告書
      2023 実績報告書
  • [学会発表] グラフ要約に基づく知識グラフ索引の提案2024

    • 著者名/発表者名
      小倉 勇大,天笠 俊之
    • 学会等名
      第16回データ工学と情報マネジメントに関するフォーラム(DEIMフォーラム2024)
    • 関連する報告書
      2023 実績報告書
  • [学会発表] テキスト及び構造に基づく効率的な類似部分木検索手法2024

    • 著者名/発表者名
      溝上 拓也, Bou Savong, 天笠 俊之
    • 学会等名
      第16回データ工学と情報マネジメントに関するフォーラム(DEIMフォーラム2024)
    • 関連する報告書
      2023 実績報告書
  • [学会発表] ユーザ定義の述語とエンティティリンキングを利用した知識ベースと外部情報源の統合利用2024

    • 著者名/発表者名
      大森 雄基,北川 博之,天笠 俊之
    • 学会等名
      第16回データ工学と情報マネジメントに関するフォーラム(DEIMフォーラム2024)
    • 関連する報告書
      2023 実績報告書
  • [学会発表] LSiX:ストリームデータに関する複数連続的集2024

    • 著者名/発表者名
      川上 隼, Bou Savong, 天笠 俊之
    • 学会等名
      第16回データ工学と情報マネジメントに関するフォーラム(DEIMフォーラム2024)
    • 関連する報告書
      2023 実績報告書
  • [学会発表] テキスト及び構造に基づいた類似部分木検索2024

    • 著者名/発表者名
      溝上拓也,天笠俊之,橋本武彦
    • 学会等名
      情報処理学会第86回全国大会
    • 関連する報告書
      2023 実績報告書
  • [学会発表] エンティティリンキング機能を有する知識ベースと外部情報源の統合利用手法2023

    • 著者名/発表者名
      大森 雄基, 北川 博之, 天笠 俊之
    • 学会等名
      第15回データ工学と情報マネジメントに関するフォーラム(DEIMフォーラム2023)
    • 関連する報告書
      2022 実績報告書
  • [学会発表] SPARQLを対象としたクエリ書き換えによる異種データ統合2023

    • 著者名/発表者名
      佐藤 祥吾, 天笠 俊之
    • 学会等名
      第15回データ工学と情報マネジメントに関するフォーラム(DEIMフォーラム2023)
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 特徴選択を用いた高次元データに対する逆k最近傍検索の高速化2023

    • 著者名/発表者名
      対比地 恭平, 天笠 俊之
    • 学会等名
      第15回データ工学と情報マネジメントに関するフォーラム(DEIMフォーラム2023)
    • 関連する報告書
      2022 実績報告書
  • [学会発表] FPGA間通信フレームワークCIRCUSを利用した複数FPGAによるグラフ幅優先探索の提案2023

    • 著者名/発表者名
      溝谷 祐大, 小林 諒平, 藤田 典久, 朴 泰祐, 天笠 俊之
    • 学会等名
      第15回データ工学と情報マネジメントに関するフォーラム(DEIMフォーラム2023)
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 複合的ストリーム処理に対するトレーサビリティの研究2023

    • 著者名/発表者名
      山田 真也, 北川 博之, Salman Ahmed Shaikh, 天笠 俊之, 的野 晃整
    • 学会等名
      第15回データ工学と情報マネジメントに関するフォーラム(DEIMフォーラム2023)
    • 関連する報告書
      2022 実績報告書
  • [学会発表] フォグの負荷及び通信状況を考慮したコストに基づく推論処理の動的負荷分散2023

    • 著者名/発表者名
      小久保 柚真, 天笠 俊之
    • 学会等名
      第15回データ工学と情報マネジメントに関するフォーラム(DEIMフォーラム2023)
    • 関連する報告書
      2022 実績報告書

URL: 

公開日: 2022-04-19   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi