• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

自律協調型データベース統合基盤に関する研究

研究課題

研究課題/領域番号 23K17456
研究種目

挑戦的研究(開拓)

配分区分基金
審査区分 中区分60:情報科学、情報工学およびその関連分野
研究機関大阪大学

研究代表者

鬼塚 真  大阪大学, 大学院情報科学研究科, 教授 (60726165)

研究分担者 石原 靖哲  南山大学, 理工学部, 教授 (00263434)
加藤 弘之  国立情報学研究所, アーキテクチャ科学研究系, 助教 (10321580)
肖 川  大阪大学, 大学院情報科学研究科, 准教授 (10643900)
研究期間 (年度) 2023-06-30 – 2028-03-31
研究課題ステータス 交付 (2023年度)
配分額 *注記
26,000千円 (直接経費: 20,000千円、間接経費: 6,000千円)
2027年度: 4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2026年度: 4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2025年度: 4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
2024年度: 4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2023年度: 8,710千円 (直接経費: 6,700千円、間接経費: 2,010千円)
キーワードデータベース統合 / 双方向変換 / 一貫性保証
研究開始時の研究の概要

本研究は、より多くのデータベースを一貫性を維持した形で統合・活用し、社会的要請であるデータ駆動型の社会を実現するため、以下の技術課題に取り組む。課題A)異なるデータベースであっても同じ意味空間にデータを射影し、メトリック学習技術を用いることでテーブル統合の可否を高次元データ間の類似度で捉えることを可能とし、高精度に統合可能なテーブルを発見する。課題B)状態変化に基づく双方向変換を「仕様」と捉え、この仕様から実用的なビュー更新操作を導出する。課題C)多様なデータタイプを扱えるように競合の解決機構をユーザに提供する。

研究実績の概要

[課題A:統合可能なデータベースの発見] データベース間での統合を促進するために、異なるデータを統合できるテーブル埋め込み手法を開発した。具体的には、事前学習モデルとメトリック学習技術を適用し、テーブルの統合可否を高次元データの類似性によって判断する手法を開発した。さらに、膨大なデータに対応するために、大規模な高次元データ検索に焦点を当て、効率的な高次元データ索引技術および類似性に基づく問合せ処理方法を活用した。
[課題B:双方向変換の高速化] 双方向変換の高速化を達成するために、これまでの成果である「状態変化に基づく双方向変換」を仕様としてとらえ、そこからビューに対するSQLの更新文を基底表に対するSQLの更新文に変換することが目標である。今年度は、SQLの更新文を挿入と削除を組み合わせたDelta-Datalogに変換する手法を開発した。特に、SQLのUPDATE文を挿入と削除で組み合わせた場合のsemantic gapを埋めるために追加される制約を定義した。
[課題C:ネットワーク分断時の一貫性保証] ネットワーク分断後の同期によって競合が起きる代表的なデータタイプであるキューを主たる検討対象として採用し、その不完全情報表現を検討した。その結果、参加するピア数に対して線形サイズの表現が可能であるとの見通しを得た。また、情報統合システムの実例として、地図情報と不審者情報を統合して経路推薦を行うシステムの提案と開発を行った。加えて、データベース統合システムDejimaにおける大域的一貫性に関する性能評価を行い、書き込み・読み込み負荷の変化に対して適応的にロック方法を変更する技術の有効性を検証した。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

[課題A:統合可能なデータベースの発見] 当初の計画通り、表現学習技術と事前学習モデルを用いて、異なるデータベースのデータを意味のある高次元空間に射影することによって行ったため。
[課題B:双方向変換の高速化] 当初の計画通り、「状態変化に基づく双方向変換」を仕様とした更新操作の導出するための手順の一つであるSQLの更新文(DELETE, INSERT, UPDATE)からDelta-Datalogへの正しい変換技術を開発したため。
[課題C:ネットワーク分断時の一貫性保証] 検討の結果得られたキューの不完全情報表現は、その正しさの証明が完了していないものの、予想を上回るコンパクトさ(参加するピア数に対して線形サイズ)であったため。加えて、Dejimaにおける大域的一貫性に関する性能評価を完了した。

今後の研究の推進方策

[課題A:統合可能なデータベースの発見] データベース間での統合のみならず、様々なデータ前処理タスクを解決するため、一般化能力を持つモデルの開発に取り組む。特に、Llama 3 などの低価格のGPUでローカルに実行可能な大規模言語モデルを用いて、組み込みのドメイン知識とオプションの知識指定を提供したモデルをカスタマイズする。
[課題B:双方向変換の高速化] 「状態変化に基づく双方向変換」に定義されている、更新されたビュー並びに更新された基底表が満たすべき制約を、Delta-Datalogに変換する手法の開発に取り組む。
[課題C:ネットワーク分断時の一貫性保証] 検討の結果得られたキューの不完全情報表現が正しい表現になっていることの証明を行ったのち、不完全情報を確定させるための操作について検討を始める。並行して、他のデータタイプについても検討を進める。また、実例として開発したシステムへの適用について検討する。

報告書

(2件)
  • 2023 審査結果の所見   実施状況報告書
  • 研究成果

    (11件)

すべて 2024 2023 その他

すべて 国際共同研究 (3件) 雑誌論文 (4件) (うち国際共著 2件、 査読あり 4件、 オープンアクセス 2件) 学会発表 (4件) (うち国際学会 1件)

  • [国際共同研究] アントグループ/香港大学/広州大学(中国)

    • 関連する報告書
      2023 実施状況報告書
  • [国際共同研究] ニューサウスウェールズ大学(オーストラリア)

    • 関連する報告書
      2023 実施状況報告書
  • [国際共同研究] フォーダム大学(米国)

    • 関連する報告書
      2023 実施状況報告書
  • [雑誌論文] Utilization of Information Entropy in Training and Evaluation of Students’ Abstraction Performance and Algorithm Efficiency in Programming2024

    • 著者名/発表者名
      Wu Zengqing、Liu Huizhong、Xiao Chuan
    • 雑誌名

      IEEE Transactions on Education

      巻: 67 号: 2 ページ: 266-281

    • DOI

      10.1109/te.2024.3354297

    • 関連する報告書
      2023 実施状況報告書
    • 査読あり / 国際共著
  • [雑誌論文] High-Ratio Compression for Machine-Generated Data2023

    • 著者名/発表者名
      Zhang Jiujing、Shen Zhitao、Yang Shiyu、Meng Lingkai、Xiao Chuan、Jia Wei、Li Yue、Sun Qinhui、Zhang Wenjie、Lin Xuemin
    • 雑誌名

      Proceedings of the ACM on Management of Data

      巻: 1 号: 4 ページ: 1-27

    • DOI

      10.1145/3626732

    • 関連する報告書
      2023 実施状況報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] DeepJoin: Joinable Table Discovery with Pre-Trained Language Models2023

    • 著者名/発表者名
      Dong Yuyang、Xiao Chuan、Nozawa Takuma、Enomoto Masafumi、Oyamada Masafumi
    • 雑誌名

      Proceedings of the VLDB Endowment

      巻: 16 号: 10 ページ: 2458-2470

    • DOI

      10.14778/3603581.3603587

    • 関連する報告書
      2023 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] CAGAIN: Column Attention Generative Adversarial Imputation Networks2023

    • 著者名/発表者名
      Kawagoshi Jun、Dong Yuyang、Nozawa Takuma、Xiao Chuan
    • 雑誌名

      Lecture Notes in Computer Science

      巻: 14147 ページ: 258-273

    • DOI

      10.1007/978-3-031-39821-6_21

    • ISBN
      9783031398209, 9783031398216
    • 関連する報告書
      2023 実施状況報告書
    • 査読あり
  • [学会発表] 安全性を考慮した夜間の徒歩経路推薦システムの提案と評価2024

    • 著者名/発表者名
      横井 茉紘,石原 靖哲
    • 学会等名
      データ工学と情報マネジメントに関するフォーラム
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] 自律分散型データ統合技術Dejimaの性能分析2024

    • 著者名/発表者名
      吉田 凌河、肖 川、鬼塚 真
    • 学会等名
      データ工学と情報マネジメントに関するフォーラム
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] 双方向変換の二部ネットワークにおけるビューに基くデー タ共有のための適応手法2023

    • 著者名/発表者名
      日高 宗一郎、加藤 弘之、武市 正人
    • 学会等名
      日本ソフトウェア科学会 第40回大会
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] A Method of Image Dehazing Based on Atmospheric Veil Prediction by ResNet2023

    • 著者名/発表者名
      Zhang Jie、Li Fan、Kang Mengfei、Luo Xiongbiao、Zhao JIng、Xiao Chuan、Du Haipeng、Wang Huaijun
    • 学会等名
      Proceedings of the 2nd Workshop on User-centric Narrative Summarization of Long Videos
    • 関連する報告書
      2023 実施状況報告書
    • 国際学会

URL: 

公開日: 2023-07-04   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi