研究課題/領域番号 |
20H00583
|
研究種目 |
基盤研究(A)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
中区分60:情報科学、情報工学およびその関連分野
|
研究機関 | 大阪大学 |
研究代表者 |
鬼塚 真 大阪大学, 大学院情報科学研究科, 教授 (60726165)
|
研究分担者 |
佐々木 勇和 大阪大学, 大学院情報科学研究科, 助教 (40745147)
|
研究期間 (年度) |
2020-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2024年度)
|
配分額 *注記 |
44,330千円 (直接経費: 34,100千円、間接経費: 10,230千円)
2024年度: 9,360千円 (直接経費: 7,200千円、間接経費: 2,160千円)
2023年度: 9,360千円 (直接経費: 7,200千円、間接経費: 2,160千円)
2022年度: 9,360千円 (直接経費: 7,200千円、間接経費: 2,160千円)
2021年度: 9,490千円 (直接経費: 7,300千円、間接経費: 2,190千円)
2020年度: 6,760千円 (直接経費: 5,200千円、間接経費: 1,560千円)
|
キーワード | グラフ深層学習 / グラフデータベース / グラフ生成 / ベンチマーク / グラフ / グラフマイニング / グラフ埋め込み / リンク予測 / サブグラフマッチング |
研究開始時の研究の概要 |
本研究では,1) サブグラフマッチングおよびグラフマイニング処理を処理する高速グラフデータベースエンジンを開発し,2)グラフデータ特有の性質である閉路構造に着眼し,グラフデータの格納構造・インデックス構造および不要パターンの効率的な枝刈り技術に取り組み, 3)実際のデータ分析の際に生じるアクセスワークロードの偏りと変化を捉えることでワークロードのコストを最小化する最適化技術に取り組む.
|
研究実績の概要 |
課題1(グラフクエリ処理): 1)失敗パターンの活用によるサブグラフマッチングの高速化技術を開発した(ACM SIGMOD 採択).本技術の特徴は,サブグラフ同型の制約条件を満たさない失敗パターンを記録する不要な探索を除外する点にあり,数学的性質を明らかにするとともに,従来技術よりも長時間要するクエリ数を1/100に削減した. 2) conjunctive path queryの理論的な精査を完了させるために,インデックス化における空間複雑性を求めた.これにより,大規模グラフでは全ての経路をインデックス化することは困難であり,問合せ状況に合わせたインデックス化が必要であることが理論的にわかった. 課題2(グラフ分析処理):1)人工の動的グラフ生成器を開発するとともに,dynamic graph neural network (GNN) の性能評価を実施し,最新の dynamic GNNの特性を解明した(国際会議投稿中).本動的グラフ生成の特徴は,テンソル分解及び時系列分解を活用することで動的グラフの特徴量を抽出し,加えてグラフ生成の高速化を達成した点にある. 2)グラフの多様な特性(homophily/heterophily)に対して,多様なノード特徴量(グラフ畳み込み結果,隣接ノードIDリスト)とエッジ特徴量(有向・無向)を適切に組み合わせる汎用なGNNアーキテクチャを考案し,安定して高い精度を達成した(国際会議投稿中). 3)時間変化するグラフにおける予測技術として,グラフ構造全体を予測する深層学習技術および深層学習の出力が変化する要因となる部分グラフを検出する技術を開発した.また,グラフのトポロジ構造に着目した公平なグラフ深層学習技術を開発し,次数分布と予測分布が独立した出力を実現する技術を開発した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
課題1(グラフクエリ処理): 失敗パターンの活用によるサブグラフマッチングの高速化の取り組みは最難関会議 SIGMOD に採択,conjunctive path queryに関しては理論的な精査が完了しており,インデックス化について技術開発が進んでいる.また,カーテディナリティ推定およびサブグラフ編集距離問合せにおいても基礎的な実験が完了している. 課題2(グラフ分析処理): 動的グラフ生成器および多様なグラフの特徴量を活用したGNNに関しては,国際会議 ECML/PKDD に2件投稿中であり,その他国内シンポジウムで6件発表した.また,時間変化するグラフにおける時系列予測技術では,グラフの将来予測の研究が大きく進展している.グラフ構造全体を予測する深層学習技術および深層学習の出力が変化する要因となる部分グラフを検出する技術は新たな研究の方向性として新規性が大きい
|
今後の研究の推進方策 |
課題1(グラフクエリ処理):conjunctive path queryにおいては,理論的な精査が完了しため,インデックス化について進めていく.また,カーテディナリティ推定およびサブグラフ編集距離問合せにおいては,新たなアルゴリズムの考案および論文化を行っていく. 課題2(グラフ分析処理):多様なグラフの特徴量を活用したGNNに関しては,グラフの多様な特性(homophily/heterophily)をノード単位で表現して適応的にGNNの畳み込みを制御する研究に取り組む.時間変化するグラフにおける時系列予測技術に関しては,グラフ構造全体を予測する深層学習技術の効率化および反実仮想説明についてより研究を深めていく.
|