2022 Fiscal Year Annual Research Report
グラフデータベースから類似グラフを検索する計算フレームワークの構築
Project/Area Number |
20K11835
|
Research Institution | Kwansei Gakuin University |
Principal Investigator |
猪口 明博 関西学院大学, 工学部, 教授 (70452456)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | データベース / グラフ検索 / 類似グラフ |
Outline of Annual Research Achievements |
昨年度以前に研究/開発してきたCodeTreeを拡張し,CodeTreeで部分グラフ検索を行えるようにした.部分グラフ検索とは,グラフ集合(グラフデータベース)G={g1,g2,...,gn}とクエリグラフqが入力として与えられたときに,qを部分グラフとして含むグラフを出力する問題である.現時点で,VEQと呼ばれる手法が世界最速である. CodeTreeでは,各グラフをグラフコードで表現する.そのグラフコードの接頭辞木を構築し,それをデータベースの索引として扱う.クエリグラフqが与えられた際は,索引を巡回し,解とならないグラフを,早期にフィルタリングすることで,検索全体にかかる検索時間を短縮する.この分野において,現時点で世界最速の手法はVEQと呼ばれる手法であるが,一部のベンチマークセットにおいて,我々のCodeTreeはVEQを上回る速度で動作している.現在も継続して評価実験を行っているが,結果がまとまり次第,論文発表する予定である. 上記の結果は,以下の観点から興味深いものである.この数年,この分野では,索引の使用が否定されつつあった.索引を構築するのに時間がかかる一方で,VEQ等に比べフィルタリングの効果や速度が索引に基づく手法において劣っている点があった.このためこの分野では,現在,索引に基づかない手法が主流となっている.我々の結果はその動向を覆す可能性がある.また,索引を用いない場合,検索時間はデータベースのグラフ数nに比例するが,索引を用いればlog nに比例する程度に抑えることができる.
|