2020 Fiscal Year Research-status Report
グラフデータベースから類似グラフを検索する計算フレームワークの構築
Project/Area Number |
20K11835
|
Research Institution | Kwansei Gakuin University |
Principal Investigator |
猪口 明博 関西学院大学, 理工学部, 教授 (70452456)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | グラフ / グラフ検索 / グラフコード |
Outline of Annual Research Achievements |
本研究において解こうとしている問題は,グラフの集合からなるデータベースとクエリグラフqが入力として与えられたときに,ある条件を満たすグラフをデータベースから検索する問題である.「ある条件」としては,qを部分グラフとして含むもの,qに部分グラフとして含まれるものなどが考えられる.この科研費の研究課題を開始する前段階として,我々はCodeTreeというグラフ検索技術を開発していた.このCodeTreeでは,グラフをAcGMコードやDFSコードなどで表現し,コードの接頭辞木からなる索引を作成して,検索の高速化をはかっている.しかし,AcGMコードに基づくCodeTreeとDFSコードに基づくCodeTreeと別々のソフトウェアとして開発していたため,保守性が悪く,さらに拡張性が悪かった. 本課題の1年目は,これらのソフトウェアを1つにまとめ,グラフ検索のためのソフトウェア基盤を確立した.これにより,新たなグラフコードを活用する際には,そのコードに関わる部分だけをプログラミングし,索引作成やグラフ検索の部分は基盤をそのまま活用できるように保守性と拡張性を向上させた.2つのソフトウェアとして保守していたときと比べ,コード行数を約半分に削減し,さらに検索の応答時間を向上させた. また,このグラフ検索のソフトウェア基盤の上に,拡張AcGMコードに基づくCodeTreeを作成し,データベース中に含まれるグラフのうち,自己同型性が高いグラフに対して高速に動作するグラフ検索手法を作成した.さらに,qの部分グラフに類似するグラフをデータベースから検索する技術を開発中であり,今後も様々なグラフ検索問題に拡張できる準備を整えている.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本課題の目的は,実績の欄で述べたようなグラフ検索のためのソフトウェア基盤を開発し,今だ解かれていない様々なグラフ検索問題を新たに提唱し,問題を前述のソフトウェア基盤の上で解ける技術を確立していくことである.課題1年目であった昨年度では,ソフトウェア基盤を開発が概ね順調に進めることができた.このため,当初の計画通り,概ね順調に研究が進展していると言える.
|
Strategy for Future Research Activity |
前述のグラフ検索のためのソフトウェア基盤をさらに高速に動作させるように改良していく予定である.具体的には,以下の3点を考えている. 1つ目は,CodeTreeの並列化.CodeTreeの索引は前述の通り接頭辞木であり,我々の手法はこの木を深さ優先的に探索する.このような場合,Fork/Joinに基づく並列化と相性がよいことが知られているため,この技術を活用してCodeTreeの検索部の並列化を行う. 2つ目は,新たなグラフコードの作成.AcGMコードの接頭辞は,閉路をもつグラフになりにくい性質をもっており,このため,部分グラフ同型問題を解く際に,早期の枝刈りができないという欠点をもっている.これを克服するために,コードの接頭辞が閉路を含みやすいグラフコードを新たに開発し,上記の基盤に組み込む予定である. 3点目は,概要で述べたqの部分グラフに類似するグラフをデータベースから検索する技術の開発を進める.グラフの類似性を測る手段として,グラフ編集距離が用いられることが多い.グラフ編集距離を求める手法ではA*アルゴリズムを使って,編集距離の下界を利用することで計算の効率性をはかっている.この下界の計算法を活用し,この問題における計算の効率化を目指す.
|
Causes of Carryover |
コロナ感染拡大のため,発表を計画していた学会がオンライン開催となった.このため,旅費として捻出予定の金額がゼロとなったことが次年度への繰り越しの理由である. 2020年度の旅費は2021年度の物品費として考え,より高速に動作するコンピュータを研究室に導入するなどして,様々な評価実験を行い,研究成果を出していく予定である.
|