研究課題
本研究課題の目的は実世界の大規模グラフに対する高速な分析手法を開発することである.本研究期間を通じて,実世界のグラフが持つ頻出部分グラフ構造を捉えることで,数億ノード規模のグラフを高速に分析できる手法を提案する.特に本研究期間では申請時の研究計画に従い,(1)高速なグラフクラスタリング手法の開発および(2)高速なランダムウォーク分析手法の開発に取り組んだ.まず,高速なグラフクラスタリング手法の開発では,前年度開発した手法を基とし,さらに大規模なグラフへの適用を可能とするアルゴリズムの改良を行った.具体的には,分散並列環境を利用した逐次集約手法を高速に行うアルゴリズムの開発を行い,前年度に開発したクラスタリング手法への組み込みを行った.その結果として,約60億ノード規模の極めて大規模なグラフデータに対するクラスタリングを数分程度で処理できることを実験的に確認した.次にランダムウォーク分析手法の高速化においては,代表的なランダムウォーク分析手法のひとつであるObjectRankを題材に,頻出部分グラフ構造毎の遷移確率収束傾向の違いを分析した.その結果として,部分グラフ構造毎に遷移確率の収束傾向に大きな違いが有ることを実験的に明らかにした.本年度はこの性質を利用して計算の早期段階で遷移確率が収束したノードを効率的に検出・枝刈りするアルゴリズムFORankを開発した.このアルゴリズムを利用することにより,従来手法の精度を維持しつつ,10倍以上の高速化が可能であることを実験的に確認した.
29年度が最終年度であるため、記入しない。
すべて 2018 2017
すべて 雑誌論文 (3件) (うち査読あり 3件) 学会発表 (12件) (うち国際学会 3件、 招待講演 3件)
IEICE Transactions
巻: Vol.E100-D, No.4 ページ: 610-620
情報処理学会論文誌:データベース (TOD76)
巻: Vol.10, No.4, ページ: 1-5
巻: Vol.10, No.4, ページ: 11 - 15