大規模グラフの特徴量を高い精度で推定できる新しいグラフサンプリング手法を研究している。ウェブやソーシャルグラフといった大規模グラフの性質・特徴量を算出するためには、一部の頂点・辺を抽出する処理、つまりサンプリングが欠かせない。従来のサンプリング手法は、対象とするグラフについて何の仮定も置かない。しかし、グラフの性質について事前知識がある場合、または何らかの予測が立つ場合、それを踏まえたサンプリングを行うことで、全体の性質により近い性質を持つ頂点・辺を抽出できる可能性がある。そこで本研究では、グラフの性質を踏まえたサンプリング手法、特に、複雑ネットワークを対象として、グラフ生成モデルに基づくサンプリング手法を開発する。 2014年度は、手法の開発に取り組んだ。2013年度までに開発したBAモデルに基づく仮の手法を基にして、どういった点を修正、改善すべきかを検討した。例えば、ある処理に用いる確率分布がBAモデルのものとはずれていることを発見した。 2015年度は、応用をクラスタ係数の算出に絞って、効率的にサンプリングを行う手法を研究し、開発した。同じ数の頂点を収集するために必要なサンプリングのステップ数を減らすことに成功しただけでなく、同一の頂点数で比較してすら、これまでの手法よりも高い精度を達成することに成功した。
|