大規模なネットワークデータが近年容易に入手できるようになり,ネットワークに潜む構造を理解することが応用上も重要になっている.ネットワークは多くの場合スパース性をもち,ノードとリンクからなるグラフと考えると各ノードが他のノードに接続するリンク数(次数)はノード数に比べてとても小さい.このような複雑ネットワークの研究が注目されているが,ネットワークデータを統計解析するツールの研究は不十分で,今後さらに重要になると考える.そこで本研究では,ネットワークデータの統計解析を通して創造的に多様なスパースモデリングを探求する.とくに,ネットワーク成長モデルの優先的選択関数やスパース正則化の正則化関数の関数形に着目したモデリングを探求する.(1)既知のネットワークの生成メカニズムに興味がある場合,成長ネットワークモデルをネットワークデータに適用して,生成モデルを推定する.ノード接続の優先的選択関数のノンパラメトリック推定法を考案して分析ツールのソフトウエアPAFitとしてCRANに公開していたが,さらにノード適応度も同時にベイズ推定する手法を提案してソフトウエアを公開した.youtubeやfacebook等のソーシャルネットワークの実データに適応してその有効性を検証した.(2)未知のネットワーク構造をグラフィカルモデルによって推定する場合,正則化項を加えたスパース推定を行う.この正則化項のモデリングを工夫して,ランダムグラフとスケールフリーネットワークの両者を含む一般的な正則化項を提案し検証を行った.
|