研究課題/領域番号 |
15J00735
|
研究機関 | 筑波大学 |
研究代表者 |
伏見 卓恭 筑波大学, 図書館情報メディア系, 特別研究員(PD)
|
研究期間 (年度) |
2015-04-24 – 2018-03-31
|
キーワード | トピック / コミュニティ / 構造的凝集性 / 意味的凝集性 / アノテーション / EMアルゴリズム |
研究実績の概要 |
トピック指向コミュニティ抽出に関する研究成果として,従来から行なっているノードに対する機能コミュニティ抽出手法を拡張した.機能コミュニティ抽出法では,PageRank収束曲線を各ノードのネットワークに対する機能を表現する特徴ベクトルとして利用し,その類似度に基づきクラスタリングしていた.上記の手法をを拡張し,ノードごとではなくコミュニティ単位でPageRank収束曲線を計算し,コミュニティの性質やコミュニティの違いについて定量化し,分析する手法を提案した.続いて,ノードがもつトピックをノードの投稿内容に含まれる単語の出現頻度ベクトルで表現し,その意味的凝集性とネットワーク構造から得られる構造的凝集性に着目し,コミュニティを抽出,得られたコミュニティに統計的有意に出現する単語によりコミュニティにアノテーションを付与する手法を提案した.この手法では,近隣ノードの単語出現頻度ベクトルを減衰重みを付しながら合成するが,減衰の強弱を制御するパラメータをノードごとで調整する必要があり,パラメータを推定する枠組みを提案した.推定アルゴリズムでは,一般的に困難な非線形最適化の問題をEMアルゴリズムをベースに展開することで,効率よくパラメータを推定するように工夫した.さらに,設定した目的関数の大域最適解が保証されるなどの良い性質に着目したアルゴリズムを開発した.実データを用いた評価実験により,意味的凝集性を有するトピック指向のコミュニティでありながら,構造的凝集性をも有するコミュニティが抽出できることを検証した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
ネットワーク上でのノードの活動内容から,ノードの特徴量をベクトル表現し,近隣ノードの特徴ベクトルとの関係を定量化することにより,構造的にも意味的にも密なコミュニティを抽出する研究を課題とし取り組んだ.そして,統計的機械学習アプローチを土台に,大域的な収束性を保証するなど理論的にも優れたパラメータ推定法を独自に考案し,手法として確立できた点が特に高く評価できる.提案法の基本性能に関する評価実験では,その有効性を実証するとともに,幾つかの興味深い知見も同時に導き出し,複数の学会において発表を行った.さらに,上述の提案手法を改良し,ノードごとにスコアを計算することで中心性指標としても確立し,近年話題となっている大規模なソーシャルメディアデータからの知識発見も大いに期待できる状況にある.よって,本期間に「期待通り研究が進展した」と評価する.
|
今後の研究の推進方策 |
これまでの研究において,各ノードに対してトピックが付与されている.次年度以降は,ノード間のインタラクションから,リンクに対してトピック事後確率を推定し,それを重みとした隣接行列を求める.この重み付き隣接行列に対してスペクトラルクラスタリングにより,トピック指向構造コミュニティ抽出法を提案する.またスペクトラルクラスタリング以外に,複数のクラスタリング手法を適用し,それぞれ得られたコミュニティについて比較検討する.得られたコミュニティに対して可視化などの手段により解釈可能かどうかを定性的に判断する.さらに,正規化相互情報量により抽出結果の類似性を定量的に評価する.また,トピックによって得られるコミュニティが類似したり,大きく異なる場合もある.その点についても考察し,ネットワーク生成過程との関係について分析する.さらに,構造コミュニティ抽出とトピック事後確率付与の順序を入れ替えることにより抽出結果がどのように異なるかについても比較検討する.
|