最終年度は,ソーシャルメディアに投稿された商品に関する評判を分析し,ユーザニーズを抽出,要約,可視化する手法の確立に着手した.具体的には,商品名を含むツイートを収集し,類似のツイートをつないで類似ツイートグラフを構築する.類似ツイートグラフは,複数の連結成分で構成されるが,ツイート群をつなぐ際の類似度の閾値を適切に設定することで,各連結成分は同一のユーザニーズが含まれるツイートで構成されることになる.このようにして,ニーズを抽出,要約している類似ツイートグラフを二次元平面上に可視化することで,商品に関するニーズを視覚的,かつ,網羅的に把握することができる.さらに,多様なトレンドワードを効果的に可視化し,短時間に類似の意味のトレンドワードが多発するバースト状態を検出する手法を提案した.この手法では,各トレンドワードを意味を表す動径軸と投稿時刻を表す半径軸からなる極座標平面上に点としてプロットする.そして,カーネル密度推定に基づく手法により,トレンドワードが密に分布する部分をバーストとして抽出する.直交座標に可視化する従来手法と比較して,平面を効率的に使用できる部分で優れた手法である.加えて,文書などの多様体上のオブジェクト群に対して,類似度重み付きのk-近傍グラフを構築し,効率的かつ効果的に可視化,クラスタリングする手法も提案した.この手法では,オブジェクト間の連結度に着目したモンテカルロサンプリングに基づいてクラスタリングする.実データを用いた評価実験により頑健性について検証した. 研究期間全体として,1)商品レビュー文の2部グラフ,2)ニュース記事などの時系列文書,3)学術論文の引用関係ネットワーク,4)商品に関する類似ツイートグラフ,5)トレンドワードバーストの5つの可視化手法を提案し,収集した実データを用いて評価することで,その有効性を確認した.
|