研究概要 |
SNSやブログのようなコミュニティ型コンテンツを対象とし,このコミュニティ型コンテンツからユーザの気付いていない情報を検索し提示するシステムの提案を行った。このユーザの気付いていない情報を「コンテンツホール」と呼ぶ。 今年度はコミュニティ型コンテンツのコンテンツホールの7つのタイプを定義した。 さらに,提案したコンテンツホールのタイプの内,ユーザに最も身近なコンテンツホールとして,「コミュニティ内で議論している話題の中でユーザが気付いていない情報つまりはコンテンツホールを検索するシステム」の提案を行い,プロトタイプシステムを開発した。 具体的には,「コミュニティ型コンテンツ内で殆ど無視されているが,実は重要なコンテンツの抽出」を行うことを目的とし,(1)孤立度,無関係度を定義し,それに基づき,無視されている情報を抽出し,(2)これら抽出された無視されている情報とWeb空間とを比絞し,Web空間で重要となっている話題を持つ無視された情報をコンテンツホールとして抽出し,コンテンツホールを赤枠にて可視化するシステムを開発した。 さらに,本開発システムを用いて,その有用性を示す実験を行い,非時系列のコミュニティ型コンテンツには提案手法が有用であることがわかった。 ニュース素材等の時系列型コミュニティ型コンテンツにおけるコンテンツホール検索の手法は今後の課題とかった。 ここで定義した孤立度とは「そのコメントに返答がないもしくは他のコメントの返答ではない」レスを孤立度が高いとし,活性伝播を用いて求めた。また,無関係度とは「コミュニティ全体に対して関連性がない」レスを無関係度が高いとし,コメント間の単語のオーバーラップを用いて求めた。
|