2010 Fiscal Year Annual Research Report
文章表現とネットワーク構造の分析に基づく大規模CGMデータ分析手法の提案
Project/Area Number |
21500091
|
Research Institution | University of Tsukuba |
Principal Investigator |
佐藤 哲司 筑波大学, 大学院・図書館情報メディア研究科, 教授 (70396117)
|
Co-Investigator(Kenkyū-buntansha) |
福原 知宏 独立行政法人産業技術総合研究所, サービス工学研究センター, 特別研究員 (50436581)
宝珍 輝尚 京都工芸繊維大学, 工芸科学研究科, 教授 (00251984)
斉藤 和巳 静岡県立大学, 経営情報学部, 教授 (80379544)
|
Keywords | 情報検索 / ウェブ情報空間 / チャンク構造 / 文章評価 / ネットワーク分析 |
Research Abstract |
本研究は,複数の著者によって書き連ねられるUGC(User Generated Contents)を対象に,記事間の関連性・類似性を手がかりとした情報探索手法,ならびに,著者コミュニティの経時的な変容の解明と文章の印象評価手法を確立することを目指している.当期の主な成果は以下の通りである. 1.記事中に出現する語彙の出現頻度と共起関係を用いて,語彙及び文書間のハイパーリンクを構成する手法を詳細に検討し,提案するリンク構造が曖昧な情報要求を解決するための情報探索に有効であることを利用者実験によって検証した. 2.コミュニティQAサイトにおける回答者間の関係性を,質問を介した2部グラフで表現する手法を提案し,特徴的なグラフパターンを抽出するモチーフ分析手法を拡張・適用して,質問内容を表すカテゴリ毎に特徴的なモチーフが存在することを明らかにした.さらに,QAサイトの期間を分割した評価を行い,モチーフの出現分布が変化の変化からコミュニティの成長や変容を解明する手がかりを得た. 3.QAサイトに実際に投稿された質問記事および回答記事を実験者に提示する文章の印象評価実験を行い,文章の印象を表す因子を明らかにした.得られた因子の得点を利用することで,質問者によって選ばれたベストアンサー記事を質問記事からある程度推定することが可能にできることを示した. 4.インターネット検索の結果を二次元平面上に配置することで,検索結果の俯瞰と埋もれていたマイナーな結果への到達を支援するインタラクティブな検索手法を提案した.
|