2011 Fiscal Year Annual Research Report
文章表現とネットワーク構造の分析に基づく大規模CGMデータ分析手法の提案
Project/Area Number |
21500091
|
Research Institution | University of Tsukuba |
Principal Investigator |
佐藤 哲司 筑波大学, 図書館情報メディア系, 教授 (70396117)
|
Co-Investigator(Kenkyū-buntansha) |
宝珍 輝尚 京都工芸繊維大学, 工芸科学研究科, 教授 (00251984)
斉藤 和巳 静岡県立大学, 経営情報学部, 教授 (80379544)
|
Keywords | 情報検索 / ウェブ情報空間 / チャンク構造 / 文章評価 / ネットワーク分析 |
Research Abstract |
複数の著者によって書かれたUGC(User Generated Contents)を対象に、記事間の関連性・類似性を手がかりとした情報探索手法,ならびに,著者コミュニティの経時的な変容の解明、文章の印象評価手法を確立することを目指している.当期の主な成果は以下の通りである. 1.質問回答サイトに投稿された記事集合から話題トピックと季節性のある特徴語を、LDAを用いて抽出する手法を考案し、インターネット検索における多様なクエリ拡張を実現する手法を確立した。これまで検索結果の分類に使用されていたファセットをクエリ拡張に適用し、ファセット毎に用意したタグクラウドをタブで切り替えながら、検索語を追加・拡張することができる。 2.質問回答サイトにおける質問回答文の印象を言語的な特徴から推定する手法について検討し、形態素情報,文末表現や単語心像性という特徴量を用いることで質問回答文の印象を精度良く推定できることを明らかにした。 3.探索的な情報検索で重要となるユーザとのインタラクションを高次化することを目的に、検索結果となる複数ページから部分領域を抽出して編纂する機能と、複数ページ間の関連性把握を支援する検索インタフェースを提案した。いずれもインタラクティブな操作を繰り返すことで、ユーザの潜在的な情報要求の明確化と、情報要求を過不足なく満たす検索結果を得ることができると期待される。 4.探索的な情報検索を行うユーザの検索履歴を、閲覧したページに出現する特徴語を用いて可視化するWeb閲覧履歴の空間的把握手法を提案した。特徴語を自己組織化マップで2次元空間に配置する手法を確立し、探索課題を包含する文書集合から作成したマップ上に、複数ユーザの閲覧履歴を個々に表示することで、ユーザ毎の探索範囲の重なりや差異を容易に把握することができることを実験的に明らかにした。
|
Research Products
(20 results)