2005 Fiscal Year Annual Research Report
ウエブマイニングの為のウェブウェアハウス構築に関する研究
Project/Area Number |
13224014
|
Research Institution | University of Tokyo |
Principal Investigator |
喜連川 優 東京大学, 生産技術研究所, 教授 (40161509)
|
Co-Investigator(Kenkyū-buntansha) |
小口 正人 お茶の水女子大学, 理学部, 助教授 (60328036)
中野 美由紀 東京大学, 生産技術研究所, 助手 (30227863)
|
Keywords | 計算機システム / インターネット高速化 / データストレージ / ディスククラスタ / コンテンツアーカイブ / データマイニング |
Research Abstract |
資源の無い我国において情報は貴重な資源と見なすことが出来、その有効活用が期待されるが現状ではWWWの利用形態は単純なキーワードサーチに基づくサーチエンジンに留まっている。本研究では更なる新しいサービスを模索すべく、その第一歩としてコンテンツを柔軟に操作可能とする強力なプラットフォームを構築することを目的としている。本年度は、テレビ視聴率調査と同様に統計的に偏りなく抽出された人を対象に、URL履歴収集を行ったログを解析し、ユーザが入力した検索後と関連する語の発見方法の検討を行った。まず、検索語を入力した後ユーザが訪れたウェブコミュニティとウェブページに対する形態素解析処理により得られた名詞の集合を特徴空間に利用する手法を開発した。さらに、提案した関連度を基にユーザが指定した検索語と関連する検索語群を表示するツールを実装し、パネルログ中にある検索語の中で頻度が高い約4000語を対象として、我々の手法が有効であるかどうかについて検討を行い、提案した手法が従来の方法よりも多くの関連語を抽出可能であることを示した。
|