2004 Fiscal Year Annual Research Report
ウェブマイニングの為のウェブウェアハウスの構築に関する研究
Project/Area Number |
13224014
|
Research Institution | The University of Tokyo |
Principal Investigator |
喜連川 優 東京大学, 生産技術研究所, 教授 (40161509)
|
Co-Investigator(Kenkyū-buntansha) |
小口 正人 お茶の水女子大学, 理学部, 助教授 (60328036)
中野 美由紀 東京大学, 生産技術研究所, 助手 (30227863)
|
Keywords | 計算機システム / インターネット高速化 / データストレージ / ディスククラスタ / コンテンツアーカイブ / データマイニング |
Research Abstract |
資源の無い我国においては情報は貴重な資源と見なすことが出来、その有効活用が期待されるが現状ではWWWの利用形態は単純なキーワードサーチに基づくサーチエンジンに留まっている。本研究では更なる新しいサービスを模索すべく、その第一歩としてコンテンツを柔軟に操作可能とする強力なプラットフォームを構築することを目的としている。本年度は、WWW検索における検索語の抽出に関し、検索語を入力した後に訪れたウェブコミュニティ(類似したウェブページの集まり)とウェブページに対する形態素解析処理により得られた名詞の集合を特徴空間に利用する手法を提案し、特徴空間に名詞を用いる手法とコミュニティを用いる手法では、抽出する関連語の傾向が異なることを確認した。さらに、WWWグラフ構造の解析手法として既に提案しているMax-Flow手法を用い、ハブに相当するリンク集が存在しなくてもコミュニティを抽出可能であることを確認した。
|
Research Products
(6 results)