研究課題/領域番号 |
13224014
|
研究種目 |
特定領域研究
|
配分区分 | 補助金 |
審査区分 |
理工系
|
研究機関 | 東京大学 |
研究代表者 |
喜連川 優 東京大学, 生産技術研究所, 教授 (40161509)
|
研究分担者 |
小口 正人 お茶の水女子大学, 理学部, 助教授 (60328036)
中野 美由紀 東京大学, 生産技術研究所, 助手 (30227863)
|
研究期間 (年度) |
2001 – 2005
|
研究課題ステータス |
完了 (2005年度)
|
配分額 *注記 |
122,100千円 (直接経費: 122,100千円)
2005年度: 28,000千円 (直接経費: 28,000千円)
2004年度: 28,000千円 (直接経費: 28,000千円)
2003年度: 32,000千円 (直接経費: 32,000千円)
2002年度: 34,100千円 (直接経費: 34,100千円)
|
キーワード | 計算機システム / インターネット高速化 / データストレージ / SAN型PCクラスタ / コンテンツアーカイブ / データマイニング / ウェブコンテンツ / ウェブリンク解析 / ディスククラスタ / コンテンツ・アーカイブ / ウェブマイニング / ウェブウェアハウス / WWW |
研究概要 |
資源の無い我国においてはWW情報は貴重な資源と見なすことが出来、その有効活用が期待されるが現状ではWWWの利用形態は単純なキーワード転置に基づくサーチエンジンに留まっている。本研究では従来には無い新しい検索手法を模索すべく、WWWコンテンツを柔軟に操作可能とする強力なプラットフォームを構築することを目的としている。上記の目的を達成すべく、ウェブウェアハウスに適合した大規模処理システムアーキテクチャの構築、収集された大容量ウェブページの高度検索処理に適したデータ管理技法、さらにウェブウェアハウスの高次元利用を可能とするログ解析技法の三つの観点を柱に、研究を進めた。(1)ウェブウェアハウスに適合した大規模システムアーキテクチャでは、PCクラスタにSANで結合したストレージを組み合わせることにより、ウェブウェアハウスに適合したシステムアーキテクチャを提案、世界に先駆け、ストレージネットワーク型PCクラスタを構築し、有効性を実証した。(2)大容量ウェブページの高度検索処理に適したデータ管理技法に関する研究では,従来のテキスト検索とは異なるウェブページのハイパーリンク情報を基にページ間の関連を抽出するアプローチを採用し収集した全日本ウェブページのスナップショットからコミュニティチャートを作成した.また,抽出されたコミュニティチャートの部分集合を可視化し、ユーザによる閲覧・探索を支援するツールを提供した.(3)ウェブウェアハウスの高次利用を支援するログ解析技法に関する研究では、ウェブへのアクセスログを解析し,ユーザの行動意図の理解とそのシステムへの反映について検討を進め、大域的なユーザの挙動パターンの抽出に成功した。
|