研究概要 |
資源の無い我国においてはWW情報は貴重な資源と見なすことが出来、その有効活用が期待されるが現状ではWWWの利用形態は単純なキーワード転置に基づくサーチエンジンに留まっている。本研究では従来には無い新しい検索手法を模索すべく、WWWコンテンツを柔軟に操作可能とする強力なプラットフォームを構築することを目的としている。上記の目的を達成すべく、ウェブウェアハウスに適合した大規模処理システムアーキテクチャの構築、収集された大容量ウェブページの高度検索処理に適したデータ管理技法、さらにウェブウェアハウスの高次元利用を可能とするログ解析技法の三つの観点を柱に、研究を進めた。(1)ウェブウェアハウスに適合した大規模システムアーキテクチャでは、PCクラスタにSANで結合したストレージを組み合わせることにより、ウェブウェアハウスに適合したシステムアーキテクチャを提案、世界に先駆け、ストレージネットワーク型PCクラスタを構築し、有効性を実証した。(2)大容量ウェブページの高度検索処理に適したデータ管理技法に関する研究では,従来のテキスト検索とは異なるウェブページのハイパーリンク情報を基にページ間の関連を抽出するアプローチを採用し収集した全日本ウェブページのスナップショットからコミュニティチャートを作成した.また,抽出されたコミュニティチャートの部分集合を可視化し、ユーザによる閲覧・探索を支援するツールを提供した.(3)ウェブウェアハウスの高次利用を支援するログ解析技法に関する研究では、ウェブへのアクセスログを解析し,ユーザの行動意図の理解とそのシステムへの反映について検討を進め、大域的なユーザの挙動パターンの抽出に成功した。
|