研究概要 |
WWW上の情報検索過程を通じ,ユーザが対象分野の概念体系を獲得する過程を,検索結果文書間の関係,話題分布の提示により支援するシステムの構築を目的とする.検索された文書集合をバランスよくカバーするようなキーワード集合を自動抽出,ネットワーク化してユーザに提示する事により,検索対象領域を構成する話題,検索に有効なキーワードなどを知ることができる.このシステムを実現するために,本研究では,柔軟性,多様性を備えたネットワークの自己組織化手法として,免疫ネットワークモデルを適用する. 具体的には,共起文書数に基づき接続関係を設定したキーワードのネットワーク上で,免疫ネットワークの数理モデルに基づき活性度を計算し,対応する文書クラスタ間でオーバラップしない制約を満たしつつ,話題を代表するキーワード(ランドマーク)の集合を抽出する手法を提案した.提案手法により抽出されたランドマーク,および対応する文書クラスタについて,アンケートに基づき代表的なクラスタリング手法であるk-meansクラスタリングと比較した結果より,提案手法の有効性を確認した. また,キーワードネットワーク上の活性状態が,情報可視化システムにおけるユーザの解釈を容易にするためのメタファとしても有効であることに着目し,これに基づくWeb情報可視化システムのプロトタイプを開発し,既存サーチエンジンと効果的に組み合わせることが可能であることを示した. 本研究は,近年注目を集めつつある生体に学んだソフトコンピューテイングパラダイムとして,免疫システムに基づく新たな工学的知的計算モデルを提案した点でも意義あるものである.
|