Budget Amount *help |
¥2,800,000 (Direct Cost: ¥2,800,000)
Fiscal Year 1999: ¥2,800,000 (Direct Cost: ¥2,800,000)
|
Research Abstract |
本研究では,実験的手法と計算学習理論に基づく知識発見メカニズムの開発を目的としている.この目的を達成するために,本年度は,動的クラスタリングを利用した情報フィルタリングに関する研究を行った.ネットワークを介して入手できる情報は膨大なため,全ての情報に目を通すことは不可能である.また,実用化されている情報検索エンジンは汎用的であることが多く,ユーザの好みに基づく検索は難しい.このため,巨大な情報から必要な情報のみを抽出する,情報フィルタリングの研究が必要となる.また,ネットワーク上の情報は時間の経過と共に内容が変化するため,情報の動的性についても考慮しなければいけない.昨年度は,動的な情報に対応した情報フィルタリングシステムを開発した.本システムでは,領域知識を用いた動的クラスタリングによりWebページを葉とする木構造を構築し,「意味的に類似したWebページは近接してクラスタリングされる」という仮説の基に,ユーザの関心を満たすWebページを発見している.本年度は,システムが誤ったクラスタリングを行なう毎に,多戦略学習の枠組によって領域知識を更新し,情報の動的性およびユーザの好みに対応できるように拡張した.また,フィルタリングされたWebページからの情報抽出について検討した.具体的には,領域知識としてシソーラスが使用されることが多いが,ユーザの嗜好や問題領域に関する概念は時間とともに変化するため,静的なシソーラスが動的な環境で有効に働くとは限らない.仮に,領域知識としてシソーラスを導入したとしても,新分野に関するデータの保守や準備には専門家の知識が必要となる.このため,本システムでは,自動的な構築や更新を行えるベイジアンネットワークを用いて,領域知識を表現している.
|