研究概要 |
本年度の研究実績は以下の3点にまとめることができる. 1.新規性を考慮した文書クラスタリング手法の開発:インターネット上を配信されるニュース記事などでは,文書の新規性が重要なファクターとなる.時々刻々と提供される文書データを要約し,ユーザにおおまかなトレンドの流れを提示するため,本研究では時系列的な文書のクラスタリング手法について研究を行った.忘却ファクターの導入により,古い文書は次第に忘却し新規性の高い文書を重視する仕組みを取り入れ,効率よくクラスタリングを行うという点が特徴となっている. 2.XMLデータベースのための問合せ処理技術の開発:XMLはインターネット時代の情報交換のための標準として着目を浴びているが,大量のXMLデータを効率よく処理する技術に関してはいまだ開発の余地が多い.本研究では,まず,リレーショナルデータベース内に格納されたデータをXMLデータとして提供するXML出版に焦点を当て,与えられたXML問合せに対し求められたXMLデータをリレーショナルデータベース中のデータから効率よく導出する手法を示した.特にユーザ定義の関数が問合せに含まれる場合を検討の対象とし,XPath問合せの処理方式などについても見当した.また,携帯機器におけるXML利用が始まっていることから,携帯機器の制約の中で効率的に実行可能なXML問合せ処理系の開発も行った. 3.P2P環境における情報検索技術の開発:近年,P2P技術が急速に発展しているが,P2P環境における情報検索には未だ課題が多い.本研究では,P2P環境において部分照合検索機能を提供するため,シグネチャファイルのアイデアをP2P環境に導入した索引手法を提案した.スケーラブルな点が特徴である.
|