研究概要 |
本年度は,以下の3つのサブテーマに関して研究を行った. 1.データベースと連携した大規模文書情報源からの情報抽出:ネットワーク上に存在する大量の文書群から,ユーザの興味ある情報をレコード形式で抽出するアプローチを提案し,実験に基づいて評価を行った.ユーザが与えたデータベース中のサンプルデータに基づいて抽出処理を行う点が特徴である. 2.新規性に基づく時系列文書のクラスタリングとその可視化システムの開発:インターネット上を配信されるニュース記事などにおいては,新規に得られた記事の方がより重視され,記事が古くなるほど価値が逓減していくという性質がある.また,新しい記事が次から次へと配信されるという性質もある.このような背景を踏まえて,本研究では新たな支書クラスタリングのアプローチを提案し,評価を行った.また,この文書クラスタリング手法の出力結果を可視化し,ユーザにニュース記事のトレンド分析機能を提供するT-Scrollシステムの開発も行い,被験者を用いた実証実験を行った. 3.P2Pネットワーク上のトレーサブルなレコード交換システム:P2P(peer-to-peer)ネットワークにおいては,柔軟な情報交換サービスが提供されているが,交換される情報の信頼性については十分な保証がない.そのため,本研究では,データベース技術を基盤とした情報交換の新たなアプローチを提案した.各ピア上のデータベースに修正・交換履歴を蓄積することで,情報の出所などをトレーサブルにすることがその特徴である.Datalogに基づく再帰的問合せ機能について検討を行った.
|