研究概要 |
本研究の目的は,ある問合せに対して適している検索システムを,複数の検索システムから自動的に選び出し,組み合わせることによって,高精度な情報検索システムを実現するための方式を確立することである.本年度は,実際に公開されている複数の検索エンジンに対して統合型検索エンジンを実装した.ここで,問題点の一つとして,検索速度の低下が大きな問題となった.そこで本研究では,検索対象を記述した著者に着目し,著者が編集した文書編集履歴を事前に解析しておくことによって,どの著者が検索に必要なキーパーソンであるかを評価した.評価を行った結果,検索精度を向上させ,しかも検索速度を10倍程度に高速化することができた. さらに,本研究では検索結果から得られる特徴の一つとして,その記事が他の記事に与える影響が存在するのではないかと考えた.この特徴が顕著に表れる検索対象の一つとして,申請者はマイクロブログと呼ばれる非常に文書量の少ない大量のテキスト群を検索対象とし,その文書から得られる特徴量の一つとして影響量の定義を行った.実際に提案手法を適用し,特徴量の抽出を行った結果,検索精度を向上させることが可能となった. 以上の結果から,本研究の目的である複数の検索システムを組み合わせた高精度な情報検索エンジンを実現することができた。検索速度の高速化を実現することができたため,より計算量が多く困難である特徴量を抽出することが可能となり,その結果検索精度の向上を実現することができた.
|