研究概要 |
文書データは,非定型データで有り,,文書キーワード,作成日,作成者,文書分類など多属性検索キ-付与され,利用者はこれらの属性の一部を指定して,必要な文書を検索・絞り込むことになる.本研究では,多属性キ-の効率的検索を実現した. 1.多属性キ-検索に対するトライ検索アルゴリズムの考案 多属性キ-を検索するためのトライ検索アルゴリズムを提案し,多属性キ-の種類数を配列の次元数と捉えたときに,各次元を表尾減する効率系データ構造を提案した. 2.部分マッチと範囲検索の実現 検索者が部分的に指定した一部のキ-属性に対しても,対応する項目を部分マッチする検索技法を1.のトライ検索上と多次元配列の論理演算で実現した.また,年代の1990年から1993年までの項目などのように範囲検索を実行できるアルゴリズムをトライ検索上の遷移探索で実現した. 3.大規模文書データベースにおける実用化への評価 大規模文書データベースに対して,キーワード,作成者,意味分類,作成年月の多属性キ-を抽出し,開発された多重キ-検索エンジンを試作評価した. 多属性キ-検索技法は,1990年の初めに国外で研究が開発された手法であり,キ-検索技法としては,非常に新しい分野である.従って,多属性キ-による部分マッチと範囲検索技法は,確立していないので,本研究で提案するトライ法と多次元配列による新しい技法の特色,独創性,先見性は十分である.
|