研究概要 |
ダブル配列の圧縮手法について,次のアルゴリズムの提案と,ソフトウェアの開発を行った. 1.現在の状態番号sと次の状態番号tとの差分を用いてダブル配列を作成するために,トライの深さごとにダブル配列を分割するデータ構造を提案した.このデータ構造により,t-sの値を小さく押さえることができるので,BASEの最大値を小さくできる. 2.1のデータ構造により,必ずs<tとなるので,t-s>0が保証される.この値をCHECKに格納することにより,CHECKの値を小さくできる. 3.ダブル配列を分割したように,トライの深さごとにTAILを分割することにより,MPトライのダブル配列において,BASEの絶対値を小さい値で押さえることができる. 4.この相対状態番号を用いたダブル配列(相対ダブル配列)を静的なキー集合に対して作成するアルゴリズムと,検索を行うアルゴリズムを提案した. 5.相対ダブル配列の理論的評価を行い,本手法の有効性を示した. 6.EDRから抽出した,日本語,英語の10万〜25万キーワードを登録し,通常のダブル配列と比較して50%〜70%の圧縮を行うことができた.しかし,検索速度は,2〜5倍となった.
|