2006 年度実績報告書

ユビキタス環境におけるダブル配列を用いた検索データベースの圧縮法に関する研究

研究課題

研究課題/領域番号	17700116
研究機関	徳島大学
研究代表者	泓田正雄徳島大学, 大学院・ソシオテクノサイエンス研究部, 助教授 (10304552)
キーワード	キー検索 / 辞書 / データベース / ダブル配列 / トライ / 圧縮
研究概要	ダブル配列をトライの深さごとに分割し,その分割したブロックの開始位置からの距離をBASE値とすることにより圧縮する手法のデータ構造とアルゴリズムを提案した.本手法を用いて,現在までに研究されている圧縮手法をさらに圧縮できることを確認した. 1.トライの深さごとにブロックに分割を行った.各ブロックのBASE値を,次のブロックの開始位置からの距離とすることにより,各BASE値を小さくすることができ,BASE配列を圧縮することができた. 2.分割したブロックのサイズが異なることに着目し,ダブル配列の2式を次のブロックとの大きさの割合をBASE値にかける次の式に変更することにより.さらにBASE値を小さく出来た. t=sr[d] + BASE[d][s] + CODE[c] t - sr[d] = CHECK[d+1][t] ここでrは次のブロックとの大きさの割合.dは,トライの深さを表す. 3.1,2の手法を実現したまま,CHECK値に遷移した文字を格納し,CHECK配列を圧縮できることを確認した. 4.上記のアルゴリズムをコンピュータ上で実現し,できるだけBASEの値が小さくなるように,試行錯誤を繰り返し,キーの追加アルゴリズムを改善した. 5.特許記事から抽出した数百万件に及ぶキー集合を登録し圧縮率を求めた.また,従来のダブル配列,17年度の手法との圧縮率,速度の比較実験を行った.

研究成果
(6件)

すべて 2007 2006

すべて雑誌論文 (6件)

[雑誌論文] ダブル配列を用いたマシンACの効率的格納手法2007
- 著者名/発表者名
  信種真人
- 雑誌名
  
  言語処理学会第13回年次大会論文誌
  
  ページ: 831-834
[雑誌論文] 部分文字列を用いた綴り誤りに対する訂正候補の高速検索手法2007
- 著者名/発表者名
  藤澤信夫
- 雑誌名
  
  言語処理学会第13回年次大会論文誌
  
  ページ: 962-965
[雑誌論文] 接頭辞ダブル配列における空間効率を低下させないキー削除法2006
- 著者名/発表者名
  矢田晋
- 雑誌名
  
  情報処理学会論文誌 Vol.47, No.6
  
  ページ: 1894-1902
[雑誌論文] Automatic building of new Field Association word candidates using search engine2006
- 著者名/発表者名
  Atlam EL-Sayed
- 雑誌名
  
  Journal of Information Processing ＆ Management Vol.42, No.4
  
  ページ: 951-963
[雑誌論文] Building New Field Association Term Candidates Automatically by Search Engine2006
- 著者名/発表者名
  Masao Fuketa
- 雑誌名
  
  Proceedings of 10th International Conference on Knowledge-Based Intelligent Information and Engineering Systems Vol.2
  
  ページ: 325-330
[雑誌論文] A compact static double-array keeping character codes2006
- 著者名/発表者名
  Susumu Yata
- 雑誌名
  
  Journal of Information Processing ＆ Management Vol.43, No.1
  
  ページ: 237-247

2006 年度 実績報告書

ユビキタス環境におけるダブル配列を用いた検索データベースの圧縮法に関する研究

研究代表者

泓田 正雄 徳島大学, 大学院・ソシオテクノサイエンス研究部, 助教授 (10304552)

研究成果

[雑誌論文] ダブル配列を用いたマシンACの効率的格納手法2007

著者名/発表者名

雑誌名

[雑誌論文] 部分文字列を用いた綴り誤りに対する訂正候補の高速検索手法2007

著者名/発表者名

雑誌名

[雑誌論文] 接頭辞ダブル配列における空間効率を低下させないキー削除法2006

著者名/発表者名

雑誌名

[雑誌論文] Automatic building of new Field Association word candidates using search engine2006

著者名/発表者名

雑誌名

[雑誌論文] Building New Field Association Term Candidates Automatically by Search Engine2006

著者名/発表者名

雑誌名

[雑誌論文] A compact static double-array keeping character codes2006

著者名/発表者名

雑誌名

2006 年度実績報告書

泓田正雄徳島大学, 大学院・ソシオテクノサイエンス研究部, 助教授 (10304552)