• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2014 年度 実績報告書

最適状態探索とCHECK領域の削除によるダブル配列の辞書圧縮手法に関する研究

研究課題

研究課題/領域番号 24500118
研究機関徳島大学

研究代表者

泓田 正雄  徳島大学, ソシオテクノサイエンス研究部, 准教授 (10304552)

研究期間 (年度) 2012-04-01 – 2015-03-31
キーワードトライ / ダブル配列 / 情報検索
研究実績の概要

データを扱う最も基本的な操作である「検索」には,高速化や省メモリ化が必須の条件となっている.検索のためのデータ構造に,木構造の頂点を遷移することにより検索を行うトライ(オートマトンの一種)があり,トライを実現する手法で最も高速な手法がダブル配列である.しかし,ダブル配列は,LOUDSなどの他の手法に比べ,サイズが大きいという問題があるので,ダブル配列の高速性を保ったまま,サイズを小さくする手法の研究がなされている.
ダブル配列ではBASEとCHECKと呼ばれる2つの配列により実現されている.配列の長さはトライの状態数であり,一つの要素はBASEに4バイト,CHECKに1バイト必要となる.本研究では,このCHECK配列を削除することにより,ダブル配列のサイズを圧縮する手法を提案する.従来のダブル配列では,状態sに遷移する文字cがCHECK[s]に格納されていたが,「BASE[s]%出現文字数 = cの内部表現値」とすることにより,BASEに次の遷移先の情報と,遷移してきた文字の2つ情報を保持した.
複数のキー集合に対して実験をした結果,キー集合によってはサイズが大きくなる場合があった.これはBASEに制約をつけたため,配列に空き要素が多くでき,結果的に合計サイズが従来法のサイズを超えてしまったためであった.しかし,キー集合に用いられている文字種が少ない場合には,従来法よりサイズが小さく,検索速度の低下はわずかとなり,有効な手法であることが確認できた.

  • 研究成果

    (1件)

すべて 2014

すべて 学会発表 (1件)

  • [学会発表] Comparisons of Efficient Implementations for DAWG2014

    • 著者名/発表者名
      Masao Fuketa, Kazuhiro Morita and Jun-ichi Aoe
    • 学会等名
      7th International Conference on Computer Science and Information Technology (ICCSIT2014)
    • 発表場所
      Hotel Avenida Palace(Barcelona, Spain)
    • 年月日
      2014-12-22 – 2014-12-24

URL: 

公開日: 2016-06-01  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi