• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

ユビキタス環境におけるダブル配列を用いた検索データベースの圧縮法に関する研究

研究課題

研究課題/領域番号 17700116
研究種目

若手研究(B)

配分区分補助金
研究分野 メディア情報学・データベース
研究機関徳島大学

研究代表者

泓田 正雄  徳島大学, 大学院・ソシオテクノサイエンス研究部, 助教授 (10304552)

研究期間 (年度) 2005 – 2006
研究課題ステータス 完了 (2006年度)
配分額 *注記
1,400千円 (直接経費: 1,400千円)
2006年度: 700千円 (直接経費: 700千円)
2005年度: 700千円 (直接経費: 700千円)
キーワードキー検索 / 辞書 / データベース / ダブル配列 / トライ / 圧縮
研究概要

ダブル配列をトライの深さごとに分割し,その分割したブロックの開始位置からの距離をBASE値とすることにより圧縮する手法のデータ構造とアルゴリズムを提案した.本手法を用いて,現在までに研究されている圧縮手法をさらに圧縮できることを確認した.
1.トライの深さごとにブロックに分割を行った.各ブロックのBASE値を,次のブロックの開始位置からの距離とすることにより,各BASE値を小さくすることができ,BASE配列を圧縮することができた.
2.分割したブロックのサイズが異なることに着目し,ダブル配列の2式を次のブロックとの大きさの割合をBASE値にかける次の式に変更することにより.さらにBASE値を小さく出来た.
t=s*r[d] + BASE[d][s] + CODE[c]
t - s*r[d] = CHECK[d+1][t]
ここでrは次のブロックとの大きさの割合.dは,トライの深さを表す.
3.1,2の手法を実現したまま,CHECK値に遷移した文字を格納し,CHECK配列を圧縮できることを確認した.
4.上記のアルゴリズムをコンピュータ上で実現し,できるだけBASEの値が小さくなるように,試行錯誤を繰り返し,キーの追加アルゴリズムを改善した.
5.特許記事から抽出した数百万件に及ぶキー集合を登録し圧縮率を求めた.また,従来のダブル配列,17年度の手法との圧縮率,速度の比較実験を行った.

報告書

(2件)
  • 2006 実績報告書
  • 2005 実績報告書
  • 研究成果

    (8件)

すべて 2007 2006 2005

すべて 雑誌論文 (8件)

  • [雑誌論文] ダブル配列を用いたマシンACの効率的格納手法2007

    • 著者名/発表者名
      信種 真人
    • 雑誌名

      言語処理学会第13回年次大会論文誌

      ページ: 831-834

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] 部分文字列を用いた綴り誤りに対する訂正候補の高速検索手法2007

    • 著者名/発表者名
      藤澤 信夫
    • 雑誌名

      言語処理学会第13回年次大会論文誌

      ページ: 962-965

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] 接頭辞ダブル配列における空間効率を低下させないキー削除法2006

    • 著者名/発表者名
      矢田 晋
    • 雑誌名

      情報処理学会論文誌 Vol.47, No.6

      ページ: 1894-1902

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] Automatic building of new Field Association word candidates using search engine2006

    • 著者名/発表者名
      Atlam EL-Sayed
    • 雑誌名

      Journal of Information Processing & Management Vol.42, No.4

      ページ: 951-963

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] Building New Field Association Term Candidates Automatically by Search Engine2006

    • 著者名/発表者名
      Masao Fuketa
    • 雑誌名

      Proceedings of 10th International Conference on Knowledge-Based Intelligent Information and Engineering Systems Vol.2

      ページ: 325-330

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] A compact static double-array keeping character codes2006

    • 著者名/発表者名
      Susumu Yata
    • 雑誌名

      Journal of Information Processing & Management Vol.43, No.1

      ページ: 237-247

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] A Method of Extracting and Evaluating Good and Bad Reputations for Natural Language Expressions2005

    • 著者名/発表者名
      Masao Fuketa
    • 雑誌名

      Information Technology & Decision Making Vol.4, No.2

      ページ: 177-196

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] A Sentence Classification Technique by Using Intention Association Expressions2005

    • 著者名/発表者名
      Yuki Kadoya
    • 雑誌名

      Computer Mathematics Vol.82, No.7

      ページ: 777-792

    • 関連する報告書
      2005 実績報告書

URL: 

公開日: 2005-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi