• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

情報検索のためのコンパクトなデータ構造とその動的更新に関する研究

研究課題

研究課題/領域番号 15700002
研究種目

若手研究(B)

配分区分補助金
研究分野 情報学基礎
研究機関九州大学

研究代表者

定兼 邦彦  九州大学, 大学院・システム情報科学研究院, 助教授 (20323090)

研究期間 (年度) 2003 – 2004
研究課題ステータス 完了 (2004年度)
配分額 *注記
2,000千円 (直接経費: 2,000千円)
2004年度: 1,400千円 (直接経費: 1,400千円)
2003年度: 600千円 (直接経費: 600千円)
キーワード接尾辞配列 / 圧縮接尾辞配列 / 文字列検索 / 文字列圧縮 / 省スペース / 文書データベース / データ圧縮 / 情報検索 / アルゴリズム
研究概要

大量データ処理のための領域効率のよいアルゴリズムとデータ構造の開発を行った.まず,文字列の高速検索を行うデータ構造として,すでに圧縮接尾辞配列が提案されているが,それを構築する省メモリなアルゴリズムを開発した.このアルゴリズムは定数サイズアルファベット上の文字列に関しては時間・領域ともに最適であり,定数サイズではない場合にも従来手法より高速である.具体的には,アルファベットサイズをΣ,文字列長をnとしたとき,O(n log Σ)領域,O(n log n)時間である.また,このアルゴリズムよりも時間はかかるが,圧縮率の高い文字列についてはさらに省スペースなアルゴリズムも考案した.計算量は,O(n log n)時間である(HOは文字列の次数0のエントロピー).
次に,複数の文字列の検索が可能なデータ構造を提案した.これは文字列の挿入・削除を高速に実行でき,検索も高速である.また,文字列だけでなく,一般の数列を表現するデータ構造についても考察した.このデータ構造は,数字の更新(増加),数列の和,検索を効率よく行え,必要な領域はほぼ最適である.
さらに,圧縮接尾辞配列のデータ構造として二次記憶での実装や分散環境に適したものを提案した.これにより,より大量のデータに対する検索を高速に行えるようになった.

報告書

(2件)
  • 2004 実績報告書
  • 2003 実績報告書
  • 研究成果

    (12件)

すべて 2004 2003 その他

すべて 雑誌論文 (6件) 文献書誌 (6件)

  • [雑誌論文] Advantages of Backward Searching - Efficient Secondary Memory and Distributed Implementation of Compressed Suffix Arrays2004

    • 著者名/発表者名
      Veli Makinen, Gonzalo Navarro, Kunihiko Sadakane
    • 雑誌名

      15th International Symposium on Algorithms and Computation. Lecture Notes in Computer Science 3341

      ページ: 681-692

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Compressed Index for Dynamic Text2004

    • 著者名/発表者名
      W.K.Hon, T.W.Lam, Kunihiko Sadakane, W.K Sung, S.M Yiu
    • 雑誌名

      Data Compression Conference, IEEE Computer Society

      ページ: 102-111

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Breaking a Time-and-Space Barrier in Constructing Full-Text Indices2003

    • 著者名/発表者名
      Wing-Kai Hon, Kunihiko Sadakane, Wing-Kin Sung
    • 雑誌名

      44th Symposium on Foundations of Computer Science, Proceedings, IEEE Computer Society

      ページ: 251-260

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Constructing Compressed Suffix Arrays with Large Alphabets2003

    • 著者名/発表者名
      Wing-Kai Hon, Tak-Wah Lam, Kunihiko Sadakane, Wing-Kin Sung
    • 雑誌名

      14th International Symposium on Algorithms and Computation. Lecture Notes in Computer Science 2906

      ページ: 240-249

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Succinct Data Structures for Searchable Partial Sums2003

    • 著者名/発表者名
      Wing-Kai Hon, Kunihiko Sadakane, Wing-Kin Sung
    • 雑誌名

      14th International Symposium on Algorithms and Computation. Lecture Notes in Computer Science 2906

      ページ: 505-516

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] New text indexing functionalities of the compressed suffix arrays2003

    • 著者名/発表者名
      Kunihiko Sadakane
    • 雑誌名

      Journal of Algorithms 48(2)

      ページ: 294-313

    • 関連する報告書
      2004 実績報告書
  • [文献書誌] W.K.Hon, K.Sadakane, W.K.Sung: "Breaking a Time-and-Space Barrier in Constructing Full-Text Indices"Proceedings of IEEE Symposium on Foundations of Computer Science(FOCS). Vol.44. 251-261 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] K.Sadakane: "New Text Indexing Functionalities of the Compressed Suffix Arrays"Journal of Algorithms. Vol.48, No.2. 294-313 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] W.K.Hon, T.W.Lam, K.Sadakane, W.K.Sung: "Constructing Compressed Suffix Arrays with Large Alphabets"Proceedings of International Symposium on Algorithms and Computation(ISAAC). Vol.14. 240-249 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] W.K.Hon, K.Sadakane, W.K.Sung: "Succinct Data Structures for Searchable Partial Sums"Proceedings of International Symposium on Algorithms and Computation(ISAAC). Vol.14. 505-516 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 定兼 邦彦, 渡邉 大輔: "文書列挙問題に対する実用的なデータ構造"日本データベース学会Letters. Vol.2, No.1. 103-106 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 韓 永楷, 定兼 邦彦, 宋 永健: "全文索引構築のための省スペースなアルゴリズム"情報科学技術レターズ. Vol.2, No.LD-002. 67-68 (2003)

    • 関連する報告書
      2003 実績報告書

URL: 

公開日: 2003-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi