• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

情報検索のためのコンパクトなデータ構造とその動的更新に関する研究

Research Project

Project/Area Number 15700002
Research Category

Grant-in-Aid for Young Scientists (B)

Allocation TypeSingle-year Grants
Research Field Fundamental theory of informatics
Research InstitutionKyushu University

Principal Investigator

定兼 邦彦  九州大学, 大学院・システム情報科学研究院, 助教授 (20323090)

Project Period (FY) 2003 – 2004
Project Status Completed (Fiscal Year 2004)
Budget Amount *help
¥2,000,000 (Direct Cost: ¥2,000,000)
Fiscal Year 2004: ¥1,400,000 (Direct Cost: ¥1,400,000)
Fiscal Year 2003: ¥600,000 (Direct Cost: ¥600,000)
Keywords接尾辞配列 / 圧縮接尾辞配列 / 文字列検索 / 文字列圧縮 / 省スペース / 文書データベース / データ圧縮 / 情報検索 / アルゴリズム
Research Abstract

大量データ処理のための領域効率のよいアルゴリズムとデータ構造の開発を行った.まず,文字列の高速検索を行うデータ構造として,すでに圧縮接尾辞配列が提案されているが,それを構築する省メモリなアルゴリズムを開発した.このアルゴリズムは定数サイズアルファベット上の文字列に関しては時間・領域ともに最適であり,定数サイズではない場合にも従来手法より高速である.具体的には,アルファベットサイズをΣ,文字列長をnとしたとき,O(n log Σ)領域,O(n log n)時間である.また,このアルゴリズムよりも時間はかかるが,圧縮率の高い文字列についてはさらに省スペースなアルゴリズムも考案した.計算量は,O(n log n)時間である(HOは文字列の次数0のエントロピー).
次に,複数の文字列の検索が可能なデータ構造を提案した.これは文字列の挿入・削除を高速に実行でき,検索も高速である.また,文字列だけでなく,一般の数列を表現するデータ構造についても考察した.このデータ構造は,数字の更新(増加),数列の和,検索を効率よく行え,必要な領域はほぼ最適である.
さらに,圧縮接尾辞配列のデータ構造として二次記憶での実装や分散環境に適したものを提案した.これにより,より大量のデータに対する検索を高速に行えるようになった.

Report

(2 results)
  • 2004 Annual Research Report
  • 2003 Annual Research Report
  • Research Products

    (12 results)

All 2004 2003 Other

All Journal Article (6 results) Publications (6 results)

  • [Journal Article] Advantages of Backward Searching - Efficient Secondary Memory and Distributed Implementation of Compressed Suffix Arrays2004

    • Author(s)
      Veli Makinen, Gonzalo Navarro, Kunihiko Sadakane
    • Journal Title

      15th International Symposium on Algorithms and Computation. Lecture Notes in Computer Science 3341

      Pages: 681-692

    • Related Report
      2004 Annual Research Report
  • [Journal Article] Compressed Index for Dynamic Text2004

    • Author(s)
      W.K.Hon, T.W.Lam, Kunihiko Sadakane, W.K Sung, S.M Yiu
    • Journal Title

      Data Compression Conference, IEEE Computer Society

      Pages: 102-111

    • Related Report
      2004 Annual Research Report
  • [Journal Article] Breaking a Time-and-Space Barrier in Constructing Full-Text Indices2003

    • Author(s)
      Wing-Kai Hon, Kunihiko Sadakane, Wing-Kin Sung
    • Journal Title

      44th Symposium on Foundations of Computer Science, Proceedings, IEEE Computer Society

      Pages: 251-260

    • Related Report
      2004 Annual Research Report
  • [Journal Article] Constructing Compressed Suffix Arrays with Large Alphabets2003

    • Author(s)
      Wing-Kai Hon, Tak-Wah Lam, Kunihiko Sadakane, Wing-Kin Sung
    • Journal Title

      14th International Symposium on Algorithms and Computation. Lecture Notes in Computer Science 2906

      Pages: 240-249

    • Related Report
      2004 Annual Research Report
  • [Journal Article] Succinct Data Structures for Searchable Partial Sums2003

    • Author(s)
      Wing-Kai Hon, Kunihiko Sadakane, Wing-Kin Sung
    • Journal Title

      14th International Symposium on Algorithms and Computation. Lecture Notes in Computer Science 2906

      Pages: 505-516

    • Related Report
      2004 Annual Research Report
  • [Journal Article] New text indexing functionalities of the compressed suffix arrays2003

    • Author(s)
      Kunihiko Sadakane
    • Journal Title

      Journal of Algorithms 48(2)

      Pages: 294-313

    • Related Report
      2004 Annual Research Report
  • [Publications] W.K.Hon, K.Sadakane, W.K.Sung: "Breaking a Time-and-Space Barrier in Constructing Full-Text Indices"Proceedings of IEEE Symposium on Foundations of Computer Science(FOCS). Vol.44. 251-261 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] K.Sadakane: "New Text Indexing Functionalities of the Compressed Suffix Arrays"Journal of Algorithms. Vol.48, No.2. 294-313 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] W.K.Hon, T.W.Lam, K.Sadakane, W.K.Sung: "Constructing Compressed Suffix Arrays with Large Alphabets"Proceedings of International Symposium on Algorithms and Computation(ISAAC). Vol.14. 240-249 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] W.K.Hon, K.Sadakane, W.K.Sung: "Succinct Data Structures for Searchable Partial Sums"Proceedings of International Symposium on Algorithms and Computation(ISAAC). Vol.14. 505-516 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] 定兼 邦彦, 渡邉 大輔: "文書列挙問題に対する実用的なデータ構造"日本データベース学会Letters. Vol.2, No.1. 103-106 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] 韓 永楷, 定兼 邦彦, 宋 永健: "全文索引構築のための省スペースなアルゴリズム"情報科学技術レターズ. Vol.2, No.LD-002. 67-68 (2003)

    • Related Report
      2003 Annual Research Report

URL: 

Published: 2003-04-01   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi