• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2011 Fiscal Year Annual Research Report

超高速圧縮データストリーム処理に基づく軽量XMLデータベース管理システム基盤技術

Research Project

Project/Area Number 22300010
Research InstitutionKyushu University

Principal Investigator

竹田 正幸  九州大学, 大学院・システム情報科学研究院, 教授 (50216909)

Co-Investigator(Kenkyū-buntansha) 瀧本 英二  九州大学, 大学院・システム情報科学研究院, 教授 (50236395)
篠原 歩  東北大学, 大学院・情報科学研究科, 教授 (00226151)
坂本 比呂志  九州工業大学, 情報工学部, 准教授 (50315123)
坂内 英夫  九州大学, 大学院・システム情報科学研究院, 准教授 (20323644)
畑埜 晃平  九州大学, 大学院・システム情報科学研究院, 助教 (60404026)
Keywordsアルゴリズム / 暗号・認証等 / 情報工学 / ディレクトリ・情報検索 / ソフトウェア開発効率化
Research Abstract

本研究では、圧縮データ処理に基づく軽量XMLデータベース管理システム基盤技術の確立を目指している。本年度は、主として、以下の成果を得ることができた。
A.圧縮テキスト上の高速パターン照合に適した文法圧縮アルゴリズムの開発
圧縮パターン照合に適した圧縮形式であるStraight-Line Program (SLP)をとりあげ、テキストからサイズの小さいSLPを得るための高速軽量な文法圧縮アルゴリズムの開発を行い、既存の文法圧縮アルゴリズムに比べて高い性能を示すことを実証した。
B.圧縮テキスト上のq-グラム統計計算アルゴリズムの開発.
SLP上でq-グラム統計を求める多項式時間アルゴリズムを開発した。これは、「圧縮データマイニング」の第一歩として大変意義のある結果である。また、その高速化に成功し、「圧縮による高速化」という目標をも達成した。さらに、重複を許さないq-グラム統計を求める多項式時間アルゴリズムの開発にも成功した。
C.高速XMLデータストリームフィルタリング技術の開発.
XMLデータストリーム処理アルゴリズムにはリアルタイム処理と省スペースが求められる。解が得られるたびに遅延なく出力するストリームアルゴリズムをeagerとよぶ。既存アルゴリズムは、計算時間・領域は効率的であるものの、lazyであるという欠点があった。本研究では、計算量を維持したまま、eagerに改善することに成功した。
D.その他
データベースシステムのもつ知的情報処理機能として、機械学習およびそれに基づく知識発見、分類に関する研究を行い、多くの成果を得た。また、圧縮率向上に寄与するオンライン予測に関する研究成果も得られた。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

高速軽量な文法圧縮アルゴリズムの開発に成功し、文法圧縮の実用化への道筋をつけた。また、圧縮データ上でq-グラム統計を求めるアルゴリズムの効率化に取り組み、理論と実用の両面から優れた成果をあげることができた。

Strategy for Future Research Activity

計画計画の進捗は順調であり、今後も計画に沿って進めていく。

  • Research Products

    (28 results)

All 2012 2011

All Journal Article (21 results) (of which Peer Reviewed: 21 results) Presentation (7 results)

  • [Journal Article] An Online Algorithm for Lightweight Grammar-Based Compression2012

    • Author(s)
      Shirou Maruyama, et al
    • Journal Title

      Algorithms

      Volume: 5(2) Pages: 214-235

    • Peer Reviewed
  • [Journal Article] Speeding-up q-gram mining on grammar-based compressed texts2012

    • Author(s)
      Keisuke Goto, et al
    • Journal Title

      Proc.the 23rd Annual Symposium on Combinatorial Pattern Matching (CPM'12)

    • Peer Reviewed
  • [Journal Article] Finding Characteristic Substrings from Compressed Texts2012

    • Author(s)
      Shunsuke Inenaga, et al
    • Journal Title

      International Journal of Foundations of Computer Science

      Volume: 23(2) Pages: 261-280

    • Peer Reviewed
  • [Journal Article] Computing q-gram Non-overlapping Frequencies on SLP Compressed Texts2012

    • Author(s)
      Keisuke Goto, et al
    • Journal Title

      Proc.38th International Conference on Current Trends in Theory and Practice of Computer Science (SOFSEM'12)

      Pages: 301-312

    • Peer Reviewed
  • [Journal Article] Functional Programs as Compressed Data2012

    • Author(s)
      Naoki Kobayashi, et al
    • Journal Title

      ACM SIGPLAN 2012 Workshop on Partial Evaluation and Program Manipulation (PEPM 2012)

      Pages: 121-130

    • Peer Reviewed
  • [Journal Article] Adaptive Online Prediction Using Weighted Windows2011

    • Author(s)
      Shin-ichi Yoshida, et al
    • Journal Title

      IEICE Trans.on Information and Systems

      Volume: E94-D(10) Pages: 1917-1923

    • Peer Reviewed
  • [Journal Article] Verifying and Enumerating Parameterized Border Arrays2011

    • Author(s)
      Tomohiro I, et al
    • Journal Title

      Theoretical Computer Science

      Volume: 412(50) Pages: 6959-6981

    • Peer Reviewed
  • [Journal Article] Similarity Measure using Lossy Compression and its Application to Image Retrieval2011

    • Author(s)
      Kosuke Bannai, et al
    • Journal Title

      e GSTF International Journal on Computing (JoC)

      Volume: 1(3) Pages: 45-50

    • Peer Reviewed
  • [Journal Article] Online Linear Optimization over Permutations2011

    • Author(s)
      Shota Yasutake, et al
    • Journal Title

      Proc.22nd International Symposium on Algorithms and Computation (ISAAC'11)

      Pages: 534-543

    • Peer Reviewed
  • [Journal Article] Music Genre Classification using Similarity Functions2011

    • Author(s)
      Yoko Anan, et al
    • Journal Title

      Proc.12th International Society for Music Information Retrieval Conference 2011 (ISMIR'11)

      Pages: 693-698

    • Peer Reviewed
  • [Journal Article] Fast q-gram Mining on SLP Compressed Strings2011

    • Author(s)
      Keisuke Goto, et al
    • Journal Title

      Proc.18th edition of the Symposium on String Processing and Information Retrieval (SPIRE'11)

      Pages: 278-289

    • Peer Reviewed
  • [Journal Article] Efficient Eager XPath Filtering over XML Streams2011

    • Author(s)
      Kazuhito Hagio, et al
    • Journal Title

      Proc.Prague Stringology Conference 2011 (PSC'11)

      Pages: 30-44

    • Peer Reviewed
  • [Journal Article] Inferring Strings from Suffix Trees and Links on a Binary Alphabet2011

    • Author(s)
      Tomohiro I, et al
    • Journal Title

      Proc.Prague Stringology Conference 2011 (PSC'11)

      Pages: 121-131

    • Peer Reviewed
  • [Journal Article] Computing Longest Common Substring/Subsequence of Non-linear Texts2011

    • Author(s)
      Kouji Shimohira, et al
    • Journal Title

      Proc.Prague Stringology Conference 2011 (PSC'11)

      Pages: 197-208

    • Peer Reviewed
  • [Journal Article] An Online Algorithm for Lightweight Grammar-Based Compression2011

    • Author(s)
      Shirou Maruyama, et al
    • Journal Title

      Proc.1st International Conference on Data Compression, Communication and Processing (CCP'11)

      Pages: 19-28

    • Peer Reviewed
  • [Journal Article] Palindrome Pattern Matching2011

    • Author(s)
      Tomohiro I, et al
    • Journal Title

      Proc.the 22nd Annual Symposium on Combinatorial Pattern Matching (CPM'11)

      Pages: 232-245

    • Peer Reviewed
  • [Journal Article] Faster Subsequence and Don't-Care Pattern Matching on Compressed Texts2011

    • Author(s)
      Takanori Yamamoto, et al
    • Journal Title

      Proc.the 22nd Annual Symposium on Combinatorial Pattern Matching (CPM'11)

      Pages: 309-322

    • Peer Reviewed
  • [Journal Article] Approximate Reduction from AUC Maximization to 1-norm Soft Margin Optimization2011

    • Author(s)
      Daiki Suehiro, et al
    • Journal Title

      Proceedings of the 22nd International Conference on Algorithmic Learning Theory (ALT 2011)

      Pages: 324-337

    • Peer Reviewed
  • [Journal Article] Scalable Detection of Frequent Substrings by Grammar-Based Compression2011

    • Author(s)
      M.Nakahara, et,al
    • Journal Title

      The 14th International Conference on Discovery Science (DS 2011)

      Pages: 236-246

    • Peer Reviewed
  • [Journal Article] ESP-Index : A Compressed Index Based on Edit-Sensitive Parsing2011

    • Author(s)
      S.Maruyama, et al
    • Journal Title

      18th International Symposium on String Processing and Information Retrieval (SPIRE2011)

      Pages: 398-409

    • Peer Reviewed
  • [Journal Article] An Online Algorithm for Lightweight Grammar-Based Compression2011

    • Author(s)
      S.Maruyama, et al
    • Journal Title

      1st International Conference on Data Compression, Communication, and Processing (CCP2011)

      Pages: 19-28

    • Peer Reviewed
  • [Presentation] モンテカルロ木探索問題に対する効率的サンプリング手法2012

    • Author(s)
      寺岡和紀
    • Organizer
      冬のLAシンポジウム
    • Place of Presentation
      京都大学
    • Year and Date
      2012-01-30
  • [Presentation] Approximate Reduction from AUC Maximization to 1-norm Soft Margin Optimization2011

    • Author(s)
      Daiki Suehiro
    • Organizer
      NIPS 2011 Workshop on Computational Trade-offs in Statistical Learning
    • Place of Presentation
      Sierra Nevada, Spain
    • Year and Date
      2011-12-16
  • [Presentation] Online Rank Aggregation2011

    • Author(s)
      Shota Yasutake
    • Organizer
      NIPS 2011 Workshop on Computational Trade-offs in Statistical Learning
    • Place of Presentation
      Sierra Nevada, Spain
    • Year and Date
      2011-12-16
  • [Presentation] 組み合わせ論的オンライン予測問題2011

    • Author(s)
      瀧本英二
    • Organizer
      第14回情報論的学習理論ワークショップ(IBIS 2011)
    • Place of Presentation
      奈良女子大学
    • Year and Date
      2011-11-10
  • [Presentation] Approximate Reduction from AUC Maximization to 1-norm Soft Margin Optimization2011

    • Author(s)
      Daiki Suehiro
    • Organizer
      第14回情報論的学習理論ワークショップ(IBIS 2011)
    • Place of Presentation
      奈良女子大学
    • Year and Date
      2011-11-10
  • [Presentation] k選択多腕バンディット問題2011

    • Author(s)
      金城瞬
    • Organizer
      夏のLAシンポジウム
    • Place of Presentation
      静岡県湖西市
    • Year and Date
      2011-07-19
  • [Presentation] Online Prediction over Permutahedron2011

    • Author(s)
      Shota Yasutake
    • Organizer
      The 14th Korea-Japan Joint Workshop on Algorithms and Computation (WAAC 2011)
    • Place of Presentation
      Busan, Korea
    • Year and Date
      2011-07-08

URL: 

Published: 2013-06-26  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi