• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2013 Fiscal Year Annual Research Report

圧縮マイニング:超大規模テキストに埋もれている知識の顕在化

Research Project

Project/Area Number 23680016
Research InstitutionKyushu Institute of Technology

Principal Investigator

坂本 比呂志  九州工業大学, 大学院情報工学研究院, 教授 (50315123)

Project Period (FY) 2011-04-01 – 2015-03-31
Keywordsデータ圧縮 / 簡潔データ構造 / ストリームデータ / 文法圧縮
Research Abstract

あまりにも巨大なテキストは,読むことができないデータとほぼ同じであり,このようなデータの洪水に立ち向かうための次世代基盤技術の確立が急務である.本研究は,データ圧縮によって巨大テキストの俯瞰を可能にし,気づかれずに埋もれている知識を顕在化する圧縮マイニングを実現する.具体的には,これまでに申請者が開発した,テキスト中のパターンの関係を保存しながら圧縮する技術をマイニングに応用することで,GB 超~TB クラスの巨大テキスト同士の直接比較を可能にする.そして,これまでは歯が立たなかった超大規模テキストから知識を掘り起こし,まとまりごとに再構成することで知識を顕在化する.最終的には開発した手法の実世界応用をめざし,プログラムの公開を含めて成果を社会に向けて発信する.25年度は,前年に新しく見つかった理論的知見を拡張したため,その成果を基礎とする大規模データ処理のための新しい枠組みと高速アルゴリズムを開発した.具体的には以下のような成果を得た.
【アルゴリズムの実装】
大規模ストリームデータ処理を限られたメモリ上で実現するための新しい手法を開発し,理論及び実験の両方でその有効性を確認した.この成果は複数の国際会議において発表し,高い評価を得た.
【実世界応用】
ゲノムデータやtwitterなど幅広い実世界データに対して,本手法の有効性を確認した.この成果は,ビッグデータ専門の国際会議で採択され,評価を受けた.
本研究課題は,4年間の計画であったが,最終年度の前年度に基盤研究(B)に採択されたため,引き続き発展的課題について取り組む.

Current Status of Research Progress
Reason

25年度が最終年度であるため、記入しない。

Strategy for Future Research Activity

25年度が最終年度であるため、記入しない。

  • Research Products

    (6 results)

All 2014 2013

All Journal Article (3 results) (of which Peer Reviewed: 3 results) Presentation (2 results) Book (1 results)

  • [Journal Article] A Reconfigurable Stream Compression Hardware based on Static Symbol-Lookup Table2014

    • Author(s)
      S. Yamagiwa, H. Sakamoto
    • Journal Title

      The First Workshop on Benchmarks, Performance Optimization, and Emerging hardware of Big Data Systems and Applications

      Volume: 1 Pages: 86-93

    • DOI

      10.1109/BigData.2013.6691702

    • Peer Reviewed
  • [Journal Article] Fully-Online Grammar Compression2013

    • Author(s)
      S. Maruyama, Y. Tabei, H. Sakamoto, K. Sadakane
    • Journal Title

      20th International Symposium on String Processing and Information Retrieval

      Volume: 8214 Pages: 218-229

    • DOI

      10.1007/978-3-319-02432-5_25

    • Peer Reviewed
  • [Journal Article] A Succinct Grammar Compression2013

    • Author(s)
      Yasuo Tabei, Yoshimasa Takabatake, Hiroshi Sakamoto
    • Journal Title

      24th Annual Symposium on Combinatorial Pattern Matching

      Volume: 7922 Pages: 235-246

    • DOI

      10.1007/978-3-642-38905-4_23

    • Peer Reviewed
  • [Presentation] 頻度情報に基づく省スペースなオンライン文法圧縮2014

    • Author(s)
      前田幸司, 高畠嘉将, 坂本比呂志
    • Organizer
      第92回人工知能基本問題研究会
    • Place of Presentation
      函館市民会館
    • Year and Date
      20140130-20140131
  • [Presentation] 文法圧縮に基づく自己索引の省スペース化2013

    • Author(s)
      高畠嘉将, 坂本比呂志
    • Organizer
      第90回 人工知能基本問題研究会
    • Place of Presentation
      稚内日ロ友好会館
    • Year and Date
      20130718-20130719
  • [Book] ビッグデータマネージメント2014

    • Author(s)
      坂本比呂志(共著)
    • Total Pages
      320
    • Publisher
      NTS

URL: 

Published: 2015-05-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi