2009 Fiscal Year Annual Research Report

文字列圧縮技術を基盤とした知織発見アルゴリズムの開発

Research Project

Project/Area Number	09J05720
Research Institution	Tohoku University
Principal Investigator	松原渉 Tohoku University, 大学院・情報科学研究科, 特別研究員(DC1)
Keywords	文字列処理 / 繰り返し構造 / データ圧縮 / アルゴリズム
Research Abstract	取り扱うデータ量が爆発的に増加しているなか,データ圧縮を単に保存領域の削減にとどまらず,処理の効率化を目的とした,圧縮文字列のための文字列アルゴリズムの開発を行うことが本研究のテーマである.今年度は,圧縮の基本構造である繰り返しに着目し,以下の2つの研究を行った. 1つに文字列の繰り返し構造が与えられたとき,入力に無矛盾な文字列を推測する問題について解析を行った.結果として問題の難しさがアルファベットサイズに依存することを明らかにした.アルファベットサイズが無制限もしくはバイナリのとき,高速に解くアルゴリズムを示し,アルファベットサイズが4以上のとき,NP完全となることを示した.この成果は昨年8月にLAシンポジウムにて口頭発表した. 2つに圧縮文字列照合について,すべての移調パタンを多項式時間で検出するアルゴリズムを提案した.移調パタンとは,パタンに文字の置換関数を任意の回数だけ適用して得られるすべてのパタンを指す.移調パタンを見つけることにより,楽譜から特定の旋律を見つけ出す,音楽検索が実現できる.提案アルゴリズムでは,周期性補題を拡張することにより,特定の位置に現れるパタン出現位置を等差数列表現で効率良く保持できることに着目した.この性質を用いて圧縮テキスト長をn,圧縮パタン長をm,アルファベットサイズを\sigmaとして,0(\sqrt{\sigma}n^4)時間,0(n^2)領域で動作するアルゴリズムを示した.この成果は本年4月に行われるコンピュテーション研究会にて発表予定であり,国際学会への投稿を準備中である.

Research Products
(4 results)

All 2010 2009 Other

All Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (1 results) Remarks (1 results)

[Journal Article] An Efficient Algorithm to Test Square-Freeness of String Compressed by Balanced Straight Line Programs.2010
- Author(s)
  Wataru Matsubara, Shunsuke Inenaga, Ayumi Shinohara.
- Journal Title
  
  Chicago Journal of Theoretical Computer Science (未定)(印刷中)
- Peer Reviewed
[Journal Article] Average Value of Sum of Exponents of Runs in a String2009
- Author(s)
  Kazuhiko Kusano, Wataru Matsubara, Akira Ishino, Ayumi Shinohara.
- Journal Title
  
  International Journal of Foundations of Computer Science (special issue for Prague Stringology Conference) 20
  
  Pages: 1135-1146
- Peer Reviewed
[Presentation] 繰り返し構造からの文字列推測の困難さ2009
- Author(s)
  松原渉
- Organizer
  夏のLAシンポジウム
- Place of Presentation
  松島
- Year and Date
  2009-07-22
[Remarks]
- URL
  http://www.shino.ecei.tohoku.ac.jp/runs/

2009 Fiscal Year Annual Research Report

文字列圧縮技術を基盤とした知織発見アルゴリズムの開発

Principal Investigator

松原 渉 Tohoku University, 大学院・情報科学研究科, 特別研究員(DC1)

Research Products

[Journal Article] An Efficient Algorithm to Test Square-Freeness of String Compressed by Balanced Straight Line Programs.2010

Author(s)

Journal Title

[Journal Article] Average Value of Sum of Exponents of Runs in a String2009

Author(s)

Journal Title

[Presentation] 繰り返し構造からの文字列推測の困難さ2009

Author(s)

Organizer

Place of Presentation

Year and Date

[Remarks]

URL

松原渉 Tohoku University, 大学院・情報科学研究科, 特別研究員(DC1)