圧縮文字列上の高速パターン列挙に関する基盤技術開発
Project/Area Number |
12J06417
|
Research Category |
Grant-in-Aid for JSPS Fellows
|
Allocation Type | Single-year Grants |
Section | 国内 |
Research Field |
Fundamental theory of informatics
|
Research Institution | Kyushu University |
Principal Investigator |
井 智弘 九州大学, 大学院・システム情報科学研究院, 特別研究員(PD)
|
Project Period (FY) |
2012 – 2013
|
Project Status |
Completed (Fiscal Year 2013)
|
Budget Amount *help |
¥2,000,000 (Direct Cost: ¥2,000,000)
Fiscal Year 2013: ¥1,000,000 (Direct Cost: ¥1,000,000)
Fiscal Year 2012: ¥1,000,000 (Direct Cost: ¥1,000,000)
|
Keywords | 圧縮文字列処理 / 文字列中の規則性発見 / 文字列パターン列挙 |
Research Abstract |
本年度は, 本研究テーマの一つの集大成として, 圧縮された文字列データから規則性をもった部分文字列を高速に計算・列挙する手法を開発した. 繰り返し構造や回文構造といった文字列の規則性の発見は文字列処理の基礎であり, また, ゲノムデータの解析などに応用出来る. 圧縮文字列処理では展開文字列長に比例する計算資源を用いないことを目標としており, そのため圧縮文字列を全て展開せずに処理しなければいけないという難しさがあるが, 解の列挙においてはさらに出力の仕方も問題になる. 単純に出力すると出力サイズに比例する時間を避ける事ができず, 今回の出力である繰り返し構造や回文構造の数は展開文字列長に比例するためである. 本手法では, 圧縮された文字列を展開する事無く処理を行い, かつ, 出力の圧縮表現を計算することでこの問題を回避した. これにより, ゲノムデータなどの大規模文字列データも, それが良く圧縮されているならば省領域かつ高速に規則性を発見することが出来る. この結果は38th International Symposium on Mathematical Foundations of Computer Science (MFCS2013)に採択され発表を行った. また, 圧縮された文字列上の組み合わせ的性質を探る研究として圧縮文字列とLyndon文字列との関連性を探った. Lyndon文字列およびそれを基にしたLyndon分解は代数学と深く関連しており古くから知られているが, 近年はアルゴリズムへの応用も注目されている. 申請者らは24th Annual Symposium on Combinatorial Pattern Matching (CPM2013)と20th Symposium on String Processing and Information Retrieval (SPIRE 2013)において圧縮文字列からLyndon分解を効率的に求めるアルゴリズムを開発した. その過程において, Lyndon分解の項数が文法圧縮サイズの下界になっているという興味深い知見を得ている.
|
Strategy for Future Research Activity |
(抄録なし)
|
Report
(2 results)
Research Products
(35 results)
-
-
-
-
-
-
-
-
[Journal Article] Detecting regularities on grammar-compressed strings2013
Author(s)
Tomohiro I, Wataru Matsubara, Kouji Shimohira, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda, Kazuyuki Narisawa and Ayumi Shinohara
-
Journal Title
In Proc. the 38th International Symposium on Mathematical Foundations of Computer Science (MFCS 2013)
Volume: LNCS 8087
Pages: 571-582
Related Report
Peer Reviewed
-
-
-
-
-
-
-
-
[Journal Article] The position heap of a trie2012
Author(s)
Yuto Nakashima, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
-
Journal Title
In Proceedings of the 19th Symposium on String Processing and Information Retrieval
Volume: LNCS 7608
Pages: 360-371
DOI
ISBN
9783642341083, 9783642341090
Related Report
Peer Reviewed
-
-
[Presentation] Faster Sparse Suffix Sorting2014
Author(s)
Tomohiro I, Juha Kärkkäinen and Dominik Kempa
Organizer
the 31st Symposium on Theoretical Aspects of Computer Science (STACS 2014)
Place of Presentation
Lyon, France
Year and Date
2014-03-06
Related Report
-
-
-
-
-
-
-
[Presentation] Detecting regularities on grammar-compressed strings2013
Author(s)
Tomohiro I, Wataru Matsubara, Kouji Shimohira, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda, Kazuyuki Narisawa and Ayumi Shinohara
Organizer
the 38th International Symposium on Mathematic al Foundations of Computer Science (MFCS 2013)
Place of Presentation
Klosterneuburg, Austria
Year and Date
2013-08-27
Related Report
-
[Presentation] Lyndon分解の逆問題2013
Author(s)
中島祐人, 岡部駿志, 井智弘, 稲永俊介, 坂内英夫, 竹田正幸
Organizer
夏のLAシンポジウム2013
Place of Presentation
日本, 福岡
Year and Date
2013-07-17
Related Report
-
[Presentation] Compressed Automata for Dictionary Matching2013
Author(s)
Tomohiro I, Takaaki Nishimoto, Shunsuke Inenaga, Hideo Bannai and Masayuki Takeda
Organizer
the 18th International Conference on Implementa tion and Application of Automata (CIAA 2013)
Place of Presentation
Halifax, Nova Scotia, Canada
Year and Date
2013-07-16
Related Report
-
-
-
-
[Presentation] The position heap of a trie2012
Author(s)
Yuto Nakashima, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
Organizer
Synposiun on String Processing and Information Retrieval (SPIRE 2012)
Place of Presentation
コロンビア, カルタヘナ
Year and Date
2012-10-23
Related Report
-
-
-
-