研究課題/領域番号 |
19K20213
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分60010:情報学基礎論関連
|
研究機関 | 九州工業大学 |
研究代表者 |
井 智弘 九州工業大学, 大学院情報工学研究院, 准教授 (20773360)
|
研究期間 (年度) |
2019-04-01 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2021年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2020年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2019年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
|
キーワード | 文字列処理 / BW変換 / 圧縮文字列処理 / 圧縮索引 / 一般化文字列照合 / 圧縮変換 / データ圧縮 / 圧縮情報処理 / 文法圧縮 / Burrows-Wheeler変換 |
研究開始時の研究の概要 |
Burrows-Wheeler変換(BW変換)は1994年に圧縮のためのデータ変換手法として提案された.BW変換は,後にデータ処理において様々な利点を有していることが判明し,近年も多くの重要な発見がされている.本研究では,BW変換をデータ処理に適した表現への変換技術と位置付け,その根底にあるアイデアを徹底的に追求することで,大規模データ解析の基盤技術を開発する.
|
研究成果の概要 |
BW変換は文字列中の各文字をその後ろに続く文字列(文脈)によってソートして得られる可逆変換であり,文字列圧縮や圧縮文字列処理に利用されている.本研究の主な成果は以下の通りである.(1) BW変換文字列を連長圧縮した領域(RLBWT領域)で索引を実現するデータ構造(r-index)の実用性と逐次的な構築の速度を向上させた.(2) RLBWTからLZ77圧縮形式に変換する実用的なアルゴリズムを開発した.(3) 回文照合問題に対するBW変換に基づいた索引を開発した.(4) パラメタ化文字列照合に対するBW変換に基づいた索引を効率的に構築する手法を開発した.
|
研究成果の学術的意義や社会的意義 |
データ処理において,データをどのように表現するかは処理の効率に大きく関わる最重要かつ根源的な問題である.圧縮のためのデータ変換手法として提案されたBurrows-Wheeler変換(BW変換)は,後の研究によりデータ処理において様々な利点を有していることが明らかになっている.本研究は,BW変換文字列を連長圧縮した領域で動作するアルゴリズムや一般化文字列照合におけるBW変換の応用技術の発展に寄与した.
|