研究課題/領域番号 |
20H04141
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
小区分60010:情報学基礎論関連
|
研究機関 | 東京医科歯科大学 |
研究代表者 |
坂内 英夫 東京医科歯科大学, M&Dデータ科学センター, 教授 (20323644)
|
研究分担者 |
井 智弘 九州工業大学, 大学院情報工学研究院, 准教授 (20773360)
関 新之助 電気通信大学, 大学院情報理工学研究科, 准教授 (30624944)
稲永 俊介 九州大学, システム情報科学研究院, 教授 (60448404)
|
研究期間 (年度) |
2020-04-01 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
17,550千円 (直接経費: 13,500千円、間接経費: 4,050千円)
2023年度: 3,900千円 (直接経費: 3,000千円、間接経費: 900千円)
2022年度: 4,940千円 (直接経費: 3,800千円、間接経費: 1,140千円)
2021年度: 3,900千円 (直接経費: 3,000千円、間接経費: 900千円)
2020年度: 4,810千円 (直接経費: 3,700千円、間接経費: 1,110千円)
|
キーワード | 辞書式順序 / Lyndon 語 / BBWT / Lyndon 配列 / 辞書式圧縮 / FM-index / 繰り返し構造 / BWT / Lyndon語 / 双方向マクロスキーム / 文字列アトラクタ / 直線的プログラム / 全単射 BWT / Thue-Morse 文字列 / 繰り返し指標 / Lyndon 木 / 原始平方 |
研究開始時の研究の概要 |
近年,情報通信・計測機器の発達により,多岐にわたる分野で膨大な量の文字列データが生み出され,利用可能となっている.このような大規模な文字列データを効率的に処理・解析する技術は多様な応用があるため広く必要とされ,極めて重要である.多様な文字列データに対して有効かつ効率的な処理・解析アルゴリズムを開発するには,文字列の様々な特徴に関する理論的・組合せ的性質の深い理解が必要不可欠である.本研究は,文字列の辞書式順序に着目し,その組合せ的性質の解明およびそれらを利用した効率的な文字列処理のアルゴリズムを開発を目指す.
|
研究成果の概要 |
文字列の辞書式順序に関連する様々な課題について幅広く取組み、Lyndon 語、Lyndon 木、全単射 Burrows-Wheeler 変換、Thue-Morse 語に対する辞書式圧縮の圧縮性指標などに関する諸性質を解析し、それらの諸性質を応用した効率的なアルゴリズムや索引構造・圧縮表現などのデータ構造の提案や困難性の証明を行った。
|
研究成果の学術的意義や社会的意義 |
本研究の成果として得られた辞書式順序に関連する諸性質は文字列の組み合わせ論に関する基礎的なものである。これらの諸性質は本研究で提案したアルゴリズムだけではなく、今後出現する様々な種類の文字列データ・問題に対する効率的な処理アルゴリズムの開発に広く寄与する可能性がある。
|