研究課題/領域番号 |
23K24808
|
補助金の研究課題番号 |
22H03551 (2022-2023)
|
研究種目 |
基盤研究(B)
|
配分区分 | 基金 (2024) 補助金 (2022-2023) |
応募区分 | 一般 |
審査区分 |
小区分60010:情報学基礎論関連
|
研究機関 | 九州大学 |
研究代表者 |
稲永 俊介 九州大学, システム情報科学研究院, 教授 (60448404)
|
研究分担者 |
坂内 英夫 東京医科歯科大学, M&Dデータ科学センター, 教授 (20323644)
中島 祐人 九州大学, システム情報科学研究院, 助教 (80804682)
Koeppl Dominik 山梨大学, 大学院総合研究部, 特任准教授 (50897395)
|
研究期間 (年度) |
2022-04-01 – 2026-03-31
|
研究課題ステータス |
交付 (2024年度)
|
配分額 *注記 |
17,030千円 (直接経費: 13,100千円、間接経費: 3,930千円)
2025年度: 4,940千円 (直接経費: 3,800千円、間接経費: 1,140千円)
2024年度: 4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2023年度: 4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
2022年度: 3,510千円 (直接経費: 2,700千円、間接経費: 810千円)
|
キーワード | アルゴリズム理論 / アルゴリズム / データ構造 / 文字列データ処理 / データ圧縮 / 文字列処理 / 情報検索 |
研究開始時の研究の概要 |
文字列とは,文字あるいは記号の一本鎖列である.自然言語テキスト,サーバログ,DNA配列など,計算機処理可能な様々なデータを文字列と見なすことができる.1970年代から半世紀にわたって,検索・圧縮・比較・解析・発見などの重要タスクを文字列データ上で高速実行するアルゴリズムが多数提案されてきた.本提案課題では,文字列の定義域を拡張した「広義文字列」という新概念を提唱し,木型文字列/グラフ型文字列/2次元文字列/時系列の高速処理アルゴリズム開発と,それを支える組合せ論的性質の解明に取り組む.
|
研究実績の概要 |
本研究課題の目的は,アルゴリズム理論と組合せ論の有機的融合によって,広義文字列に対する効率的処理技法を開発することである.本年度は,以下に示す (A)-(E) の重要研究テーマについて,主に以下の研究成果を達成した. (A) テキストデータ圧縮:連長圧縮BW変換の感度に関する下界,(B) 圧縮文字列処理:CDAWG を用いた圧縮索引配列の省領域計算,(C) グラフ型文字列処理:グラフ型文字列に対する制約付きLCS計算,(D) 文字列組合せ論:フィボナッチ文字列の最大反復分解の厳密解,(E) 索引構造:整数アルファベットに対する DAWG,双方向索引構造,極小不在文字列 (MAW / Minimal Absent Words) の線形時間計算法 これらの成果はすべて,広義文字列に内在する組合せ的性質,および高度なアルゴリズム技術を活用することで達成された.また,これらの結果は,査読付き国際会議および査読付き国際論文誌にて発表済みである.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
広義文字列を対象としたアルゴリズムと組合せ論の重要成果を着実に挙げることができている.
|
今後の研究の推進方策 |
【現在までの進捗状況】で述べたように,概ね順調に研究が進んでいる.引き続き,国内外の専門家と緊密に連携しながら,本研究を遂行していく.
|