| 研究課題/領域番号 |
23K24808
|
| 補助金の研究課題番号 |
22H03551 (2022-2023)
|
| 研究種目 |
基盤研究(B)
|
| 配分区分 | 基金 (2024) 補助金 (2022-2023) |
| 応募区分 | 一般 |
| 審査区分 |
小区分60010:情報学基礎論関連
|
| 研究機関 | 九州大学 |
研究代表者 |
稲永 俊介 九州大学, システム情報科学研究院, 教授 (60448404)
|
| 研究分担者 |
坂内 英夫 東京医科歯科大学, M&Dデータ科学センター, 教授 (20323644)
中島 祐人 九州大学, システム情報科学研究院, 准教授 (80804682)
Koeppl Dominik 山梨大学, 大学院総合研究部, 特任准教授 (50897395)
|
| 研究期間 (年度) |
2024-04-01 – 2026-03-31
|
| 研究課題ステータス |
交付 (2024年度)
|
| 配分額 *注記 |
17,030千円 (直接経費: 13,100千円、間接経費: 3,930千円)
2025年度: 4,940千円 (直接経費: 3,800千円、間接経費: 1,140千円)
2024年度: 4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2023年度: 4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
2022年度: 3,510千円 (直接経費: 2,700千円、間接経費: 810千円)
|
| キーワード | アルゴリズム / データ構造 / 文字列データ処理 / アルゴリズム理論 / データ圧縮 / 文字列処理 / 情報検索 |
| 研究開始時の研究の概要 |
文字列とは,文字あるいは記号の一本鎖列である.自然言語テキスト,サーバログ,DNA配列など,計算機処理可能な様々なデータを文字列と見なすことができる.1970年代から半世紀にわたって,検索・圧縮・比較・解析・発見などの重要タスクを文字列データ上で高速実行するアルゴリズムが多数提案されてきた.本提案課題では,文字列の定義域を拡張した「広義文字列」という新概念を提唱し,木型文字列/グラフ型文字列/2次元文字列/時系列の高速処理アルゴリズム開発と,それを支える組合せ論的性質の解明に取り組む.
|
| 研究実績の概要 |
本研究課題の目的は,アルゴリズム理論と組合せ論の有機的融合によって,広義文字列に対する効率的処理技法を開発することである.本年度は,以下に示す (A)-(E) の重要研究テーマについて,主に以下の研究成果を達成した. (A) テキストデータ圧縮:Lex-Parse圧縮法の感度のタイトな上界・下界の導出,最右参照 LZ 圧縮のオンライン計算,(B) 圧縮文字列処理:CDAWG を用いた極小不在文字列 (MAW / Minimal Absent Words) の線形時間計算法,(C) 文字列組合せ論:パラメタ化スクエア部分文字列の個数の上界,(D) 索引構造:Linear-size suffix trie (LST) のオンライン構築,無閉路決定性オートマトン (APDFA) のワードパック高速化,(E) 生物情報科学:動的な配列集合に対する All-Pairs Suffix-Prefix (APSP) 計算,(F) 時系列データ処理:デカルト木照合最長共通部分列の計算 これらの成果はすべて,広義文字列に内在する組合せ的性質,および高度なアルゴリズム技術を活用することで達成された.また,これらの結果は,査読付き国際会議および査読付き国際論文誌にて発表済みである.
|
| 現在までの達成度 |
現在までの達成度
2: おおむね順調に進展している
理由
広義文字列を対象としたアルゴリズムと組合せ論の重要成果を着実に挙げることができている.
|
| 今後の研究の推進方策 |
【現在までの進捗状況】で述べたように,概ね順調に研究が進んでいる.引き続き,国内外の専門家と緊密に連携しながら,本研究を遂行していく.
|