研究課題/領域番号 |
20J14475
|
研究種目 |
特別研究員奨励費
|
配分区分 | 補助金 |
応募区分 | 国内 |
審査区分 |
小区分60080:データベース関連
|
研究機関 | 北海道大学 |
研究代表者 |
古谷 勇 北海道大学, 情報科学院, 特別研究員(PD)
|
研究期間 (年度) |
2020-04-24 – 2022-03-31
|
研究課題ステータス |
完了 (2020年度)
|
配分額 *注記 |
1,700千円 (直接経費: 1,700千円)
2020年度: 900千円 (直接経費: 900千円)
|
キーワード | 可逆圧縮 / アルゴリズム |
研究開始時の研究の概要 |
データ圧縮は,データ中の冗長な部分を簡潔に表現することで,そのデータの保持に必要な記憶容量を削減する技術である.これにより,データの保存や通信のコストを削減することができる. 階層的な反復構造とは,大部分は同じだが一部のみ異なる,というような,似ている要素が繰り返し出現し,かつ階層を成す構造であり,ウェブページの編集履歴やプログラムのバージョン履歴,アクセスログデータや DNA データベースなど,実社会で盛んに利用されているデータに頻繁に出現する構造である.本研究は,こうした特徴を持つデータに対し,既存手法よりも一層有効な新しい圧縮方法の開発を目的とする.
|
研究実績の概要 |
本研究は,階層的な反復構造を持つデータのための可逆圧縮モデルとアルゴリズムの研究開発を目的としたものである. 令和2年度は,研究課題として掲げた項目のうち,主として「対象データの特徴を捉えた効率よいアルゴリズムの研究開発」および「開発した可逆圧縮モデルとアルゴリズムの実装及び計算機実験」に取り組んだ.特に,「極大な頻出パターン」と「連」という2種類の特徴的な反復構造に着目し,これらをデータ中から効率よく抽出可能な圧縮アルゴリズムの研究開発に注力した. 「極大な頻出パターン」とは,データ中に繰り返し出現する部分のうち極大なものを指す.極大な頻出パターンは,その内部により小さな頻出パターンを内包するが,そうした小さなパターンに断片化することなく,極大な括りで一つのパターンと捉え抽出することで,圧縮性能を大きく向上させることができる.しかしながら,従来の圧縮手法では,こうした極大な頻出パターンを効率よく抽出することができなかった.「連」とは,同じパターンが連続して出現する,データ中の部分を指す.この連についても,従来手法では,断片化せずに効率よく捉え抽出することができず,そのことで潜在的な圧縮性能を引き出せずにいた. こうした課題を踏まえ,申請者は「極大な頻出パターン」と「連」を効率よく抽出可能な可逆圧縮アルゴリズムを開発した.その過程で,従来手法で可逆圧縮モデルとして用いられてきた文脈自由文法を拡張したモデルを取り入れ,圧縮モデル研究の面からも成果を得た.さらに,開発したアルゴリズムの実装及び計算機実験を行い,提案アルゴリズムの有効性を実験的に確認した.
|
現在までの達成度 (段落) |
翌年度、交付申請を辞退するため、記入しない。
|
今後の研究の推進方策 |
翌年度、交付申請を辞退するため、記入しない。
|