2020 Fiscal Year Annual Research Report
Development of fundamental technology for practical use of high-order compression
Project/Area Number |
18K11149
|
Research Institution | Hokkai-Gakuen University |
Principal Investigator |
喜田 拓也 北海学園大学, 工学部, 教授 (70343316)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Keywords | 高階圧縮 / ラムダ計算 / 文法圧縮 / 大規模データ / 透過的データ圧縮法 |
Outline of Annual Research Achievements |
本研究の目的は,高階圧縮と呼ばれるデータ圧縮方式の効率よい処理アルゴリズムを開発することである.ここで「効率よい」とは,次の三つの観点において優れていることである.第一には,データをどれだけコンパクトに表現できるかという圧縮率の観点である.第二には,処理時間とメモリ消費量をどれだけ抑えられるかという計算量の観点である.第三には,圧縮後のデータ自体が,後の情報検索やデータ解析の際にどのくらい利用しやすいかというデータ活用の観点である. 既存の高階圧縮の圧縮処理アルゴリズムは処理速度に一番の難点がある.高速に圧縮処理を行うためには,入力データから共通する部分構造をすばやく見つけ出し,ラムダ式として抽出しなければならない.既存手法では,まず入力データを直線状の木構造に変換し,その後,頻出するすべての可能な部分木を探索して,ラムダ計算の逆計算にあたる操作によって木構造をコンパクトにまとめていくという手順を取る.この手法の問題点は,探索すべき部分木の種類が組み合わせ的に増大してしまうことである. 申請者らはこれまでに,入力データの繰り返し部分を表現するラムダ式を高速に抽出するアルゴリズムを開発している.また,高階圧縮のサブクラスである文法圧縮についての研究において,理論的に優れた文法を生成することのできる手法(MR-RePairアルゴリズム)の開発に成功した.この成果について,昨年度から引き継ぎ雑誌論文として推敲を重ねて投稿し,国際雑誌Algorithms (MDPI)の「Lossless Data Compression」特集号の一部として掲載されるに至った。本年度は最終年度にあたり、これまでの成果を取りまとめた解説論文を執筆し、Springerの特集号に投稿を行った。また、次の研究テーマの設計について取り組んだ。
|