2023 Fiscal Year Research-status Report
Applying High-Performance Data Compression Method to Data Science: Application to Data with Dependence
Project/Area Number |
22K14254
|
Research Institution | Gunma University |
Principal Investigator |
齋藤 翔太 群馬大学, 情報学部, 准教授 (60822145)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Keywords | データサイエンス / ベイズ符号 / データ圧縮 |
Outline of Annual Research Achievements |
本研究では、依存関係のあるデータ系列に対する変化点検出問題、分類問題、予測問題、パラメータの推定問題等に対して、高性能データ圧縮法のひとつであるベイズ符号の理論研究成果と効率的データ圧縮アルゴリズムを応用することにより、分類誤り率や予測の2乗誤差などの数式に対する数学的に正確な理論解析を行うとともに、ベイズ決定理論に基づく理論最適性を保ちつつ効率的なアルゴリズムを構築することが目標である。この目標に対して、今年度は以下の成果を得た。
1)依存関係のあるデータの一例として文脈木情報源から発生するデータがある。この文脈木情報源が区間毎に変化するような非定常情報源に対して、効率的なベイズ符号化法を構築した。さらに、この手法が変化点検出問題に対しても有用であることを発見した。得られた成果は、IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences Vol.E107-A(3) 2024年3月号に掲載された。 2)文脈木情報源に対するベイズ符号のハイパーパラメータの決定手法について研究し、得られた成果は2023 IEEE International Symposium on Information Theory(台湾、台北)にて発表した。 3)ベイズ符号は、ベイズリスクを最小にするような符号化確率を用いてデータを圧縮するものである。このベイズリスクの下界を統一的に理解する枠組みを提案し、IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences Vol.E107-A(3) 2024年3月号にて発表した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
「研究実績の概要」で記したように、当初に予定通りベイズ符号の理論研究の成果を応用することで、変化点検出問題やパラメータ推定問題等に対して新たな成果が得られているため。
|
Strategy for Future Research Activity |
2024年度が研究最終年度であるため、これまで得られた成果のまとめ、発展等を目指す。
|
Causes of Carryover |
当初計画よりも旅費が少なく済んだため、次年度使用額が生じた。また、今年度は論文掲載費、旅費、研究に必要な物品購入等に研究費を充てる予定である。
|