2022 Fiscal Year Research-status Report
Applying High-Performance Data Compression Method to Data Science: Application to Data with Dependence
Project/Area Number |
22K14254
|
Research Institution | Gunma University |
Principal Investigator |
齋藤 翔太 群馬大学, 情報学部, 准教授 (60822145)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Keywords | データサイエンス / ベイズ符号 / データ圧縮 / 依存関係のあるデータ / 理論評価 |
Outline of Annual Research Achievements |
本研究では、依存関係のあるデータ系列に対する分類問題、予測問題等に対して、高性能データ圧縮法のひとつであるベイズ符号の理論研究成果と効率的データ圧縮アルゴリズムを応用することにより、分類誤り率や予測の2乗誤差などの数式に対する数学的に正確な理論解析を行うとともに、ベイズ決定理論に基づく理論最適性を保ちつつ効率的なアルゴリズムを構築することが目標である。この目標に対して、今年度は以下の成果を得た。 1)ベイズ符号は、ベイズリスクを最小にするような符号化確率を用いてデータを圧縮する。このベイズリスクの下界に関して従来さまざまな理論評価が行われていた。本研究では、「meta-bound」という不等式から、従来のさまざまなベイズリスクの下界が導かれることを示し、情報理論のトップカンファレンスであるIEEE International Symposium on Information Theory(ヘルシンキ、フィンランド)にて発表した。 2)依存関係のあるデータの一例として文脈木情報源から発生するデータがある。この文脈木情報源に対する逐次型情報源符号化の最大冗長度の下界を、ベイズ符号の理論研究を応用することで導出した。研究結果は電子情報通信学会 情報理論研究会(群馬県前橋市)にて発表した。 3)文脈木情報源から発生したデータの分類問題の分類誤り率を、ベイズ符号の理論研究を応用することで導いた。研究結果は電子情報通信学会 情報理論研究会(岐阜県岐阜市)にて発表した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
「研究実績の概要」で記したように、当初に予定通りベイズ符号の理論研究の成果を応用することで、分類問題等に対して新たな成果が得られているため。
|
Strategy for Future Research Activity |
2022年度は主に分類問題を扱っていたが、2023年度は予測問題にも幅を広げ研究を進める予定である。
|