Applying High-Performance Data Compression Method to Data Science: Application to Data with Dependence
Project/Area Number |
22K14254
|
Research Category |
Grant-in-Aid for Early-Career Scientists
|
Allocation Type | Multi-year Fund |
Review Section |
Basic Section 21020:Communication and network engineering-related
|
Research Institution | Gunma University |
Principal Investigator |
齋藤 翔太 群馬大学, 情報学部, 准教授 (60822145)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥2,080,000 (Direct Cost: ¥1,600,000、Indirect Cost: ¥480,000)
Fiscal Year 2024: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2023: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2022: ¥520,000 (Direct Cost: ¥400,000、Indirect Cost: ¥120,000)
|
Keywords | データサイエンス / ベイズ符号 / データ圧縮 / 依存関係のあるデータ / 理論評価 |
Outline of Research at the Start |
情報理論が通信の問題だけでなくデータサイエンスの諸問題に対しても有用な知見を与えることが、近年注目されている。本研究では、依存関係のあるデータ系列へ、これまでの研究を拡張・展開する。具体的には、依存関係のあるデータ系列に対する分類問題、予測問題、変化点検出問題に関して、これまでに開発した手法を応用することで、分類誤り率や予測の2乗誤差などの数式の理論解析を行うとともに、効率的アルゴリズムを構築する。本研究によって、従来よりも精密な(従来よりも数学的に正確な)理論式を導出できる。さらに、ベイズ決定理論に基づく理論最適性を保ちつつ効率的であるような新規アルゴリズムを構築できる。
|
Outline of Annual Research Achievements |
本研究では、依存関係のあるデータ系列に対する分類問題、予測問題等に対して、高性能データ圧縮法のひとつであるベイズ符号の理論研究成果と効率的データ圧縮アルゴリズムを応用することにより、分類誤り率や予測の2乗誤差などの数式に対する数学的に正確な理論解析を行うとともに、ベイズ決定理論に基づく理論最適性を保ちつつ効率的なアルゴリズムを構築することが目標である。この目標に対して、今年度は以下の成果を得た。 1)ベイズ符号は、ベイズリスクを最小にするような符号化確率を用いてデータを圧縮する。このベイズリスクの下界に関して従来さまざまな理論評価が行われていた。本研究では、「meta-bound」という不等式から、従来のさまざまなベイズリスクの下界が導かれることを示し、情報理論のトップカンファレンスであるIEEE International Symposium on Information Theory(ヘルシンキ、フィンランド)にて発表した。 2)依存関係のあるデータの一例として文脈木情報源から発生するデータがある。この文脈木情報源に対する逐次型情報源符号化の最大冗長度の下界を、ベイズ符号の理論研究を応用することで導出した。研究結果は電子情報通信学会 情報理論研究会(群馬県前橋市)にて発表した。 3)文脈木情報源から発生したデータの分類問題の分類誤り率を、ベイズ符号の理論研究を応用することで導いた。研究結果は電子情報通信学会 情報理論研究会(岐阜県岐阜市)にて発表した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
「研究実績の概要」で記したように、当初に予定通りベイズ符号の理論研究の成果を応用することで、分類問題等に対して新たな成果が得られているため。
|
Strategy for Future Research Activity |
2022年度は主に分類問題を扱っていたが、2023年度は予測問題にも幅を広げ研究を進める予定である。
|
Report
(1 results)
Research Products
(12 results)