• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2022 Fiscal Year Research-status Report

Applying High-Performance Data Compression Method to Data Science: Application to Data with Dependence

Research Project

Project/Area Number 22K14254
Research InstitutionGunma University

Principal Investigator

齋藤 翔太  群馬大学, 情報学部, 准教授 (60822145)

Project Period (FY) 2022-04-01 – 2025-03-31
Keywordsデータサイエンス / ベイズ符号 / データ圧縮 / 依存関係のあるデータ / 理論評価
Outline of Annual Research Achievements

本研究では、依存関係のあるデータ系列に対する分類問題、予測問題等に対して、高性能データ圧縮法のひとつであるベイズ符号の理論研究成果と効率的データ圧縮アルゴリズムを応用することにより、分類誤り率や予測の2乗誤差などの数式に対する数学的に正確な理論解析を行うとともに、ベイズ決定理論に基づく理論最適性を保ちつつ効率的なアルゴリズムを構築することが目標である。この目標に対して、今年度は以下の成果を得た。
1)ベイズ符号は、ベイズリスクを最小にするような符号化確率を用いてデータを圧縮する。このベイズリスクの下界に関して従来さまざまな理論評価が行われていた。本研究では、「meta-bound」という不等式から、従来のさまざまなベイズリスクの下界が導かれることを示し、情報理論のトップカンファレンスであるIEEE International Symposium on Information Theory(ヘルシンキ、フィンランド)にて発表した。
2)依存関係のあるデータの一例として文脈木情報源から発生するデータがある。この文脈木情報源に対する逐次型情報源符号化の最大冗長度の下界を、ベイズ符号の理論研究を応用することで導出した。研究結果は電子情報通信学会 情報理論研究会(群馬県前橋市)にて発表した。
3)文脈木情報源から発生したデータの分類問題の分類誤り率を、ベイズ符号の理論研究を応用することで導いた。研究結果は電子情報通信学会 情報理論研究会(岐阜県岐阜市)にて発表した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

「研究実績の概要」で記したように、当初に予定通りベイズ符号の理論研究の成果を応用することで、分類問題等に対して新たな成果が得られているため。

Strategy for Future Research Activity

2022年度は主に分類問題を扱っていたが、2023年度は予測問題にも幅を広げ研究を進める予定である。

  • Research Products

    (12 results)

All 2023 2022

All Journal Article (1 results) (of which Peer Reviewed: 1 results,  Open Access: 1 results) Presentation (11 results) (of which Int'l Joint Research: 3 results,  Invited: 2 results)

  • [Journal Article] Non-Asymptotic Bounds of Cumulant Generating Function of Codeword Lengths in Variable-Length Lossy Compression2023

    • Author(s)
      Saito Shota、Matsushima Toshiyasu
    • Journal Title

      IEEE Transactions on Information Theory

      Volume: 69 Pages: 2113~2119

    • DOI

      10.1109/TIT.2022.3229358

    • Peer Reviewed / Open Access
  • [Presentation] セキュリティを考慮した2つの問題に対する情報理論的解析について ~ Local Differential Privacyの下でのパラメータ推定問題と、プライバシーと有用性のトレードオフ問題 ~2023

    • Author(s)
      齋藤翔太
    • Organizer
      電子情報通信学会 情報理論研究会
    • Invited
  • [Presentation] 文脈木情報源に対する逐次型情報源符号化の最大冗長度の下界について2023

    • Author(s)
      齋藤翔太
    • Organizer
      電子情報通信学会 情報理論研究会
  • [Presentation] Bayes Optimal Estimation and Its Approximation Algorithm for Difference with and without Treatment under URLC Model2022

    • Author(s)
      Taisuke Ishiwatari, Shota Saito, Yuta Nakahara, Yuji Iikubo, Toshiyasu Matsushima
    • Organizer
      2022 International Symposium on Information Theory and Its Applications
    • Int'l Joint Research
  • [Presentation] On Meta-Bound for Lower Bounds of Bayes Risk2022

    • Author(s)
      Shota Saito
    • Organizer
      2022 IEEE International Symposium on Information Theory
    • Int'l Joint Research
  • [Presentation] Probability Distribution on Rooted Trees2022

    • Author(s)
      Yuta Nakahara, Shota Saito, Akira Kamatsuka, Toshiyasu Matsushima
    • Organizer
      2022 IEEE International Symposium on Information Theory
    • Int'l Joint Research
  • [Presentation] Lower Bound of Bayes Risk in Parameter Estimation under Local Differential Privacy2022

    • Author(s)
      Shota Saito
    • Organizer
      第45回情報理論とその応用シンポジウム
  • [Presentation] 決定木モデルにおけるメタツリーに対するマルコフ連鎖モンテカルロ法2022

    • Author(s)
      中原 悠太, 齋藤 翔太, 一條 尚希, 風間 皐希, 松嶋 敏泰
    • Organizer
      第45回情報理論とその応用シンポジウム
  • [Presentation] ベイズ決定理論に基づく機械学習ライブラリ:BayesML 0.2.02022

    • Author(s)
      中原悠太, 齋藤翔太, 島田航志, 飯窪祐二, 風間皐希, 一條尚希, 松嶋敏泰, BayesML Developers
    • Organizer
      第25回情報論的学習理論ワークショップ
  • [Presentation] 「情報」を測る:情報理論における情報の捉え方2022

    • Author(s)
      齋藤翔太
    • Organizer
      第10回 早稲田大学データ科学センター・先端社会科学研究所ジョイントセミナー
    • Invited
  • [Presentation] ベイズ決定理論に基づく機械学習ライブラリ:BayesML 0.1.02022

    • Author(s)
      中原 悠太, 一條 尚希, 島田 航志, 飯窪 祐二, 齋藤 翔太, 風間 皐希, 松嶋 敏泰, BayesML Code Authors
    • Organizer
      2022年度統計関連学会連合大会
  • [Presentation] On Bayesian Approach for Classification of Context Tree Model2022

    • Author(s)
      Shota Saito
    • Organizer
      電子情報通信学会 情報理論研究会

URL: 

Published: 2023-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi