• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Applying High-Performance Data Compression Method to Data Science: Application to Data with Dependence

Research Project

Project/Area Number 22K14254
Research Category

Grant-in-Aid for Early-Career Scientists

Allocation TypeMulti-year Fund
Review Section Basic Section 21020:Communication and network engineering-related
Research InstitutionGunma University

Principal Investigator

齋藤 翔太  群馬大学, 情報学部, 准教授 (60822145)

Project Period (FY) 2022-04-01 – 2025-03-31
Project Status Granted (Fiscal Year 2023)
Budget Amount *help
¥2,080,000 (Direct Cost: ¥1,600,000、Indirect Cost: ¥480,000)
Fiscal Year 2024: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2023: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2022: ¥520,000 (Direct Cost: ¥400,000、Indirect Cost: ¥120,000)
Keywordsデータサイエンス / ベイズ符号 / データ圧縮 / 依存関係のあるデータ / 理論評価
Outline of Research at the Start

情報理論が通信の問題だけでなくデータサイエンスの諸問題に対しても有用な知見を与えることが、近年注目されている。本研究では、依存関係のあるデータ系列へ、これまでの研究を拡張・展開する。具体的には、依存関係のあるデータ系列に対する分類問題、予測問題、変化点検出問題に関して、これまでに開発した手法を応用することで、分類誤り率や予測の2乗誤差などの数式の理論解析を行うとともに、効率的アルゴリズムを構築する。本研究によって、従来よりも精密な(従来よりも数学的に正確な)理論式を導出できる。さらに、ベイズ決定理論に基づく理論最適性を保ちつつ効率的であるような新規アルゴリズムを構築できる。

Outline of Annual Research Achievements

本研究では、依存関係のあるデータ系列に対する変化点検出問題、分類問題、予測問題、パラメータの推定問題等に対して、高性能データ圧縮法のひとつであるベイズ符号の理論研究成果と効率的データ圧縮アルゴリズムを応用することにより、分類誤り率や予測の2乗誤差などの数式に対する数学的に正確な理論解析を行うとともに、ベイズ決定理論に基づく理論最適性を保ちつつ効率的なアルゴリズムを構築することが目標である。この目標に対して、今年度は以下の成果を得た。

1)依存関係のあるデータの一例として文脈木情報源から発生するデータがある。この文脈木情報源が区間毎に変化するような非定常情報源に対して、効率的なベイズ符号化法を構築した。さらに、この手法が変化点検出問題に対しても有用であることを発見した。得られた成果は、IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences Vol.E107-A(3) 2024年3月号に掲載された。
2)文脈木情報源に対するベイズ符号のハイパーパラメータの決定手法について研究し、得られた成果は2023 IEEE International Symposium on Information Theory(台湾、台北)にて発表した。
3)ベイズ符号は、ベイズリスクを最小にするような符号化確率を用いてデータを圧縮するものである。このベイズリスクの下界を統一的に理解する枠組みを提案し、IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences Vol.E107-A(3) 2024年3月号にて発表した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

「研究実績の概要」で記したように、当初に予定通りベイズ符号の理論研究の成果を応用することで、変化点検出問題やパラメータ推定問題等に対して新たな成果が得られているため。

Strategy for Future Research Activity

2024年度が研究最終年度であるため、これまで得られた成果のまとめ、発展等を目指す。

Report

(2 results)
  • 2023 Research-status Report
  • 2022 Research-status Report
  • Research Products

    (23 results)

All 2024 2023 2022

All Journal Article (4 results) (of which Peer Reviewed: 4 results,  Open Access: 3 results) Presentation (19 results) (of which Int'l Joint Research: 5 results,  Invited: 3 results)

  • [Journal Article] Meta-Bound on Lower Bounds of Bayes Risk in Parameter Estimation2024

    • Author(s)
      SAITO Shota
    • Journal Title

      IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences

      Volume: E107.A Issue: 3 Pages: 503-509

    • DOI

      10.1587/transfun.2023TAP0002

    • ISSN
      0916-8508, 1745-1337
    • Year and Date
      2024-03-01
    • Related Report
      2023 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] An Efficient Bayes Coding Algorithm for Changing Context Tree Model2024

    • Author(s)
      SHIMADA Koshi、SAITO Shota、MATSUSHIMA Toshiyasu
    • Journal Title

      IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences

      Volume: E107.A Issue: 3 Pages: 448-457

    • DOI

      10.1587/transfun.2023TAP0017

    • ISSN
      0916-8508, 1745-1337
    • Year and Date
      2024-03-01
    • Related Report
      2023 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] Bayes optimal estimation and its approximation algorithm for difference with and without treatment under IRSLC model2023

    • Author(s)
      Ishiwatari Taisuke、Saito Shota、Nakahara Yuta、Iikubo Yuji、Matsushima Toshiyasu
    • Journal Title

      International Journal of Data Science and Analytics

      Volume: -

    • DOI

      10.1007/s41060-023-00468-8

    • Related Report
      2023 Research-status Report
    • Peer Reviewed
  • [Journal Article] Non-Asymptotic Bounds of Cumulant Generating Function of Codeword Lengths in Variable-Length Lossy Compression2023

    • Author(s)
      Saito Shota and Matsushima Toshiyasu
    • Journal Title

      IEEE Transactions on Information Theory

      Volume: 69 Issue: 4 Pages: 2113-2119

    • DOI

      10.1109/tit.2022.3229358

    • Related Report
      2023 Research-status Report 2022 Research-status Report
    • Peer Reviewed / Open Access
  • [Presentation] シャッフルモデルによる局所差分プライベート行結合データのプライバシ増幅に関する考察2024

    • Author(s)
      千田 浩司, 齋藤 翔太, 高木 理
    • Organizer
      第198回DPS・第104回CSEC合同研究発表会
    • Related Report
      2023 Research-status Report
  • [Presentation] 対数損失歪みのもとでの可変長有歪み情報源符号の符号語長のキュムラント母関数の上界2024

    • Author(s)
      齋藤 翔太
    • Organizer
      電子情報通信学会 情報理論研究会
    • Related Report
      2023 Research-status Report
  • [Presentation] f -Divergence Differential Privacy2024

    • Author(s)
      Shota Saito, Koji Chida, Osamu Takaki
    • Organizer
      2024年 暗号と情報セキュリティシンポジウム(SCIS2024)
    • Related Report
      2023 Research-status Report
  • [Presentation] Discovery of Contrast Itemset with Statistical Background Between Two Continuous Variables2023

    • Author(s)
      Kaoru Shimada, Shogo Matsuno, Shota Saito
    • Organizer
      The 25th International Conference on Big Data Analytics and Knowledge Discovery (DAWAK 2023)
    • Related Report
      2023 Research-status Report
    • Int'l Joint Research
  • [Presentation] Hyperparameter Learning of Bayesian Context Tree Models2023

    • Author(s)
      Yuta Nakahara, Shota Saito, Koshi Shimada, Toshiyasu Matsushima
    • Organizer
      2023 IEEE International Symposium on Information Theory
    • Related Report
      2023 Research-status Report
    • Int'l Joint Research
  • [Presentation] 「分類問題に対する情報理論的アプローチ」の分類整理と解説2023

    • Author(s)
      齋藤翔太
    • Organizer
      第46回情報理論とその応用シンポジウム(SITA2023)
    • Related Report
      2023 Research-status Report
    • Invited
  • [Presentation] Log-lossのもとでの誤りを許したsoft guessingについて2023

    • Author(s)
      齋藤翔太
    • Organizer
      第12回シャノン理論ワークショップ(STW2023)
    • Related Report
      2023 Research-status Report
  • [Presentation] Bayesian Predictive Distribution for Poisson Observables Under a Class of Prior Distribution and α-Divergence2023

    • Author(s)
      齋藤翔太
    • Organizer
      電子情報通信学会 情報理論研究会
    • Related Report
      2023 Research-status Report
  • [Presentation] セキュリティを考慮した2つの問題に対する情報理論的解析について ~ Local Differential Privacyの下でのパラメータ推定問題と、プライバシーと有用性のトレードオフ問題 ~2023

    • Author(s)
      齋藤翔太
    • Organizer
      電子情報通信学会 情報理論研究会
    • Related Report
      2022 Research-status Report
    • Invited
  • [Presentation] 文脈木情報源に対する逐次型情報源符号化の最大冗長度の下界について2023

    • Author(s)
      齋藤翔太
    • Organizer
      電子情報通信学会 情報理論研究会
    • Related Report
      2022 Research-status Report
  • [Presentation] Bayes Optimal Estimation and Its Approximation Algorithm for Difference with and without Treatment under URLC Model2022

    • Author(s)
      Taisuke Ishiwatari, Shota Saito, Yuta Nakahara, Yuji Iikubo, Toshiyasu Matsushima
    • Organizer
      2022 International Symposium on Information Theory and Its Applications
    • Related Report
      2022 Research-status Report
    • Int'l Joint Research
  • [Presentation] On Meta-Bound for Lower Bounds of Bayes Risk2022

    • Author(s)
      Shota Saito
    • Organizer
      2022 IEEE International Symposium on Information Theory
    • Related Report
      2022 Research-status Report
    • Int'l Joint Research
  • [Presentation] Probability Distribution on Rooted Trees2022

    • Author(s)
      Yuta Nakahara, Shota Saito, Akira Kamatsuka, Toshiyasu Matsushima
    • Organizer
      2022 IEEE International Symposium on Information Theory
    • Related Report
      2022 Research-status Report
    • Int'l Joint Research
  • [Presentation] Lower Bound of Bayes Risk in Parameter Estimation under Local Differential Privacy2022

    • Author(s)
      Shota Saito
    • Organizer
      第45回情報理論とその応用シンポジウム
    • Related Report
      2022 Research-status Report
  • [Presentation] 決定木モデルにおけるメタツリーに対するマルコフ連鎖モンテカルロ法2022

    • Author(s)
      中原 悠太, 齋藤 翔太, 一條 尚希, 風間 皐希, 松嶋 敏泰
    • Organizer
      第45回情報理論とその応用シンポジウム
    • Related Report
      2022 Research-status Report
  • [Presentation] ベイズ決定理論に基づく機械学習ライブラリ:BayesML 0.2.02022

    • Author(s)
      中原悠太, 齋藤翔太, 島田航志, 飯窪祐二, 風間皐希, 一條尚希, 松嶋敏泰, BayesML Developers
    • Organizer
      第25回情報論的学習理論ワークショップ
    • Related Report
      2022 Research-status Report
  • [Presentation] 「情報」を測る:情報理論における情報の捉え方2022

    • Author(s)
      齋藤翔太
    • Organizer
      第10回 早稲田大学データ科学センター・先端社会科学研究所ジョイントセミナー
    • Related Report
      2022 Research-status Report
    • Invited
  • [Presentation] ベイズ決定理論に基づく機械学習ライブラリ:BayesML 0.1.02022

    • Author(s)
      中原 悠太, 一條 尚希, 島田 航志, 飯窪 祐二, 齋藤 翔太, 風間 皐希, 松嶋 敏泰, BayesML Code Authors
    • Organizer
      2022年度統計関連学会連合大会
    • Related Report
      2022 Research-status Report
  • [Presentation] On Bayesian Approach for Classification of Context Tree Model2022

    • Author(s)
      Shota Saito
    • Organizer
      電子情報通信学会 情報理論研究会
    • Related Report
      2022 Research-status Report

URL: 

Published: 2022-04-19   Modified: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi