• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

高性能データ圧縮法のデータサイエンスへの応用:依存関係のあるデータへの適用

研究課題

研究課題/領域番号 22K14254
研究種目

若手研究

配分区分基金
審査区分 小区分21020:通信工学関連
研究機関群馬大学

研究代表者

齋藤 翔太  群馬大学, 情報学部, 准教授 (60822145)

研究期間 (年度) 2022-04-01 – 2025-03-31
研究課題ステータス 交付 (2023年度)
配分額 *注記
2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
2024年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2023年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2022年度: 520千円 (直接経費: 400千円、間接経費: 120千円)
キーワードデータサイエンス / ベイズ符号 / データ圧縮 / 依存関係のあるデータ / 理論評価
研究開始時の研究の概要

情報理論が通信の問題だけでなくデータサイエンスの諸問題に対しても有用な知見を与えることが、近年注目されている。本研究では、依存関係のあるデータ系列へ、これまでの研究を拡張・展開する。具体的には、依存関係のあるデータ系列に対する分類問題、予測問題、変化点検出問題に関して、これまでに開発した手法を応用することで、分類誤り率や予測の2乗誤差などの数式の理論解析を行うとともに、効率的アルゴリズムを構築する。本研究によって、従来よりも精密な(従来よりも数学的に正確な)理論式を導出できる。さらに、ベイズ決定理論に基づく理論最適性を保ちつつ効率的であるような新規アルゴリズムを構築できる。

研究実績の概要

本研究では、依存関係のあるデータ系列に対する変化点検出問題、分類問題、予測問題、パラメータの推定問題等に対して、高性能データ圧縮法のひとつであるベイズ符号の理論研究成果と効率的データ圧縮アルゴリズムを応用することにより、分類誤り率や予測の2乗誤差などの数式に対する数学的に正確な理論解析を行うとともに、ベイズ決定理論に基づく理論最適性を保ちつつ効率的なアルゴリズムを構築することが目標である。この目標に対して、今年度は以下の成果を得た。

1)依存関係のあるデータの一例として文脈木情報源から発生するデータがある。この文脈木情報源が区間毎に変化するような非定常情報源に対して、効率的なベイズ符号化法を構築した。さらに、この手法が変化点検出問題に対しても有用であることを発見した。得られた成果は、IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences Vol.E107-A(3) 2024年3月号に掲載された。
2)文脈木情報源に対するベイズ符号のハイパーパラメータの決定手法について研究し、得られた成果は2023 IEEE International Symposium on Information Theory(台湾、台北)にて発表した。
3)ベイズ符号は、ベイズリスクを最小にするような符号化確率を用いてデータを圧縮するものである。このベイズリスクの下界を統一的に理解する枠組みを提案し、IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences Vol.E107-A(3) 2024年3月号にて発表した。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

「研究実績の概要」で記したように、当初に予定通りベイズ符号の理論研究の成果を応用することで、変化点検出問題やパラメータ推定問題等に対して新たな成果が得られているため。

今後の研究の推進方策

2024年度が研究最終年度であるため、これまで得られた成果のまとめ、発展等を目指す。

報告書

(2件)
  • 2023 実施状況報告書
  • 2022 実施状況報告書
  • 研究成果

    (23件)

すべて 2024 2023 2022

すべて 雑誌論文 (4件) (うち査読あり 4件、 オープンアクセス 3件) 学会発表 (19件) (うち国際学会 5件、 招待講演 3件)

  • [雑誌論文] Meta-Bound on Lower Bounds of Bayes Risk in Parameter Estimation2024

    • 著者名/発表者名
      SAITO Shota
    • 雑誌名

      IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences

      巻: E107.A 号: 3 ページ: 503-509

    • DOI

      10.1587/transfun.2023TAP0002

    • ISSN
      0916-8508, 1745-1337
    • 年月日
      2024-03-01
    • 関連する報告書
      2023 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] An Efficient Bayes Coding Algorithm for Changing Context Tree Model2024

    • 著者名/発表者名
      SHIMADA Koshi、SAITO Shota、MATSUSHIMA Toshiyasu
    • 雑誌名

      IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences

      巻: E107.A 号: 3 ページ: 448-457

    • DOI

      10.1587/transfun.2023TAP0017

    • ISSN
      0916-8508, 1745-1337
    • 年月日
      2024-03-01
    • 関連する報告書
      2023 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Bayes optimal estimation and its approximation algorithm for difference with and without treatment under IRSLC model2023

    • 著者名/発表者名
      Ishiwatari Taisuke、Saito Shota、Nakahara Yuta、Iikubo Yuji、Matsushima Toshiyasu
    • 雑誌名

      International Journal of Data Science and Analytics

      巻: -

    • DOI

      10.1007/s41060-023-00468-8

    • 関連する報告書
      2023 実施状況報告書
    • 査読あり
  • [雑誌論文] Non-Asymptotic Bounds of Cumulant Generating Function of Codeword Lengths in Variable-Length Lossy Compression2023

    • 著者名/発表者名
      Saito Shota and Matsushima Toshiyasu
    • 雑誌名

      IEEE Transactions on Information Theory

      巻: 69 号: 4 ページ: 2113-2119

    • DOI

      10.1109/tit.2022.3229358

    • 関連する報告書
      2023 実施状況報告書 2022 実施状況報告書
    • 査読あり / オープンアクセス
  • [学会発表] シャッフルモデルによる局所差分プライベート行結合データのプライバシ増幅に関する考察2024

    • 著者名/発表者名
      千田 浩司, 齋藤 翔太, 高木 理
    • 学会等名
      第198回DPS・第104回CSEC合同研究発表会
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] 対数損失歪みのもとでの可変長有歪み情報源符号の符号語長のキュムラント母関数の上界2024

    • 著者名/発表者名
      齋藤 翔太
    • 学会等名
      電子情報通信学会 情報理論研究会
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] f -Divergence Differential Privacy2024

    • 著者名/発表者名
      Shota Saito, Koji Chida, Osamu Takaki
    • 学会等名
      2024年 暗号と情報セキュリティシンポジウム(SCIS2024)
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] Discovery of Contrast Itemset with Statistical Background Between Two Continuous Variables2023

    • 著者名/発表者名
      Kaoru Shimada, Shogo Matsuno, Shota Saito
    • 学会等名
      The 25th International Conference on Big Data Analytics and Knowledge Discovery (DAWAK 2023)
    • 関連する報告書
      2023 実施状況報告書
    • 国際学会
  • [学会発表] Hyperparameter Learning of Bayesian Context Tree Models2023

    • 著者名/発表者名
      Yuta Nakahara, Shota Saito, Koshi Shimada, Toshiyasu Matsushima
    • 学会等名
      2023 IEEE International Symposium on Information Theory
    • 関連する報告書
      2023 実施状況報告書
    • 国際学会
  • [学会発表] 「分類問題に対する情報理論的アプローチ」の分類整理と解説2023

    • 著者名/発表者名
      齋藤翔太
    • 学会等名
      第46回情報理論とその応用シンポジウム(SITA2023)
    • 関連する報告書
      2023 実施状況報告書
    • 招待講演
  • [学会発表] Log-lossのもとでの誤りを許したsoft guessingについて2023

    • 著者名/発表者名
      齋藤翔太
    • 学会等名
      第12回シャノン理論ワークショップ(STW2023)
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] Bayesian Predictive Distribution for Poisson Observables Under a Class of Prior Distribution and α-Divergence2023

    • 著者名/発表者名
      齋藤翔太
    • 学会等名
      電子情報通信学会 情報理論研究会
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] セキュリティを考慮した2つの問題に対する情報理論的解析について ~ Local Differential Privacyの下でのパラメータ推定問題と、プライバシーと有用性のトレードオフ問題 ~2023

    • 著者名/発表者名
      齋藤翔太
    • 学会等名
      電子情報通信学会 情報理論研究会
    • 関連する報告書
      2022 実施状況報告書
    • 招待講演
  • [学会発表] 文脈木情報源に対する逐次型情報源符号化の最大冗長度の下界について2023

    • 著者名/発表者名
      齋藤翔太
    • 学会等名
      電子情報通信学会 情報理論研究会
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] Bayes Optimal Estimation and Its Approximation Algorithm for Difference with and without Treatment under URLC Model2022

    • 著者名/発表者名
      Taisuke Ishiwatari, Shota Saito, Yuta Nakahara, Yuji Iikubo, Toshiyasu Matsushima
    • 学会等名
      2022 International Symposium on Information Theory and Its Applications
    • 関連する報告書
      2022 実施状況報告書
    • 国際学会
  • [学会発表] On Meta-Bound for Lower Bounds of Bayes Risk2022

    • 著者名/発表者名
      Shota Saito
    • 学会等名
      2022 IEEE International Symposium on Information Theory
    • 関連する報告書
      2022 実施状況報告書
    • 国際学会
  • [学会発表] Probability Distribution on Rooted Trees2022

    • 著者名/発表者名
      Yuta Nakahara, Shota Saito, Akira Kamatsuka, Toshiyasu Matsushima
    • 学会等名
      2022 IEEE International Symposium on Information Theory
    • 関連する報告書
      2022 実施状況報告書
    • 国際学会
  • [学会発表] Lower Bound of Bayes Risk in Parameter Estimation under Local Differential Privacy2022

    • 著者名/発表者名
      Shota Saito
    • 学会等名
      第45回情報理論とその応用シンポジウム
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] 決定木モデルにおけるメタツリーに対するマルコフ連鎖モンテカルロ法2022

    • 著者名/発表者名
      中原 悠太, 齋藤 翔太, 一條 尚希, 風間 皐希, 松嶋 敏泰
    • 学会等名
      第45回情報理論とその応用シンポジウム
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] ベイズ決定理論に基づく機械学習ライブラリ:BayesML 0.2.02022

    • 著者名/発表者名
      中原悠太, 齋藤翔太, 島田航志, 飯窪祐二, 風間皐希, 一條尚希, 松嶋敏泰, BayesML Developers
    • 学会等名
      第25回情報論的学習理論ワークショップ
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] 「情報」を測る:情報理論における情報の捉え方2022

    • 著者名/発表者名
      齋藤翔太
    • 学会等名
      第10回 早稲田大学データ科学センター・先端社会科学研究所ジョイントセミナー
    • 関連する報告書
      2022 実施状況報告書
    • 招待講演
  • [学会発表] ベイズ決定理論に基づく機械学習ライブラリ:BayesML 0.1.02022

    • 著者名/発表者名
      中原 悠太, 一條 尚希, 島田 航志, 飯窪 祐二, 齋藤 翔太, 風間 皐希, 松嶋 敏泰, BayesML Code Authors
    • 学会等名
      2022年度統計関連学会連合大会
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] On Bayesian Approach for Classification of Context Tree Model2022

    • 著者名/発表者名
      Shota Saito
    • 学会等名
      電子情報通信学会 情報理論研究会
    • 関連する報告書
      2022 実施状況報告書

URL: 

公開日: 2022-04-19   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi