• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

線形バンディット問題における実用的アルゴリズムの構築

研究課題

研究課題/領域番号 22KJ1680
補助金の研究課題番号 21J21272 (2021-2022)
研究種目

特別研究員奨励費

配分区分基金 (2023)
補助金 (2021-2022)
応募区分国内
審査区分 小区分60030:統計科学関連
研究機関東京大学 (2023)
京都大学 (2021-2022)

研究代表者

土屋 平 (2021, 2023)  東京大学, 大学院情報理工学系研究科, 助教

特別研究員 土屋 平 (2022)  京都大学, 情報学研究科, 特別研究員(DC1)
研究期間 (年度) 2023-03-08 – 2024-03-31
研究課題ステータス 完了 (2023年度)
配分額 *注記
2,200千円 (直接経費: 2,200千円)
2023年度: 700千円 (直接経費: 700千円)
2022年度: 700千円 (直接経費: 700千円)
2021年度: 800千円 (直接経費: 800千円)
キーワード機械学習 / 学習理論 / バンディット問題 / 逐次的意思決定問題 / オンライン凸最適化 / 両環境最適アルゴリズム
研究開始時の研究の概要

本年度の研究では昨年度に引き続き,背後の環境に対して頑健に動作するバンディットアルゴリズムの研究を行う.バンディット問題においては確率的設定と敵対的設定という大きく理論的に異なる枠組みがあるが,実問題がどちらの問題クラスに属するか判断は難しい.そこで,単一のアルゴリズムで両方の設定において最適性を達成することが望ましく,そのような性質は両環境最適性と呼ばれる.既存の両環境最適なアルゴリズムは比較的単純な問題に対してのみ適用可能であり,また,問題の難しさへの適応力が十分できないという問題があった.今年度は後者の問題を解決する両環境最適アルゴリズムの構築を行う.

研究実績の概要

本年度は,逐次的意思決定問題において確率的環境と敵対的環境で同時に最適性を達成する両環境最適アルゴリズムが,対象とする問題が属する最小の問題クラスの難しさに適応的に動作する技術の開発を行った.具体的には,部分観測問題と呼ばれる多腕バンディット問題や動的価格設定などの多くの逐次的意思決定問題を特別な場合として含む非常に一般的な逐次的意思決定問題を対象とした.問題が属する最小クラスの難しさに適応的に動作させるために,両環境最適性を達成するための標準的な手法である Follow-the-Regularized-Leader において,その正則化関数の強さとアルゴリズムの安定性に同時適応的な学習率を構築した.それにより,両環境最適性と問題の難しさへの適応性を同時に達成することに成功した.本研究成果は,機械学習分野で最も権威のある国際会議であるNeurIPS2023に採択された.
他にも行動の選択肢に組合せ的構造を持つ組合せ半バンディット問題において複数の環境最適性を同時に達成可能な両環境最適アルゴリズムを構築した.本研究成果は,機械学習・学習理論分野の代表的な国際会議であるAISTATS2023に採択された.
3年間の研究成果全体として,様々な構造を伴う逐次的意思決定問題において,多様な環境適応性を持つアルゴリズムを構築することに成功した.特に,両環境最適アルゴリズムは実問題で頻出する確率的環境と敵対的環境の中間の環境でほぼ最適なリグレットを達成可能であり実応用上重要な貢献となった.本研究の当初の目標は主に観測が線形な構造を持つ線形バンディット問題においてノイズに対して頑健に動作するアルゴリズムを構築することであったが,当初の計画より多様な問題設定において頑健性だけでなく他の適応性も有するアルゴリズムを構築することに成功した.

報告書

(3件)
  • 2023 実績報告書
  • 2022 実績報告書
  • 2021 実績報告書
  • 研究成果

    (15件)

すべて 2024 2023 2022

すべて 雑誌論文 (7件) (うち査読あり 7件、 オープンアクセス 7件) 学会発表 (8件) (うち国際学会 2件、 招待講演 1件)

  • [雑誌論文] Further Adaptive Best-of-Both-Worlds Algorithm for Combinatorial Semi-Bandits2023

    • 著者名/発表者名
      Taira Tsuchiya, Shinji Ito, and Junya Honda
    • 雑誌名

      Proceedings of 26th International Conference on Artificial Intelligence and Statistics

      巻: 206 ページ: 8117-8144

    • 関連する報告書
      2023 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Stability-penalty-adaptive follow-the-regularized-leader: Sparsity, game-dependency, and best-of-both-worlds2023

    • 著者名/発表者名
      Taira Tsuchiya, Shinji Ito, and Junya Honda
    • 雑誌名

      Neural Information Processing Systems

      巻: 36 ページ: 47406-47437

    • 関連する報告書
      2023 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Best-of-Both-Worlds Algorithms for Partial Monitoring2023

    • 著者名/発表者名
      Taira Tsuchiya, Shinji Ito, and Junya Honda
    • 雑誌名

      Proceedings of The 34th International Conference on Algorithmic Learning Theory (ALT 2023)

      巻: 201 ページ: 1484-1515

    • 関連する報告書
      2022 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Follow-the-Perturbed-Leader Achieves Best-of-Both-Worlds for Bandit Problems2023

    • 著者名/発表者名
      Junya Honda, Shinji Ito, and Taira Tsuchiya
    • 雑誌名

      Proceedings of The 34th International Conference on Algorithmic Learning Theory (ALT 2023)

      巻: 201 ページ: 726-754

    • 関連する報告書
      2022 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Adversarially Robust Multi-Armed Bandit Algorithm with Variance-Dependent Regret Bounds2022

    • 著者名/発表者名
      Shinji Ito, Taira Tsuchiya, and Junya Honda
    • 雑誌名

      Proceedings of Thirty Fifth Conference on Learning Theory (COLT 2022)

      巻: 178 ページ: 1421-1422

    • 関連する報告書
      2022 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Minimax Optimal Algorithms for Fixed-Budget Best Arm Identification2022

    • 著者名/発表者名
      Junpei Komiyama, Taira Tsuchiya, and Junya Honda
    • 雑誌名

      Advances in Neural Information Processing Systems 35 (NeurIPS 2022)

      巻: 35 ページ: 10393-10404

    • 関連する報告書
      2022 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Nearly Optimal Best-of-Both-Worlds Algorithms for Online Learning with Feedback Graphs2022

    • 著者名/発表者名
      Shinji Ito, Taira Tsuchiya, and Junya Honda
    • 雑誌名

      Advances in Neural Information Processing Systems 35 (NeurIPS 2022)

      巻: 35 ページ: 28631-28643

    • 関連する報告書
      2022 実績報告書
    • 査読あり / オープンアクセス
  • [学会発表] Best of Both Worlds Algorithms in Online Decision Making Problems2024

    • 著者名/発表者名
      Taira Tsuchiya
    • 学会等名
      Machine Learning Summer School 2024
    • 関連する報告書
      2023 実績報告書
  • [学会発表] Best-of-Both-Worlds Algorithms for Partial Monitoring2023

    • 著者名/発表者名
      土屋 平,伊藤伸志,本多 淳也
    • 学会等名
      第125回人工知能基本問題研究会(SIG-FPAI)
    • 関連する報告書
      2023 実績報告書
  • [学会発表] 組合せ半バンディット問題における適応的 best-of-both-worlds 方策2023

    • 著者名/発表者名
      土屋 平
    • 学会等名
      第22回情報科学技術フォーラム(FIT2023)
    • 関連する報告書
      2023 実績報告書
    • 招待講演
  • [学会発表] オンライン意思決定問題における複数の観測量に同時に依存したリグレット上界を有する FTRL と,それを用いたスパース性依存上界やゲーム依存型上界,両環境最適性の実現2023

    • 著者名/発表者名
      土屋 平,伊藤伸志,本多 淳也
    • 学会等名
      第26回情報論的学習理論ワークショップ (IBIS2023)
    • 関連する報告書
      2023 実績報告書
  • [学会発表] Further Adaptive Best-of-Both-Worlds Algorithm for Combinatorial Semi-Bandits2023

    • 著者名/発表者名
      Taira Tsuchiya, Shinji Ito, and Junya Honda
    • 学会等名
      International Conference on Artificial Intelligence and Statistics (AISTATS 2023)
    • 関連する報告書
      2023 実績報告書
    • 国際学会
  • [学会発表] Stability-penalty-adaptive follow-the-regularized-leader: Sparsity, game-dependency, and best-of-both-worlds2023

    • 著者名/発表者名
      Taira Tsuchiya, Shinji Ito, and Junya Honda
    • 学会等名
      Thirty-seventh Annual Conference on Neural Information Processing Systems 2023 (NeurIPS 2023)
    • 関連する報告書
      2023 実績報告書
    • 国際学会
  • [学会発表] バンディット問題における Follow-The-Perturbated-Leader 方策の確率的・ 敵対的最適性について2023

    • 著者名/発表者名
      本多 淳也,伊藤伸志,土屋 平
    • 学会等名
      Information-Based Induction Sciences and Machine Learning Workshop
    • 関連する報告書
      2022 実績報告書
  • [学会発表] バンディット問題における Best-of-Both-Worlds 方策の進展:構造的バンディットと分散依存リグレット2022

    • 著者名/発表者名
      土屋 平,伊藤伸志,本多 淳也
    • 学会等名
      25th Information-Based Induction Sciences Workshop (IBIS 2022)
    • 関連する報告書
      2022 実績報告書

URL: 

公開日: 2021-05-27   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi