• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2023 Fiscal Year Annual Research Report

線形バンディット問題における実用的アルゴリズムの構築

Research Project

Project/Area Number 22KJ1680
Allocation TypeMulti-year Fund
Research InstitutionThe University of Tokyo

Principal Investigator

土屋 平  東京大学, 大学院情報理工学系研究科, 助教

Project Period (FY) 2023-03-08 – 2024-03-31
Keywords機械学習 / 学習理論 / バンディット問題 / 逐次的意思決定問題 / オンライン凸最適化 / 両環境最適アルゴリズム
Outline of Annual Research Achievements

本年度は,逐次的意思決定問題において確率的環境と敵対的環境で同時に最適性を達成する両環境最適アルゴリズムが,対象とする問題が属する最小の問題クラスの難しさに適応的に動作する技術の開発を行った.具体的には,部分観測問題と呼ばれる多腕バンディット問題や動的価格設定などの多くの逐次的意思決定問題を特別な場合として含む非常に一般的な逐次的意思決定問題を対象とした.問題が属する最小クラスの難しさに適応的に動作させるために,両環境最適性を達成するための標準的な手法である Follow-the-Regularized-Leader において,その正則化関数の強さとアルゴリズムの安定性に同時適応的な学習率を構築した.それにより,両環境最適性と問題の難しさへの適応性を同時に達成することに成功した.本研究成果は,機械学習分野で最も権威のある国際会議であるNeurIPS2023に採択された.
他にも行動の選択肢に組合せ的構造を持つ組合せ半バンディット問題において複数の環境最適性を同時に達成可能な両環境最適アルゴリズムを構築した.本研究成果は,機械学習・学習理論分野の代表的な国際会議であるAISTATS2023に採択された.
3年間の研究成果全体として,様々な構造を伴う逐次的意思決定問題において,多様な環境適応性を持つアルゴリズムを構築することに成功した.特に,両環境最適アルゴリズムは実問題で頻出する確率的環境と敵対的環境の中間の環境でほぼ最適なリグレットを達成可能であり実応用上重要な貢献となった.本研究の当初の目標は主に観測が線形な構造を持つ線形バンディット問題においてノイズに対して頑健に動作するアルゴリズムを構築することであったが,当初の計画より多様な問題設定において頑健性だけでなく他の適応性も有するアルゴリズムを構築することに成功した.

  • Research Products

    (8 results)

All 2024 2023

All Journal Article (2 results) (of which Peer Reviewed: 2 results,  Open Access: 2 results) Presentation (6 results) (of which Int'l Joint Research: 2 results,  Invited: 1 results)

  • [Journal Article] Further Adaptive Best-of-Both-Worlds Algorithm for Combinatorial Semi-Bandits2023

    • Author(s)
      Taira Tsuchiya, Shinji Ito, and Junya Honda
    • Journal Title

      Proceedings of 26th International Conference on Artificial Intelligence and Statistics

      Volume: 206 Pages: 8117-8144

    • Peer Reviewed / Open Access
  • [Journal Article] Stability-penalty-adaptive follow-the-regularized-leader: Sparsity, game-dependency, and best-of-both-worlds2023

    • Author(s)
      Taira Tsuchiya, Shinji Ito, and Junya Honda
    • Journal Title

      Neural Information Processing Systems

      Volume: 36 Pages: 47406-47437

    • Peer Reviewed / Open Access
  • [Presentation] Best of Both Worlds Algorithms in Online Decision Making Problems2024

    • Author(s)
      Taira Tsuchiya
    • Organizer
      Machine Learning Summer School 2024
  • [Presentation] Best-of-Both-Worlds Algorithms for Partial Monitoring2023

    • Author(s)
      土屋 平,伊藤伸志,本多 淳也
    • Organizer
      第125回人工知能基本問題研究会(SIG-FPAI)
  • [Presentation] 組合せ半バンディット問題における適応的 best-of-both-worlds 方策2023

    • Author(s)
      土屋 平
    • Organizer
      第22回情報科学技術フォーラム(FIT2023)
    • Invited
  • [Presentation] オンライン意思決定問題における複数の観測量に同時に依存したリグレット上界を有する FTRL と,それを用いたスパース性依存上界やゲーム依存型上界,両環境最適性の実現2023

    • Author(s)
      土屋 平,伊藤伸志,本多 淳也
    • Organizer
      第26回情報論的学習理論ワークショップ (IBIS2023)
  • [Presentation] Further Adaptive Best-of-Both-Worlds Algorithm for Combinatorial Semi-Bandits2023

    • Author(s)
      Taira Tsuchiya, Shinji Ito, and Junya Honda
    • Organizer
      International Conference on Artificial Intelligence and Statistics (AISTATS 2023)
    • Int'l Joint Research
  • [Presentation] Stability-penalty-adaptive follow-the-regularized-leader: Sparsity, game-dependency, and best-of-both-worlds2023

    • Author(s)
      Taira Tsuchiya, Shinji Ito, and Junya Honda
    • Organizer
      Thirty-seventh Annual Conference on Neural Information Processing Systems 2023 (NeurIPS 2023)
    • Int'l Joint Research

URL: 

Published: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi