• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2020 年度 実績報告書

バンディット問題の方策の実用化のための理論の深化

研究課題

研究課題/領域番号 19H04161
研究機関北海道大学

研究代表者

中村 篤祥  北海道大学, 情報科学研究院, 教授 (50344487)

研究分担者 田畑 公次  北海道大学, 化学反応創成研究拠点, 特任助教 (20814445)
工藤 峰一  北海道大学, 情報科学研究院, 教授 (60205101)
研究期間 (年度) 2019-04-01 – 2023-03-31
キーワードバンディット問題 / 敵対的バンディット / アルゴリズム / 大規模探索
研究実績の概要

小ノイズ敵対的バンディットの研究においては、以前にUCSCのWarmuth教授とHelmbold教授と一緒に行った敵対的バンディット設定の「ノイズフリーバンディット問題」を小さなノイズを許す問題に拡張し、それに有効なアルゴリズムを開発することを目指している。一昨年度末にUCSCのHelmbold教授を訪問し、ノイズフリー条件(1回も誤らない腕が存在するという条件)を「誤る回数が高々k回の腕が存在する」という条件に緩めた問題定式化を行った。本年度は、その問題設定の下、腕の数が2本でk=1およびk=2のアルゴリズムを開発し、腕の数が3本以上でk>2の条件でも動作するもっと一般的なアルゴリズムの開発に着手した。

精度効率保証大規模探索の研究においては、2019年度に開発した属性選択アルゴリズム[Aurelien, Nakamura, Tabata 2019]のアルゴリズムの探索木の拡張法の検討を行った。精度を保証して大規模探索を実現するためには、探索木の拡張法は重要であり、引き続き検討を行う予定である。

このほか今年度は、分類バンディット問題のアルゴリズムの開発に取り組んだ。分類バンディット問題は、与えられた腕の集合を分類することを目的とするバンディット問題である。この枠組みでは、与えられた腕の内、期待報酬がある値以上の腕がある割合以上あるかないかで分類を行う。本年度は、k-腕設定のトンプソンサンプリングをベースとしたアルゴリズムの開発を行い、実験的な性能評価を行った。また、連続腕設定に拡張した問題を考え、やはりトンプソンサンプリングに基づく方法を考え、実験的評価を行い提案方式の優位性を確認した。

現在までの達成度 (区分)
現在までの達成度 (区分)

3: やや遅れている

理由

コロナの影響で、2019年度末のUCSC訪問で十分な議論ができず、小ノイズ敵対的バンディットの研究に遅れが生じた。
また、精度効率保証大規模探索の研究では理論保証のある探索木拡張法の開発で予想外に時間がかかっているため、遅れが生じている。

今後の研究の推進方策

小ノイズバンディット問題に関しては、引き続きUCSCとの共同研究を続け、腕の数が3本以上でk>2の条件でも動作する一般的なアルゴリズムの開発を行っていく。実際に訪問して共同研究を行う予定であったが、必要な議論はTV会議で行うようにする。精度効率保証大規模探索に関しては、理論的に良い精度効率が保証できる探索空間と探索木拡張法のペアを1つ見つけて示すところから始め、徐々に対象の探索空間の一般化などを行なっていく。また、こちらも分担者や協力者との連携を強め、新しい考えを入れることにより、状況を打破していく。分類バンディットなど、バンディットの新しい方向への発展も取り入れて、研究範囲を少し広げて、実用化のための理論の深化を進めていく。

  • 研究成果

    (2件)

すべて 2020

すべて 雑誌論文 (1件) (うち査読あり 1件、 オープンアクセス 1件) 学会発表 (1件)

  • [雑誌論文] Data-Dependent Conversion to a Compact Integer-Weighted Representation of a Weighted Voting Classifier.2020

    • 著者名/発表者名
      Mitsuki Maekawa, Atsuyoshi Nakamura, Mineichi Kudo
    • 雑誌名

      Proceedings of Machine Learning Research

      巻: 129 ページ: 241, 256

    • 査読あり / オープンアクセス
  • [学会発表] 決定森の分岐条件の共有化の効果と応用2020

    • 著者名/発表者名
      中村 篤祥、櫻田 健斗
    • 学会等名
      人工知能学会全国大会

URL: 

公開日: 2021-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi