• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2019 Fiscal Year Research-status Report

確率的多腕バンディット設定における効率的な良腕識別手法の開発とその応用

Research Project

Project/Area Number 18K18099
Research InstitutionHokkaido University

Principal Investigator

田畑 公次  北海道大学, 化学反応創成研究拠点, 特任助教 (20814445)

Project Period (FY) 2018-04-01 – 2022-03-31
Keywords機械学習 / 多腕バンディット / 良腕識別
Outline of Annual Research Achievements

本研究では,複数の選択肢の中から一つ選択する度に,その選択肢に対応した報酬に対する不完全なフィードバックが得られるというシステムにおいて,できるだけ少ない回数のサンプリングで与えられた閾値よりも大きな報酬を持った選択肢(良腕)が存在するかどうかを判定したり,あるいは良腕を識別したりする問題を解くためのアルゴリズムの開発を行う.
本研究では,各選択肢から得られる報酬の分布が独立同分布に従うという仮定を置き,また任意に与えられた失敗確率のもとで正しく答えを出力する固定信頼度設定で考える.
問題設定から導かれる任意のアルゴリズムが最低限必要とするサンプル複雑性の下界に関する解析や,提案アルゴリズムに関する理論的な解析,実験による他手法との比較を行うことでアルゴリズムの有効性を検証する.
2019年度は良腕が存在するかどうかをできるだけ少ない回数のサンプリングで確認する問題を解くための手法を提案し,問題を解くために必要な平均サンプル数の下界や提案手法のサンプル複雑性の上界に対して理論的な評価や,人工データや実データを用いたシミュレーション実験により他の手法との比較実験を行い,提案手法の有効性を評価した.その研究結果はJournal of Machine Learning Researchに掲載されている.
また,良腕が存在するかどうかではなく,指定した個数以上存在するかどうかという問題へと拡張を行い,理論的な評価と数値実験の結果を論文にまとめ,現在投稿中である.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

2019年度は,アルゴリズムによらない良腕の存在をチェックする問題のサンプル複雑性の下界に関する理論解析や提案アルゴリズムの平均停止時刻の上界に関する理論解析を行った.また,シミュレーション実験による他手法との比較により提案手法が有効性であることを確認した.
さらに,良腕が指定した個数以上存在するかどうかという問題(分類バンディット)へと拡張を行い,理論的な評価と数値実験の結果をまとめ,論文を投稿し,現在査読中である.
また,病理診断への応用として実データに基づいた実験に関してまとめており,論文を投稿する予定である.

Strategy for Future Research Activity

2020年度は,現在の分類バンディットに対する提案手法の理論評価は,まだ部分的にしかできていないので,さらに理論解析を進めていく予定である.
また,複数の候補を一度に選択できるようにした拡張した問題に対するアルゴリズムの解析に関しても行っていく予定である.

Causes of Carryover

参加予定の研究会への参加を見送ったため今年度の支出が少なくなった.
次年度には参加できなかった研究会へ参加したいと考えている.

  • Research Products

    (4 results)

All 2020 2019

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (3 results) (of which Int'l Joint Research: 1 results)

  • [Journal Article] A bad arm existence checking problem: How to utilize asymmetric problem structure?2020

    • Author(s)
      Tabata, K., Nakamura, A., Honda, J. Komatsuzaki, T.
    • Journal Title

      Journal of Machine Learning Research

      Volume: 109 Pages: 327-372

    • DOI

      10.1007/s10994-019-05854-7

    • Peer Reviewed
  • [Presentation] Bad Arm Existence Checking Algorithm with Bandit Feedback2019

    • Author(s)
      Koji Tabata, Atsuyoshi Nakamura, Tamiki Komatsuzaki
    • Organizer
      The 20th RIES-HOKUDAI International Symposium
    • Int'l Joint Research
  • [Presentation] 非対称なグレイゾーン付き悪腕存在チェックアルゴリズム2019

    • Author(s)
      田畑 公次, 中村 篤祥, 小松崎 民樹
    • Organizer
      離散構造処理系プロジェクト「2019年度 初夏のワークショップ」
  • [Presentation] バンディットフィードバック下での良腕悪腕の個数による分類問題2019

    • Author(s)
      田畑 公次, 中村 篤祥, 小松崎 民樹
    • Organizer
      第22回情報論的学習理論ワークショップ (IBIS 2019)

URL: 

Published: 2021-01-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi