• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2018 年度 実施状況報告書

確率的多腕バンディット設定における効率的な良腕識別手法の開発とその応用

研究課題

研究課題/領域番号 18K18099
研究機関北海道大学

研究代表者

田畑 公次  北海道大学, 電子科学研究所, 特任助教 (20814445)

研究期間 (年度) 2018-04-01 – 2022-03-31
キーワード機械学習 / 多腕バンディット問題 / 良腕識別問題
研究実績の概要

本研究の目的は,複数の候補の中から一つを選択するとその候補からのみ報酬が観測できるという多腕バンディット問題の枠組みにおいて,与えられた閾値よりも平均報酬が大きな候補が存在するかどうかをできるだけ少ない回数の選択で判断する問題(良腕識別問題)を解く手法の開発を行うことである.
従来の研究では,もっともよい候補を選択し続けたときの累積報酬と比較したときの差をできるだけ小さくするリグレット最小化や,最も良い選択肢をできるだけ少ない選択回数で見つけるという最良腕識別などがよく研究されてきた.しかし,病理診断や故障の診断においては,一か所でも異常な個所があるかどうかを判断すれば十分であることが多く,リグレット最小化や最良腕識別などとは目的が異なっていて,このような応用に対して既存手法を利用することは適切でないと考えられる.良腕識別問題はこのような応用に対して適切である.そこで,良腕識別問題を解くためのアルゴリズムとして,どの候補を選択するかを決定する「腕選択方策」と,いつアルゴリズムを停止し解を出力するかを決定する「停止条件」の組み合わせで構成されるアルゴリズムの枠組みを提案した.
「平均報酬が閾値よりも高い腕が一つ以上存在するか,全てが閾値以下か」を判定するという問題の非対称性を利用した停止条件と,新たに提案したAPT_Pという腕選択方策を提案し,理論的な解析を行い漸近的な最適性を示した.また,腕選択方策に従来手法を使ったアルゴリズムとの比較実験も行い,提案手法がより良い結果が得られることを示した.
この研究結果は現在機械学習の学会であるEuropean Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databasesに投稿中である.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

平成30年度は,当初の予定通り,アルゴリズムによらない良腕識別問題のサンプル複雑性の下界に関する理論解析や提案アルゴリズムの平均停止時刻の上界に関する理論解析を行った.
さらに,人工データを使った実験や,実データを使ったシミュレーション実験を行い,提案手法の有効性を示すことができた.
また,提案手法の応用先の調査の中で,一度に選択できる候補の数を増やしたり,平均報酬が閾値以上の候補が一つ以上あるかどうかではなく,一定数以上あるかどうかを判定する問題設定の方が実際の応用には有効なケースがあることが分かり,問題設定を拡張することで実用性を高められそうだという知見を得た.

今後の研究の推進方策

平成31年度は,提案手法の病理診断への応用のための実験を行う予定である.
これまで提案手法の効果を検証するための実データを使った実験では,提案手法の主要な応用先として考えている病理診断や故障診断のためのデータセットではないので,提案手法の有効性を主張するために,より適したデータセットを使った実験を行いたい.
そこで,今年度は病理診断に則したデータを用意し,実験により提案手法の効果を検証したい.
また,複数の候補を選択できるようにした拡張した問題に対するアルゴリズムの検討を今年度およびそれ以降も行う予定である.

次年度使用額が生じた理由

参加予定の研究会への参加を見送ったため今年度の支出が少なくなった.
次年度には参加できなかった研究会へ参加したいと考えている.

  • 研究成果

    (1件)

すべて 2018

すべて 学会発表 (1件)

  • [学会発表] 非対称性を利用した悪腕存在チェックアルゴリズム2018

    • 著者名/発表者名
      田畑 公次, 中村 篤祥, 小松崎 民樹
    • 学会等名
      平成30年度 情報論的学習理論と機械学習研究会

URL: 

公開日: 2019-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi