2018 Fiscal Year Research-status Report
確率的多腕バンディット設定における効率的な良腕識別手法の開発とその応用
Project/Area Number |
18K18099
|
Research Institution | Hokkaido University |
Principal Investigator |
田畑 公次 北海道大学, 電子科学研究所, 特任助教 (20814445)
|
Project Period (FY) |
2018-04-01 – 2022-03-31
|
Keywords | 機械学習 / 多腕バンディット問題 / 良腕識別問題 |
Outline of Annual Research Achievements |
本研究の目的は,複数の候補の中から一つを選択するとその候補からのみ報酬が観測できるという多腕バンディット問題の枠組みにおいて,与えられた閾値よりも平均報酬が大きな候補が存在するかどうかをできるだけ少ない回数の選択で判断する問題(良腕識別問題)を解く手法の開発を行うことである. 従来の研究では,もっともよい候補を選択し続けたときの累積報酬と比較したときの差をできるだけ小さくするリグレット最小化や,最も良い選択肢をできるだけ少ない選択回数で見つけるという最良腕識別などがよく研究されてきた.しかし,病理診断や故障の診断においては,一か所でも異常な個所があるかどうかを判断すれば十分であることが多く,リグレット最小化や最良腕識別などとは目的が異なっていて,このような応用に対して既存手法を利用することは適切でないと考えられる.良腕識別問題はこのような応用に対して適切である.そこで,良腕識別問題を解くためのアルゴリズムとして,どの候補を選択するかを決定する「腕選択方策」と,いつアルゴリズムを停止し解を出力するかを決定する「停止条件」の組み合わせで構成されるアルゴリズムの枠組みを提案した. 「平均報酬が閾値よりも高い腕が一つ以上存在するか,全てが閾値以下か」を判定するという問題の非対称性を利用した停止条件と,新たに提案したAPT_Pという腕選択方策を提案し,理論的な解析を行い漸近的な最適性を示した.また,腕選択方策に従来手法を使ったアルゴリズムとの比較実験も行い,提案手法がより良い結果が得られることを示した. この研究結果は現在機械学習の学会であるEuropean Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databasesに投稿中である.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
平成30年度は,当初の予定通り,アルゴリズムによらない良腕識別問題のサンプル複雑性の下界に関する理論解析や提案アルゴリズムの平均停止時刻の上界に関する理論解析を行った. さらに,人工データを使った実験や,実データを使ったシミュレーション実験を行い,提案手法の有効性を示すことができた. また,提案手法の応用先の調査の中で,一度に選択できる候補の数を増やしたり,平均報酬が閾値以上の候補が一つ以上あるかどうかではなく,一定数以上あるかどうかを判定する問題設定の方が実際の応用には有効なケースがあることが分かり,問題設定を拡張することで実用性を高められそうだという知見を得た.
|
Strategy for Future Research Activity |
平成31年度は,提案手法の病理診断への応用のための実験を行う予定である. これまで提案手法の効果を検証するための実データを使った実験では,提案手法の主要な応用先として考えている病理診断や故障診断のためのデータセットではないので,提案手法の有効性を主張するために,より適したデータセットを使った実験を行いたい. そこで,今年度は病理診断に則したデータを用意し,実験により提案手法の効果を検証したい. また,複数の候補を選択できるようにした拡張した問題に対するアルゴリズムの検討を今年度およびそれ以降も行う予定である.
|
Causes of Carryover |
参加予定の研究会への参加を見送ったため今年度の支出が少なくなった. 次年度には参加できなかった研究会へ参加したいと考えている.
|
Research Products
(1 results)