2021 Fiscal Year Annual Research Report
Development of efficient multi-armed bandit algorithm for good arm identification and its application
Project/Area Number |
18K18099
|
Research Institution | Hokkaido University |
Principal Investigator |
田畑 公次 北海道大学, 電子科学研究所, 准教授 (20814445)
|
Project Period (FY) |
2018-04-01 – 2022-03-31
|
Keywords | 多腕バンディット |
Outline of Annual Research Achievements |
本研究では、確率的多腕バンディットにおいて効率的な良腕識別の手法の開発とその理論解析を行った。ここで良腕とは与えられた閾値よりも大きな報酬平均を持った腕のことを指す。多腕バンディットアルゴリズムは、ゲームAIの開発やインターネット広告配信、ウェブページデザイン、治験など様々な分野に応用されており、その応用範囲は近年さらに広がってきている。本研究の結果は応用可能な範囲をさらに広げることが期待できる。 本研究の最終年度では、良腕が一定個数以上あるかどうかを、任意に与えられた許容誤識別率以下で正しく判別する分類バンディットと呼ばれる問題設定に関する研究を行った。トンプソン抽出と呼ばれる方策をもとに、事後分布からのサンプルを用いて各腕の報酬平均を真の平均と見たときに良腕の個数に応じて場合分けを行う改良を加えた方策を開発した。さらに、偽陰性率・偽陽性率による誤診断を加味した、より一般的なケースにも対応できるよう修正を行った。 開発したアルゴリズムは複数の従来法との比較を行い、提案手法の優位性を実験的に確認するとともに、任意のアルゴリズムのサンプル複雑性の下界や提案手法による上界の理論的な評価も行った。この結果は国際会議で発表をおこなった。 また、前年度までに研究を進めていた良腕が存在するかどうかを識別する問題に対して提案したアルゴリズムが分光顕微鏡を用いた病理診断への応用の実証実験を行った。実際の分光顕微鏡を用いた計測実験により従来の診断と比べて10倍程度診断の高速化ができることを確認した。
|