2021 Fiscal Year Annual Research Report
Project/Area Number |
19H04161
|
Research Institution | Hokkaido University |
Principal Investigator |
中村 篤祥 北海道大学, 情報科学研究院, 教授 (50344487)
|
Co-Investigator(Kenkyū-buntansha) |
田畑 公次 北海道大学, 化学反応創成研究拠点, 特任助教 (20814445)
工藤 峰一 北海道大学, 情報科学研究院, 教授 (60205101)
|
Project Period (FY) |
2019-04-01 – 2023-03-31
|
Keywords | バンディット問題 / 分類バンディット問題 |
Outline of Annual Research Achievements |
昨年度から始めた分類バンディット問題のアルゴリズムの開発において、k-腕設定のトンプ ソンサンプリングをベースとしたアルゴリズム、および実験的な性能評価を国際学会のワークショップで発表した。更に指定した信頼度で正しく判定するためのサンプル数の理論的評価を始めた。連続腕設定に拡張した問題においては、ガウス過程を事前分布とする方式において、全腕の正負(報酬の期待値が閾値以上か未満か)を答える既存法より少ないサンプル数の上界が得られるアルゴリズムを開発した。また、正腕の割合の推定値から分類結果を予測し、その予測が正しい場合に分類の精度が上がる方の腕を引く方式を考案し、有効性を実験により確かめた。ラマン分光による細胞診断の実データにも適用し、グリット分割によるk腕設定のトンプソンサンプリングより、ガウス過程を仮定した連続腕設定の提案方式の方が少ないサンプル数(計測数)で正しく判定できることを確認した。 小ノイズ敵対的バンディットの研究においては、以前の成果である「ノイズフリーバンディット 問題」を小さなノイズを許す問題に拡張し、それに有効なアルゴリズムを開発することを目指している。ノイズフ リー条件(1回も誤らない腕が存在するという条件)を「誤る回数が高々k回の腕が存在する」という条件に緩めた問題定式化で研究を進めている。昨年度に引き続き、その問題設定 の下、腕の数が3本以上でk>2の条件でも動作するもっと一般的なアルゴリズムの開発を進めた。 精度効率保証大規模探索の研究においては、昨年度に引き続き属性選択アルゴリズム[Aurelien, Nakamura, Tabata 2019]のアルゴリズムの探索木の拡張法の検討を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
当初予定していた小ノイズ敵対的バンディットと精度効率保証大規模探索の研究より、実用性において現在必要性がより高い問題と思われる「分類バンディット」の研究を優先し時間を使ったため、予定していた研究はやや遅れているが、その代わり予定になかった分類バンディットの研究の成果が出始めている。
|
Strategy for Future Research Activity |
分類バンディットの方で成果が出始めているため、最終年度は分類バンディットを中心に研究を進める。K腕設定の場合の信頼度固定の場合のサンプル数がトンプソンサンプリングによる方法で最適であることを理論的に証明することを試みる。これに関しては、ニューヨーク大学の小宮山純平先生との共同研究により行う。連続腕設定の方も正腕割合推定法の有効性を理論的に証明することを試みる。また成果を国際学会に投稿し、発表する。分類バンディットに関しては、一度に複数の腕を選択する場合に有効な方策に関しても検討を行う。小ノイズ敵対的バンディットに関して、定式化の見直しも検討し、より一般的な場合の分析を試みる。
|
Research Products
(5 results)