2022 Fiscal Year Annual Research Report
Project/Area Number |
19H04161
|
Research Institution | Hokkaido University |
Principal Investigator |
中村 篤祥 北海道大学, 情報科学研究院, 教授 (50344487)
|
Co-Investigator(Kenkyū-buntansha) |
田畑 公次 北海道大学, 電子科学研究所, 准教授 (20814445)
工藤 峰一 北海道大学, 情報科学研究院, 教授 (60205101)
|
Project Period (FY) |
2019-04-01 – 2023-03-31
|
Keywords | バンディット問題 |
Outline of Annual Research Achievements |
本年度は主に分類バンディット問題に注力した。分類バンディット問題は、K腕バンディット問題において、期待報酬が与えられた閾値以上の腕が、与えられた割合以上存在するか否かを判定する問題である。今年度は昨年度提案したアルゴリズムを改良し、Pトラッキングと呼ぶ方策を開発した。Pトラッキングは、トンプソンサンプリングを用いるのが特徴であり、腕選択の際の計算効率が良く、漸近最適な期待リグレットの達成が可能である。Pトラッキングの漸近最適性の理論保証を行い、既存法に対する実験的な優位性を示した論文を執筆し、機械学習の主要国際会議の1つであるAISTATSに投稿し受理された。一般的なK腕バンディットの判定問題に用いることができる、漸近最適なリグレットを達成するCトラッキングと呼ばれる方法があるが、強制的な探索を必要とする方法であるため、指定信頼度を達成するまでに引く腕の数が実際には多くなるという問題がある。また、漸近最適性を持つ方法でトンプソンサンプリングを用いた方法は初めてである。さらに、分類バンディット問題に特化した提案法の腕選択アルゴリズムは効率的であり、Cトラッキングの腕選択を行う際に必要な計算量よりはるかに少ないというメリットがある。分類バンディットに関してはガウス過程の事前分布を用い、腕の相関を考慮した方法の開発も昨年度に続いて行なっており、甲状腺濾胞ガンデータのラマン分光による高速診断のシミュレーション実験結果も含めて論文にまとめ、ジャーナル誌に投稿した。
|
Research Progress Status |
令和4年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
令和4年度が最終年度であるため、記入しない。
|