研究課題/領域番号 |
19H04161
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 北海道大学 |
研究代表者 |
中村 篤祥 北海道大学, 情報科学研究院, 教授 (50344487)
|
研究分担者 |
田畑 公次 北海道大学, 電子科学研究所, 准教授 (20814445)
工藤 峰一 北海道大学, 情報科学研究院, 教授 (60205101)
|
研究期間 (年度) |
2019-04-01 – 2023-03-31
|
キーワード | バンディット問題 / オンライン学習 |
研究成果の概要 |
敵対的バンディットと確率的バンディットの両方において、実用性からヒントを得た問題を定式化し、効率的で高性能なアルゴリズムを提案し、理論的・実験的に性能を評価した。敵対的バンディットにおいては、最適腕が損失を被らないという設定における漸近最適なアルゴリズムを開発し、確率的バンディットにおいては、報酬が閾値以上の腕が閾値個以上あるか否かを、腕を選択して報酬を得ることを繰り返すことによって判定する、分類バンディット問題を定式化し、P-Trackingという効率的で漸近最適なアルゴリズムを開発した。これらの成果に関しては、主要な査読付き国際雑誌・国際会議で発表を行った。
|
自由記述の分野 |
機械学習、データマイニング
|
研究成果の学術的意義や社会的意義 |
バンディット問題のアルゴリズムは、昔から効率的な治験を行うために研究され、現代ではインターネット広告配信、推薦システム、A/Bテストなどに用いられている。基本的に、能動的なサンプリングを行なって効率的に情報を得る方法の研究であり、様々な応用の可能性を秘めている。開発した分類バンディットアルゴリズムは、ラマン分光によるインタラクティブ計測による病理診断の高速化にも用いいることも可能であり、今後様々な分野の応用に発展することが期待される。
|