研究課題/領域番号 |
19H04161
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 北海道大学 |
研究代表者 |
中村 篤祥 北海道大学, 情報科学研究院, 教授 (50344487)
|
研究分担者 |
田畑 公次 北海道大学, 電子科学研究所, 准教授 (20814445)
工藤 峰一 北海道大学, 情報科学研究院, 教授 (60205101)
|
研究期間 (年度) |
2019-04-01 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
9,750千円 (直接経費: 7,500千円、間接経費: 2,250千円)
2022年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2021年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
2020年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2019年度: 5,070千円 (直接経費: 3,900千円、間接経費: 1,170千円)
|
キーワード | バンディット問題 / オンライン学習 / バンディット / 分類バンディット問題 / 敵対的バンディット / 最適腕識別 / アルゴリズム / 大規模探索 / 敵対的バンディット問題 / 敵対的バンデット |
研究開始時の研究の概要 |
探索と知識利用のトレードオフを扱うバンディット問題は、オンライン最適化の様々な問題に応用できるポテンシャルをもっている。本研究は、バンディット問題の方策を実用化という観点から見直し、一般には情報量的または計算量的に困難だとされる問題をヒューリスティクスで解決するのではなく、現実的な制約を課して理論的に精度と効率性を保証する方策を開発することにより、バンディット問題の理論を深化させ、実用化を加速する。敵対的バンディット問題の方策およびモンテカルロ木探索を用いた大規模空間探索において、アルゴリズムの実用化のための定式化の見直しを行い、精度・効率性が理論的に保証された実用的なアルゴリズムを開発する。
|
研究成果の概要 |
敵対的バンディットと確率的バンディットの両方において、実用性からヒントを得た問題を定式化し、効率的で高性能なアルゴリズムを提案し、理論的・実験的に性能を評価した。敵対的バンディットにおいては、最適腕が損失を被らないという設定における漸近最適なアルゴリズムを開発し、確率的バンディットにおいては、報酬が閾値以上の腕が閾値個以上あるか否かを、腕を選択して報酬を得ることを繰り返すことによって判定する、分類バンディット問題を定式化し、P-Trackingという効率的で漸近最適なアルゴリズムを開発した。これらの成果に関しては、主要な査読付き国際雑誌・国際会議で発表を行った。
|
研究成果の学術的意義や社会的意義 |
バンディット問題のアルゴリズムは、昔から効率的な治験を行うために研究され、現代ではインターネット広告配信、推薦システム、A/Bテストなどに用いられている。基本的に、能動的なサンプリングを行なって効率的に情報を得る方法の研究であり、様々な応用の可能性を秘めている。開発した分類バンディットアルゴリズムは、ラマン分光によるインタラクティブ計測による病理診断の高速化にも用いいることも可能であり、今後様々な分野の応用に発展することが期待される。
|