研究課題/領域番号 |
18K18099
|
研究機関 | 北海道大学 |
研究代表者 |
田畑 公次 北海道大学, 化学反応創成研究拠点, 特任助教 (20814445)
|
研究期間 (年度) |
2018-04-01 – 2022-03-31
|
キーワード | 機械学習 / 多腕バンディット / 良腕識別 |
研究実績の概要 |
本研究では,複数の選択肢の中から一つ選択する度に,その選択肢に対応した報酬に対する不完全なフィードバックが得られるというシステムにおいて,できるだけ少ない回数のサンプリングで与えられた閾値よりも大きな報酬を持った選択肢(良腕)が存在するかどうかを判定したり,あるいは良腕を識別したりする問題を解くためのアルゴリズムの開発を行う. 本研究では,各選択肢から得られる報酬の分布が独立同分布に従うという仮定を置き,また任意に与えられた失敗確率のもとで正しく答えを出力する固定信頼度設定で考える. 問題設定から導かれる任意のアルゴリズムが最低限必要とするサンプル複雑性の下界に関する解析や,提案アルゴリズムに関する理論的な解析,実験による他手法との比較を行うことでアルゴリズムの有効性を検証する. 2019年度は良腕が存在するかどうかをできるだけ少ない回数のサンプリングで確認する問題を解くための手法を提案し,問題を解くために必要な平均サンプル数の下界や提案手法のサンプル複雑性の上界に対して理論的な評価や,人工データや実データを用いたシミュレーション実験により他の手法との比較実験を行い,提案手法の有効性を評価した.その研究結果はJournal of Machine Learning Researchに掲載されている. また,良腕が存在するかどうかではなく,指定した個数以上存在するかどうかという問題へと拡張を行い,理論的な評価と数値実験の結果を論文にまとめ,現在投稿中である.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
2019年度は,アルゴリズムによらない良腕の存在をチェックする問題のサンプル複雑性の下界に関する理論解析や提案アルゴリズムの平均停止時刻の上界に関する理論解析を行った.また,シミュレーション実験による他手法との比較により提案手法が有効性であることを確認した. さらに,良腕が指定した個数以上存在するかどうかという問題(分類バンディット)へと拡張を行い,理論的な評価と数値実験の結果をまとめ,論文を投稿し,現在査読中である. また,病理診断への応用として実データに基づいた実験に関してまとめており,論文を投稿する予定である.
|
今後の研究の推進方策 |
2020年度は,現在の分類バンディットに対する提案手法の理論評価は,まだ部分的にしかできていないので,さらに理論解析を進めていく予定である. また,複数の候補を一度に選択できるようにした拡張した問題に対するアルゴリズムの解析に関しても行っていく予定である.
|
次年度使用額が生じた理由 |
参加予定の研究会への参加を見送ったため今年度の支出が少なくなった. 次年度には参加できなかった研究会へ参加したいと考えている.
|