研究課題/領域番号 |
18K17998
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分60010:情報学基礎論関連
|
研究機関 | 京都大学 (2020) 東京大学 (2018-2019) |
研究代表者 |
本多 淳也 京都大学, 情報学研究科, 准教授 (10712391)
|
研究期間 (年度) |
2018-04-01 – 2021-03-31
|
研究課題ステータス |
完了 (2020年度)
|
配分額 *注記 |
4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2020年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2019年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2018年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
|
キーワード | 機械学習 / 情報理論 / バンディット問題 |
研究成果の概要 |
本研究では,限られた試行回数で探索すべき候補を適切に選択する問題である多腕バンディット問題において,情報論的手法に基づいた効率的な方策の開発を行った.特に,従来ヒューリスティックとして多く用いられてきたトンプソン抽出とよばれる方策について,多くの複雑な設定において情報論的理論限界の観点からの性能保証を行った.さらに,累積報酬最大化ではなく期待値最大の候補の発見を目指す問題について,従来では本質的に非常に多くの試行数あるいは計算量が必要となっていた設定において,問題の困難さをそれぞれ情報論的に定量化することで現実的な試行数および計算量で実行可能な問題設定および方策の開発を行った.
|
研究成果の学術的意義や社会的意義 |
本研究の結果はトンプソン抽出の適用可能性とその限界を明らかにしたものであるが、この方策は推薦システムなど既に実社会で多く用いられているものであり、その正当性を明らかにすることはバンディット方策を安全に社会で運用することに貢献するものである.また,この分野の発展に伴いこれらの方策を治験などより社会的に繊細な問題に対して適用しようとする試みが近年あるが,これらの設定では推薦システムといった設定に比べて可能な試行回数が大幅に少ないことが障害になっている.本研究はこういった設定に対しても意味のある保証が可能な枠組みを定式化した点で,より社会の広範な設定でバンディット方策を適用可能とする意義をもつ.
|