研究課題/領域番号 |
25730128
|
研究種目 |
若手研究(B)
|
配分区分 | 基金 |
研究分野 |
知能情報学
|
研究機関 | 東京大学 |
研究代表者 |
牧野 貴樹 東京大学, 生産技術研究所, 特任准教授 (20418651)
|
研究期間 (年度) |
2013-04-01 – 2014-03-31
|
研究課題ステータス |
中途終了 (2013年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2015年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2014年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2013年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
|
キーワード | 強化学習 / 逆強化学習 / 徒弟学習 / LUKE |
研究概要 |
初年度の課題は、環境モデル徒弟学習を抜本的に高速化する技術を開発することであった。 環境モデル徒弟学習においては、部分観測マルコフ決定過程の最適解計算を多数回実行する必要があり、計算速度が非常に遅いため、実用的な問題に適用することが不可能であり、高速化が不可欠な問題となっていた。 本研究では、2つの手法、すなわち、方策の事後確率の列勾配計算による高速化と前回の解の再利用による高速化技術を開発し、実際に実装することで高速化を実現することができた。 本研究で開発した技術は、オープンソースソフトウェア LUKE として一般に公開した。また、人工知能学会全国大会などで発表した。
|