2009 年度実績報告書

統計的学習に基づく強化学習に関する研究

研究課題

研究課題/領域番号	20700208
研究機関	京都大学
研究代表者	森健京都大学, 情報学研究科, 特定研究員 (00457144)
キーワード	強化学習 / 統計的学習
研究概要	多くの強化学習法では、ある状態である行動を取ることの将来的な良さを表す「価値関数」を近似する必要がある。最も広く行われている方法は、価値関数をパラメータと基底関数の内積で表現する線形関数近似を行う方法である。基底関数は設計者の試行錯誤により得られる。自動的に基底関数を構築する方法もあるが、非常に大きな計算コストが掛かる。我々は、価値関数の近似誤差を逐次的に減少させる近似法を提案しており、本年度は主にこの業績化に取り組んだ。この方法は、設計者の事前の試行錯誤を必要とせず、また、計算コストも小さくて済む。基本的なアルゴリズムを国際会議論文として業績化し、それをロバストに改良したアルゴリズムについても国際会議論文として業績化した。アルゴリズムの性質を理論面および実験面においてより深め学術論文誌へ投稿したがまだ採録に至っていない。アルゴリズム全2体の統計的な性質をクリアにすることで、さらなる業績化が可能と考えている。また、これまでに考案してきた統計的学習に基づく種々の強化学習アルゴリズムを、本科研費で購入した実機ロボットへ適用し学習を試みた。具体的には、レゴマインドストームを用いて二輪型ロボットを作製し、そのバランシングを新たな強化学習法を用いて行った。二輪型ロボットのバランシングを自動調整することは、自転車やバイクにおける個々人の運転の快適性を向上させることに貢献し、さらには事故率の低減にも繋がると考えている。

研究成果
(3件)

すべて 2009 その他

すべて学会発表 (2件) 備考 (1件)

[学会発表] Robust approximation in decomposed reinforcement learning2009
- 著者名/発表者名
  Takeshi Mori
- 学会等名
  International Conference on Neural Information Processing
- 発表場所
  Bangkok, Thailand
- 年月日
  2009-12-04
[学会発表] An additive reinforcement learning2009
- 著者名/発表者名
  Takeshi Mori
- 学会等名
  International Conference on Artificial Neural Networks
- 発表場所
  Limasol, Cyprus
- 年月日
  2009-09-14
[備考]
- URL
  http://hawaii.sys.i.kyoto-u.ac.jp/~tak-mori/