研究課題
若手研究(B)
強化学習における環境の探索と帰納的再構成を、ベイズ推論手法に基づいて再構築する研究を行った。強化学習においては、エージェントは試行錯誤しながら環境モデルを学習するが、ベイズ理論に基づいた適切な環境モデルがあれば、不確実性を表現することで最適な探索が実現できるはずである。この目的のために、本研究では、TD-Network と呼ばれる予測的状態表現に基づく環境記述手法について、学習能力を高める提案を行った。また、隠れマルコフモデルのノンパラメトリックベイズモデルを拡張し、隠れ状態の階層的クラスタリングを実現する方法を提案した。さらに、徒弟学習の枠組みを応用し、他者の行動から環境についてのモデルをベイズ推定に基づいて構築する手法を提案した。これらは環境を探索しながら再構成してゆくプロセスのベイズ的再構成に必要となる要素技術である。
すべて 2012 2011 2010 2009 2008 その他
すべて 雑誌論文 (13件) (うち査読あり 9件) 学会発表 (17件) 図書 (2件) 備考 (1件)
To be appeared in ICML '12: Proceedings of the 29th Annual international conference on machine learning
110009545975
信学技報
巻: Vol.111, No.480 ページ: 49-54
電子情報通信学会技術報告(IBISML2011-94)
巻: 111(480) ページ: 49-54
人工知能学会誌
巻: Vol.26, No.3 ページ: 301-303
110008662160
生産研究
巻: Vol.62, No.3 ページ: 259-265
130000342806
電子情報通信学会技術研究報告IBISML2010-14
巻: 110(76) ページ: 87-94
110008096185
Neuroendocrinology Letters
巻: Vol.30, No.2 ページ: 185-191
130004959898
In Leon Bottou and Michael Littman, editors, ICML '09 : Proceedings of the 26th Annual international conference on machine learning
巻: vol.26 ページ: 697-704
Proceedings of the 26th Annual international conference on machine learning 26
ページ: 697-704
自己組織化ハンドブック(NTS出版)
ページ: 438-443
Proceedings of the 26th International Conference of Machine Learning (ICML 2009) (印刷中)(掲載確定)
In Andrew McCallum and Sam Roweis, editors, ICML '08 : Proceedings of the 25th Annual International Conference on Machine Learning
巻: vol.25 ページ: 632-639
Proceedings of the 25th International Conference of Machine Learning (ICML 2008)
ページ: 632-639
http://www.sat.t.u-tokyo.ac.jp/~mak/