2012 Fiscal Year Annual Research Report
予測と意思決定のための機械学習理論の構築とその神経回路での実現
Project Area | Elucidation of neural computation for prediction and decision making: toward better human understanding and applications |
Project/Area Number |
23120004
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
杉山 将 東京工業大学, 情報理工学(系)研究科, 准教授 (90334515)
|
Co-Investigator(Kenkyū-buntansha) |
森本 淳 株式会社国際電気通信基礎技術研究所, 脳情報通信総合研究所, 研究員 (10505986)
|
Project Period (FY) |
2011-07-25 – 2016-03-31
|
Keywords | 予測 / 意志決定 / 機械学習 / 特徴選択 / 強化学習 |
Research Abstract |
特徴選択に関しては,H23年度に原理を考案した小~中規模な予測・意思決定問題に対する特徴選択アルゴリズムの具体的なアルゴリズム(L1-LSMI)を構築し,適切に動作することを確認した.また,大規模な予測・意思決定問題に対しては,H23年度に考案した原理を元に具体的な特徴選択アルゴリズムを構築した.そして,高次元データに対して高速に計算が可能であることを確認した. 強化学習に関しては,軌道ベースのモデル化と方策改善の枠組みを構築し,経由点到達運動課題に対する行動則の獲得を実ヒューマノイドロボットの腕部4自由度を用いて実現した.提案手法を用いることにより,数十回程度の現実的な試行回数内で,実環境において強化学習を用いた運動学習が可能であることを実験的に示した.また,標本を有効的に再利用することにより少数データに対しても優れた性能を発揮する政策勾配型の強化学習アルゴリズム開発し,その有効性をシミュレーションにより実証した.
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
もともと計画していた研究内容に加え,平成24年8月に強化学習技術のロボット制御に対する新たな応用の可能性が見出されたため,モデルベース,モデルフリーの強化学習法の更なる詳細な調査を実施し,より精密な理論解析と実験評価を行った.
|
Strategy for Future Research Activity |
当初の計画以上に研究成果が出ているため,更に高いゴールを設定して,社会にインパクトを与えられるような成果が得られるよう全力を尽くす.
|
-
-
-
-
-
-
-
-
[Presentation] Perfect dimensionality recovery by variational Bayesian PCA.2012
Author(s)
Nakajima, S., Tomioka, R., Sugiyama, M., & Babacan, D.
Organizer
Neural Information Processing Systems (NIPS2012),
Place of Presentation
Lake Tahoe, Nevada, USA
Year and Date
20121203-20121206
-
-
-
-
-
-
-
-