研究領域 | 予測と意思決定の脳内計算機構の解明による人間理解と応用 |
研究課題/領域番号 |
23120004
|
研究機関 | 東京工業大学 |
研究代表者 |
杉山 将 東京工業大学, 情報理工学(系)研究科, 准教授 (90334515)
|
研究分担者 |
森本 淳 株式会社国際電気通信基礎技術研究所, 脳情報通信総合研究所, 研究員 (10505986)
|
研究期間 (年度) |
2011-07-25 – 2016-03-31
|
キーワード | 予測 / 意志決定 / 機械学習 / 特徴選択 / 強化学習 |
研究概要 |
特徴選択に関しては,H23年度に原理を考案した小~中規模な予測・意思決定問題に対する特徴選択アルゴリズムの具体的なアルゴリズム(L1-LSMI)を構築し,適切に動作することを確認した.また,大規模な予測・意思決定問題に対しては,H23年度に考案した原理を元に具体的な特徴選択アルゴリズムを構築した.そして,高次元データに対して高速に計算が可能であることを確認した. 強化学習に関しては,軌道ベースのモデル化と方策改善の枠組みを構築し,経由点到達運動課題に対する行動則の獲得を実ヒューマノイドロボットの腕部4自由度を用いて実現した.提案手法を用いることにより,数十回程度の現実的な試行回数内で,実環境において強化学習を用いた運動学習が可能であることを実験的に示した.また,標本を有効的に再利用することにより少数データに対しても優れた性能を発揮する政策勾配型の強化学習アルゴリズム開発し,その有効性をシミュレーションにより実証した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
もともと計画していた研究内容に加え,平成24年8月に強化学習技術のロボット制御に対する新たな応用の可能性が見出されたため,モデルベース,モデルフリーの強化学習法の更なる詳細な調査を実施し,より精密な理論解析と実験評価を行った.
|
今後の研究の推進方策 |
当初の計画以上に研究成果が出ているため,更に高いゴールを設定して,社会にインパクトを与えられるような成果が得られるよう全力を尽くす.
|