(1)ヒトの運動パターン獲得過程を実験的に明らかにし、その結果をもとに強化学習を用いた運動パターン獲得モデルを提案した。被験者を使った運動パターン獲得実験の結果は、測定軌道の接線速度の極小点位置を経由点に相当すると仮定すると、ヒトは運動パターンを少ない経由点で正確に再現するように学習することで、運動パターンを獲得していると示唆される結果が得られた。行動実験結果をもとに、運動パターンを経由点表現によって試行錯誤的に獲得する学習モデルを提案した。モデルは経由点位置の確率的推定、経由点表現からの運動軌道の再現、再現した軌道の評価を繰り返すことによって、運動パターンを再現するために適切な経由点位置を獲得可能である。本モデルによってシミュレーションを行った結果、比較的少ない学習試行数で、運動パターンを再現可能な経由点情報を獲得できることが確認できた。また、モデルによるシミュレーション結果をヒトによる行動実験結果と比較した結果、定性的傾向はほぼ一致し、モデルの妥当性が示唆されていると考えられる。今後、ヒトの計測データとの詳細な比較検討、およびロボットの模倣学習への応用が今後の課題である。 (2)運動指令と意図・意思(シンボル)との結び付け学習モデル 上記で獲得した運動パターンとシンボルとの結びつけを学習するモデルである。コミュニケーションでは、ある運動パターンを相手に示し、それに対する応答の繰り返し(学習)によって、その運動パターンのもつ意図・意思(シンボル)が獲得されるものと考え、この学習モデルの研究を実施した。強化学習アルゴリズムによって、結び付けの学習が可能であることを示し、実際にAIBOを用いた実験によって、命令(シンボル)に対応する運動パターンの獲得が可能であることを示した。
|