研究概要 |
1.ゲーム理論的Q学習の理論的整備では、以下の研究を行った。a)1・2・5じゃんけんという繰り返し非零和ゲームを取り上げ、相手の過去の行動から、相手と協調して高得点を得ること、相手を搾取して一人勝ちすること、など状況に合わせた戦略を学習できる、「履歴を用いたQ学習」の整備を行った。b)零和ゲームでは、最適解が計算可能な4マスゲームを考案し、i)最適戦略を学習できるか、ii)相手の弱点をついて高得点をあげることができるか、という2点からこれまでに提案されてきた学習方法を評価するとともに、両評価について高得点をあげることのできる学習アルゴリズムを提案した。c)繰り返し非零和ゲームを人がどのように解く(良い戦略を考える)のかを調べるため、1・2・5じゃんけんを人対人、人対計算機の様々な条件で解いてもらい、その戦略、相手モデルを分析した。 2.意図を感じさせるロボットの実現では、a)これまではロボットの視覚から得られる情報を用いて、視線やうなずきなどの非言語情報の検出が可能であったが、今回は新たに人の表情を認識する機能を実現した。また、本ロボットを用いて人との対話実験を行い、対話における視線情報の重要性を確認した。これらの成果は、Ro-man2004,HCI International2005に発表、発表予定である、 3.ロボットが実世界で行動できるためには、複数のセンサー入力を統合して世界(外界)のモデルを構築する必要がある。我々はその基礎データとして、人が複数の、時には相矛盾する感覚情報をどのように統合するのかを調べるため、触覚(皮膚感覚)と、体勢感覚との実験を行い、人の持つ統合機構のモデルを調査した。
|