「心を読む」プログラムとして、相手の行動を読んで適切な行動をしなければならない問題を作成し、相手にあわせた適切な行動の獲得を強化学習の枠組みを用いて探索した。このとき、相手の行動をモデルとして取り込むために「履歴を用いたQ学習」という形での理論の整備を行った。具体的には、ゲーム理論的問題として「1・2・5じゃんけん」、「交渉問題」を取り上げ、お互いに自己の利益を追求するなかで、相手に応じて搾取戦略、協調戦略を自動的に切り替え、その時々での最適な行動を生成できることを示した。また交渉問題では、これまで経済学で追求されてきた規範解を探索するアプローチではなく、戦いの場で妥協点を見いだしていく、という解釈が可能であること、これにより現実に即した協力解を発見することが可能であることを示した。これらの成果は全国大会出発表するとともに、国際会議に投稿中である。 また、Q学習の枠組みで混合戦略を扱うための、ゲーム理論的Q学習についても、「1・2・5じゃんけん」、「4マスゲーム」を用いて最適解の意味、最適解への収束条件を解析的に、またシミュレーションを用いて調べ、最適解への収束条件にあった相手の行動に対する制約をはずしても、相手の行動に応じた最適解へ収束する手法を開発した。 一方、これらの学習理論と平行して、人がどのように「心を読んで」いるのかを研究するために、人とロボットとの対話実験を行い、視線制御の方法により人がロボットに心を帰属させる程度が変化し、それが人の対ロボットコミュニケーションの振る舞いに影響をおよぼすことを示した。これらの成果は、国内研究会、国際会議などで発表を行った。
|