「心の理論」と心を読むアルゴリズムの解明

研究課題

研究課題/領域番号	13878063
研究種目	萌芽研究
配分区分	補助金
研究分野	知能情報学
研究機関	岐阜大学
研究代表者	伊藤昭岐阜大学, 工学部, 教授 (40302301)
研究期間 (年度)	2001 – 2003
研究課題ステータス	完了 (2003年度)
配分額 *注記	1,900千円 (直接経費: 1,900千円) 2003年度: 500千円 (直接経費: 500千円) 2002年度: 600千円 (直接経費: 600千円) 2001年度: 800千円 (直接経費: 800千円)
キーワード	心の理論 / 心を読む / 強化学習 / 履歴を用いたQ学習 / Q学習 / 共進化 / 相手モデル
研究概要	「心を読む」プログラムとして、相手の行動を読んで適切な行動をしなければならない問題を作成し、相手にあわせた適切な行動の獲得を強化学習の枠組みを用いて探索した。このとき、相手の行動をモデルとして取り込むために「履歴を用いたQ学習」という形での理論の整備を行った。具体的には、ゲーム理論的問題として「1・2・5じゃんけん」、「交渉問題」を取り上げ、お互いに自己の利益を追求するなかで、相手に応じて搾取戦略、協調戦略を自動的に切り替え、その時々での最適な行動を生成できることを示した。また交渉問題では、これまで経済学で追求されてきた規範解を探索するアプローチではなく、戦いの場で妥協点を見いだしていく、という解釈が可能であること、これにより現実に即した協力解を発見することが可能であることを示した。これらの成果は全国大会出発表するとともに、国際会議に投稿中である。また、Q学習の枠組みで混合戦略を扱うための、ゲーム理論的Q学習についても、「1・2・5じゃんけん」、「4マスゲーム」を用いて最適解の意味、最適解への収束条件を解析的に、またシミュレーションを用いて調べ、最適解への収束条件にあった相手の行動に対する制約をはずしても、相手の行動に応じた最適解へ収束する手法を開発した。一方、これらの学習理論と平行して、人がどのように「心を読んで」いるのかを研究するために、人とロボットとの対話実験を行い、視線制御の方法により人がロボットに心を帰属させる程度が変化し、それが人の対ロボットコミュニケーションの振る舞いに影響をおよぼすことを示した。これらの成果は、国内研究会、国際会議などで発表を行った。

報告書

(3件)

研究成果
(2件)

すべてその他

すべて文献書誌 (2件)

[文献書誌] A.Ito: "An Application of Episodic Q-learning to a Multi-Agent Cooperative Task"Pricai-02, Tokyo, Lecture Note in Computer Science. LNAI2417. 188-197 (2002)
- 関連する報告書
  2002 実績報告書
[文献書誌] Ito, A., Kanabuchi: "Speeding Up Multiagent Reinforcement Learning by Coarse-Graining of Perception : The Hunter Game"Electronics and Communications in Japan. 84・12. 37-45 (2001)
- 関連する報告書
  2001 実績報告書