「心の理論」と心を読むアルゴリズムの解明

Research Project

Project/Area Number	13878063
Research Category	Grant-in-Aid for Exploratory Research
Allocation Type	Single-year Grants
Research Field	Intelligent informatics
Research Institution	Gifu University
Principal Investigator	伊藤昭岐阜大学, 工学部, 教授 (40302301)
Project Period (FY)	2001 – 2003
Project Status	Completed (Fiscal Year 2003)
Budget Amount *help	¥1,900,000 (Direct Cost: ¥1,900,000) Fiscal Year 2003: ¥500,000 (Direct Cost: ¥500,000) Fiscal Year 2002: ¥600,000 (Direct Cost: ¥600,000) Fiscal Year 2001: ¥800,000 (Direct Cost: ¥800,000)
Keywords	心の理論 / 心を読む / 強化学習 / 履歴を用いたQ学習 / Q学習 / 共進化 / 相手モデル
Research Abstract	「心を読む」プログラムとして、相手の行動を読んで適切な行動をしなければならない問題を作成し、相手にあわせた適切な行動の獲得を強化学習の枠組みを用いて探索した。このとき、相手の行動をモデルとして取り込むために「履歴を用いたQ学習」という形での理論の整備を行った。具体的には、ゲーム理論的問題として「1・2・5じゃんけん」、「交渉問題」を取り上げ、お互いに自己の利益を追求するなかで、相手に応じて搾取戦略、協調戦略を自動的に切り替え、その時々での最適な行動を生成できることを示した。また交渉問題では、これまで経済学で追求されてきた規範解を探索するアプローチではなく、戦いの場で妥協点を見いだしていく、という解釈が可能であること、これにより現実に即した協力解を発見することが可能であることを示した。これらの成果は全国大会出発表するとともに、国際会議に投稿中である。また、Q学習の枠組みで混合戦略を扱うための、ゲーム理論的Q学習についても、「1・2・5じゃんけん」、「4マスゲーム」を用いて最適解の意味、最適解への収束条件を解析的に、またシミュレーションを用いて調べ、最適解への収束条件にあった相手の行動に対する制約をはずしても、相手の行動に応じた最適解へ収束する手法を開発した。一方、これらの学習理論と平行して、人がどのように「心を読んで」いるのかを研究するために、人とロボットとの対話実験を行い、視線制御の方法により人がロボットに心を帰属させる程度が変化し、それが人の対ロボットコミュニケーションの振る舞いに影響をおよぼすことを示した。これらの成果は、国内研究会、国際会議などで発表を行った。

Report

(3 results)

Research Products
(2 results)

All Other

All Publications (2 results)

[Publications] A.Ito: "An Application of Episodic Q-learning to a Multi-Agent Cooperative Task"Pricai-02, Tokyo, Lecture Note in Computer Science. LNAI2417. 188-197 (2002)
- Related Report
  2002 Annual Research Report
[Publications] Ito, A., Kanabuchi: "Speeding Up Multiagent Reinforcement Learning by Coarse-Graining of Perception : The Hunter Game"Electronics and Communications in Japan. 84・12. 37-45 (2001)
- Related Report
  2001 Annual Research Report

「心の理論」と心を読むアルゴリズムの解明

Principal Investigator

伊藤 昭 岐阜大学, 工学部, 教授 (40302301)

¥1,900,000 (Direct Cost: ¥1,900,000)

Report

Research Products

[Publications] A.Ito: "An Application of Episodic Q-learning to a Multi-Agent Cooperative Task"Pricai-02, Tokyo, Lecture Note in Computer Science. LNAI2417. 188-197 (2002)

Related Report

[Publications] Ito, A., Kanabuchi: "Speeding Up Multiagent Reinforcement Learning by Coarse-Graining of Perception : The Hunter Game"Electronics and Communications in Japan. 84・12. 37-45 (2001)

Related Report

伊藤昭岐阜大学, 工学部, 教授 (40302301)