研究概要 |
1)「心を読む」ことが本質的な間題として、モンスターと海賊からなるダンジョンゲームを考案した。両者は、利害が一致する面、相反する面を持ち、相手の行動を考えながら最適な行動をとる必要がある。このようなエージェントを、同時に学習、進化させることでどのような現象が観測されるかを調べた。具体的には、Q学習を用いて自己の行動戦略を学習させる。この時、Q学習を修正して相手のモデルを取り込むことで、相手を上回る行動戦略をとれることを確認した。また、同じ問題を進化モデルを用いて実験し、お互いに進化をさせる「共進化」により、相手を上回る戦略を生成できることを確認した。今後は、学習と進化を併せて用いて、このように相手の行動を予測することが本質的な問題で、どのように優秀な行動戦略を獲得できるかを調べる予定である。 2)昨年度から取り組んでいるハンターゲームは、環境中に協調すべき仲間と、利害が相反する敵がいる状況で、どのように自己の行動を調整すれば良いかという問題である。我々はこれについても、味方のみが学習する場合、敵味方両方が学習する場合について、相手のモデルをQ学習でどのように取り込めば良いかを調べ味方同士では心を読むことが「相互思い込み」のような機構で実現できること、敵が存在する場合、そのような安易な機構は、敵に利用されることなどが明らかになった。 3)これらの結果は、Pricai-02 Tokyo (pp.188-197), SI2002 Kobe(D17-06)などで発表した。
|