研究概要 |
2001年度は,以下について研究および発表を行った. マルチエージェント協調のための調査環境として,サッカーサーバー採用し,協調問題をサッカーエージェント間のパス協調問題として実験を進めた.協調時の暗黙の了解である共同注視点を,サッカーフィールドに於けるパスポイントと捉える.パッサーエージェントに於けるパスAction,レシーバーエージェントのパスを受けるポイントへの移動Actionを,各エージェントごとにProfit Sharing法に基づく強化学習を用いることにより学習した. パスとゴールの成功を報酬として,空間分割したサッカーフィールドに強化値を割り当てることにより,強化値の分布を獲得できる.パッサー,レシーバーそれぞれの獲得した強化値分布の交差領域を,共同注視点分布とする.獲得された注視点領域にパスすることでゴールの成功率を上げることが確認された.また,各エージェントの動作パラメータ(視野角,強化値ポテンシャル係数,報酬値)に関する共同注視点分布の特性についての評価も行った. さらに,マルチエージェント群の協同現象から導き出される戦略を共進化的に獲得する枠組みを提案を行い,集団間の合意として導き出される解の評価を進めた.本年度は,詰め将棋問題への応用を行い,3手詰問題に於ける解集団と解操作オペレータ集団を用意することにより,一方の集団の成功が他方の集団存続の機械を高めるという共生共進化により,最適解を導くことに成功した.これにより2つの集団の共同注視点すなわち暗黙の成功点である詰め将棋の解決に導くことを可能とした.
|