研究概要 |
前年度に予備的な検討と試験実装を進めてきた「自己監視エージェント」の本格実装を進めた.自己監視エージェントは,エージェントの不適切な行動を発見すると,応急措置をメインエージェント(従来のエージェントプログラム)に割り込み指示すると同時に,それらに関するログ等をエージェント開発者に通知する.この方法は一般的な学習を用いるより実践向けかつ実時間的であり,エージェント開発者による可制御性が高い. 自己監視エージェントは,メインエージェントが持っている環境の知識,すなわちワールドモデル(RoboCupサッカーでは,ボールの位置や速度,選手の位置,速度,能力,スタミナなどの情報,得点や残り時間など試合の全般的な状況),発行した行動コマンドとそれを発行するに至った主な経緯の履歴を収集し,それらをもとに知識,行動,目的の評価を行なう. 準備段階の試験実装ではメインエージェントと自己監視エージェントの独立性が低く,今後の研究展開のための汎用性に欠けていたため,今年度はこれをRoboCupサッカー以外の一般的な内省エージェントにも使えるように徹底的なリファクタリングを行ない,汎用性の高いライブラリとして構築しなおした.特に,RoboCupでは毎年ルールやパラメータが変更されることから,それらに対応するためのクラスを独立させて,プログラムの高い保守性と拡張性を実現した. これらの開発に時間がかかったため,RoboCupサッカー固有の戦術チューニングは追求できなかったが,RoboCupサッカー3D(三次元版シミュレーション)のエージェントに対して,このライブラリを使った簡単な動作検証を行なった.実装が簡単すぎたため,大きな効果は得られなかったが,少なくとも3Dチームの開発におけるデバッグに対しては,手間の削減に大いに役立った. このほかにも,3Dシミュレーションのためのビジュアルデバッガ(SoccerScope3D)を開発し,ネット上で公開した.なお,初年度なので,論文発表等はない.
|