[文献書誌] 宮崎和光: "罰を回避する合理的政策の学習"人工知能学会誌. 16・2. 148-156 (2001)
[文献書誌] Kazuteru Miyazaki: "Reinforcement Learning for Penalty Avoiding Policy Making and its Extensions and an Applications to the Othello Game"Proceedings of the 7th International Conference on Information Systems Analysis and Cynthesis. III. 40-44 (2001)
[文献書誌] Kazuteru Miyazaki: "Reinforcement Learning in 2-players Games"Proceedings of the 7th International Symposium on Artificial Life and Robotics. 183-186 (2002)
[文献書誌] 宮崎和光: "罰回避政策形成アルゴリズムの改良とオセロゲームへの応用"人工知能学会誌. 17・5. 548-556 (2002)
[文献書誌] Kazuteru Miyazaki: "Reinforcement Learning for Penalty Avoiding Profit Sharing and its Application to the Soccer Game"ICONIP' 02-SEAL' 02-FSKD' 02. 335-339 (2002)
[文献書誌] 宮崎和光: "罰を回避するProfit Sharingの提案"第45回自動制御連合講演会. 167-170 (2002)
[文献書誌] 寺田賢: "マルチエージェント強化学習によるサッカーゲームにおける協調行動の学習"第45回自動制御連合講演会. 441-442 (2002)
[文献書誌] Kazuteru Miyazaki: "Comparison with Profit Sharing and Random Selection in POMDPs"Joint 1st International Conference on Soft Computing and Intelligent Systems. (CD-ROM(全5ページ)). (2002)
[文献書誌] 宮崎和光: "POMDPs環境におけるProfit Sharingとランダム選択の理論的比較"計測自動制御学会 システム・情報部門学術講演会. (CD-ROM(全6ページ)). (2002)