1996 Fiscal Year Annual Research Report

探索と学習の統合による適応型問題解決アルゴリズムの構築

Research Project

Project/Area Number	06452402
Research Institution	KYOTO UNIVERSITY
Principal Investigator	石田亨京都大学, 工学研究科, 教授 (20252489)
Co-Investigator(Kenkyū-buntansha)	西村俊和京都大学, 工学研究科, 助手 (00273483)
Keywords	実時間探索 / 強化学習
Research Abstract	平成8年度は、適応型問題解決アルゴリズムをマルチエージェントの協調問題解決に適用する。具体的には実時間探索と強化学習を出発点として以下の機能を実現した。 1.実時間探索を用いた両方向探索: まず、2つの問題解決器による実時間両方向探索アルゴリズムを考案した。実時間両方向探索では、2つの問題解決器が互いに互いを目標として移動する。この問題を通じて協調問題解決における基本的な性能的諸課題を議論を明らかにした。 2.強化学習を用いたプロトコルの獲得: 強化学習では、これまでマルコフ決定問題を対象にQ-learningなどの確率収束に基づくアルゴリズムが提案されてきた。分散プログラムのあるクラスは(例えば「哲学者の食事問題」のように)有限オートマトンで表現できるものがあり、環境の不確実性を考慮するとマルコフ決定問題で近似できる。そこで強化学習をプロトコルの学習に適用を試み、様々な実験を行った。

[Publications] Toru Ishida: "Real-Time Bidirectional Search : Coordinated Problem Solving in Uncertain Situations" IEEE Transactions on Pattern Analysis and Machine Intelligence. Vol.18,No.6. 617-628 (1996)
[Publications] Toru Ishida: "Improving the Learning Efficiencies of Realtime Search" National Conference on Artificial Intelligenc(AAAI-96). 305-310 (1996)
[Publications] 石田亨: "実時間探索による経路学習" 人工知能学会誌. Vol.11,No.2. 411-419 (1996)
[Publications] 石田亨: "エージェントを考える" 人工知能学会誌. Vol.10,No.5. 663-667 (1996)
[Publications] 石田亨: "重み付き実時間探索" 電子情報通信学会技術研究報告. AI95-43. (1996)
[Publications] 石田亨: "記憶制約下における探索のための確率的節点記憶方式" 電子情報通信学会信学技報. AI96-35. (1997)