2004 Fiscal Year Annual Research Report
新しい進化論的計算手法「遺伝的ネットワークプログラミング」による知的制御の研究
Project/Area Number |
03J07927
|
Research Institution | Waseda University |
Principal Investigator |
間普 真吾 早稲田大学, 情報生産システム研究科, 特別研究員(DC1)
|
Keywords | 遺伝的アルゴリズム / 遺伝的プログラミング / 遺伝的ネットワークプログラミング / 進化論的計算手法 / 強化学習 / エージェント |
Research Abstract |
新しい進化論的計算手法として提案してきた「遺伝的ネットワークプログラミング(GNP)」を、実世界の問題へ適用できるようにするため、適合度、計算時間、メモリ使用量などの点から実用的なシステムを開発し、エージェントのベンチマーク問題を用いたシミュレーションによりその性能を検証した。GNP、および昨年度より研究を行っている強化学習と進化を組み合わせたGNPを従来手法(遺伝的プログラミング(GP)、進化論的プログラミング(EP))と比較することにより、GNPが効率よりよいプログラムを生成できることを確認した。 研究成果は、進化論的計算手法に関する国際会議GECCO2004、SICE Annual Conference 2004で発表を行い、国内学会では第14回インテリジェントシステムシンポジウム、第23回計測自動制御学会九州支部学術講演会で発表を行った。さらに計測自動制御学会論文誌に掲載し、現在はIEEE Transactions on Systems, Man, and Cybernetics Part B、および情報処理学会論文誌に研究成果を投稿し、査読中である。 また、従来のGNPは粗く分割された離散情報(目標物が「右」にある、等)のみを扱っていたが、本年度の後半より、連続情報(目標物が正面から右に23度ずれたところにある、等)を扱うため、アクタークリティックと呼ばれる強化学習の手法をGNPに適用している。性能の検証には、kheperaロボットのシミュレータを用い、提案手法がkheperaロボットを制御できることを確認し、ニューラルネットワークとの比較を進めている。
|