1997 Fiscal Year Annual Research Report

非マルコフ環境における分散学習に関する研究

Research Project

Project/Area Number	09650451
Research Category	Grant-in-Aid for Scientific Research (C)
Research Institution	Tohoku University
Principal Investigator	阿部健一東北大学, 大学院・工学研究科, 教授 (70005403)
Co-Investigator(Kenkyū-buntansha)	吉澤誠東北大学, 大学院・工学研究科, 助教授 (60166931)
Keywords	学習オートマトン / 強化学習 / 分散学習 / Q-学習 / 隠れマルコフモデル / ニューラルネットワーク
Research Abstract	(1)多層ネットワーク構造の分散学習アルゴリズムの開発隠れマルコフに対処するため,上層に状況ネットワークを,その下の層に分散学習ネットワークを置く2階層構造の学習システムを考案し,現在,その有効性をシミュレーションにより検討している。 (2)「状況」は一般に多次元の実ベクトルで表されるが,この状況の無限集合を有限集合にクラス分けすることについて,いくつかの手法について検討を進めている。今年度は,とくに,リカレント・ニューラル・ネットワーク(RNN)を用いる方法について,その学習法,適切なRNN構造の探索法について基礎となる成果を得た。すなわち,その表現能力を高めるため,RNNをカオスの辺縁に保ちつつ学習を進める方法を提案し,それを認識問題に適用して本方法の有効性を確かめた。また,RNNによる連想メモリーについて検討し,その設計法を考案した。 (3)移動ロボットNOMADO(NOMADIC社製)の実験環境を整備し,ナビゲーションなどに関する基礎実験を進めた。 (4)本分散学習アルゴリズムをセンサー管理問題に適用する方法について基礎的考察を行った。また,マルチプルコントローラのスイッチ機構に本学習アルゴリズムを組み込むことを検討している。

Research Products
(4 results)

All Other

All Publications (4 results)

[Publications] Zhao Feng-ji: "A Mobile Robot Localization Using Ultrasonic Sensors in Indoor Environment" Proc.of International Workshop on Robot and Human Communication. 52-57 (1997)
[Publications] N.Honma: "An Autonomous Criterion of Learning Methods for Recurrent Neural Networks" Proc.of the 2nd Asian Control Conference. II. 219-222 (1997)
[Publications] 喜多川健: "リカレントニューラルネットワークの創発的学習手法" 計測自動制御学会論文集. 33巻11号. 1093-1098 (1997)
[Publications] N.Honma: "A learning method for large-scale recurrent neural networks" Proc.of The 3rd International Symposium on ARTIFICIAI LIFE AND ROBOTICS. 358-361 (1998)

1997 Fiscal Year Annual Research Report

非マルコフ環境における分散学習に関する研究

Principal Investigator

阿部 健一 東北大学, 大学院・工学研究科, 教授 (70005403)

Research Products

[Publications] Zhao Feng-ji: "A Mobile Robot Localization Using Ultrasonic Sensors in Indoor Environment" Proc.of International Workshop on Robot and Human Communication. 52-57 (1997)

[Publications] N.Honma: "An Autonomous Criterion of Learning Methods for Recurrent Neural Networks" Proc.of the 2nd Asian Control Conference. II. 219-222 (1997)

[Publications] 喜多川 健: "リカレントニューラルネットワークの創発的学習手法" 計測自動制御学会論文集. 33巻11号. 1093-1098 (1997)

[Publications] N.Honma: "A learning method for large-scale recurrent neural networks" Proc.of The 3rd International Symposium on ARTIFICIAI LIFE AND ROBOTICS. 358-361 (1998)

阿部健一東北大学, 大学院・工学研究科, 教授 (70005403)

[Publications] 喜多川健: "リカレントニューラルネットワークの創発的学習手法" 計測自動制御学会論文集. 33巻11号. 1093-1098 (1997)