1997 Fiscal Year Annual Research Report
Project/Area Number |
09650451
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Research Institution | Tohoku University |
Principal Investigator |
阿部 健一 東北大学, 大学院・工学研究科, 教授 (70005403)
|
Co-Investigator(Kenkyū-buntansha) |
吉澤 誠 東北大学, 大学院・工学研究科, 助教授 (60166931)
|
Keywords | 学習オートマトン / 強化学習 / 分散学習 / Q-学習 / 隠れマルコフモデル / ニューラルネットワーク |
Research Abstract |
(1)多層ネットワーク構造の分散学習アルゴリズムの開発 隠れマルコフに対処するため,上層に状況ネットワークを,その下の層に分散学習ネットワークを置く2階層構造の学習システムを考案し,現在,その有効性をシミュレーションにより検討している。 (2)「状況」は一般に多次元の実ベクトルで表されるが,この状況の無限集合を有限集合にクラス分けすることについて,いくつかの手法について検討を進めている。今年度は,とくに,リカレント・ニューラル・ネットワーク(RNN)を用いる方法について,その学習法,適切なRNN構造の探索法について基礎となる成果を得た。すなわち,その表現能力を高めるため,RNNをカオスの辺縁に保ちつつ学習を進める方法を提案し,それを認識問題に適用して本方法の有効性を確かめた。また,RNNによる連想メモリーについて検討し,その設計法を考案した。 (3)移動ロボットNOMADO(NOMADIC社製)の実験環境を整備し,ナビゲーションなどに関する基礎実験を進めた。 (4)本分散学習アルゴリズムをセンサー管理問題に適用する方法について基礎的考察を行った。また,マルチプルコントローラのスイッチ機構に本学習アルゴリズムを組み込むことを検討している。
|
Research Products
(4 results)
-
[Publications] Zhao Feng-ji: "A Mobile Robot Localization Using Ultrasonic Sensors in Indoor Environment" Proc.of International Workshop on Robot and Human Communication. 52-57 (1997)
-
[Publications] N.Honma: "An Autonomous Criterion of Learning Methods for Recurrent Neural Networks" Proc.of the 2nd Asian Control Conference. II. 219-222 (1997)
-
[Publications] 喜多川 健: "リカレントニューラルネットワークの創発的学習手法" 計測自動制御学会論文集. 33巻11号. 1093-1098 (1997)
-
[Publications] N.Honma: "A learning method for large-scale recurrent neural networks" Proc.of The 3rd International Symposium on ARTIFICIAI LIFE AND ROBOTICS. 358-361 (1998)