学習制御のロバスト性における忘却ファクタ-の役割の解明
Project/Area Number |
02255204
|
Research Category |
Grant-in-Aid for Scientific Research on Priority Areas
|
Allocation Type | Single-year Grants |
Research Institution | The University of Tokyo |
Principal Investigator |
有本 卓 東京大学, 工学部・計数工学科, 教授 (00029399)
|
Co-Investigator(Kenkyū-buntansha) |
鈴木 寿 東京大学, 工学部・計数工学科, 講師 (10206518)
|
Project Period (FY) |
1990
|
Project Status |
Completed (Fiscal Year 1990)
|
Budget Amount *help |
¥1,800,000 (Direct Cost: ¥1,800,000)
Fiscal Year 1990: ¥1,800,000 (Direct Cost: ¥1,800,000)
|
Keywords | マニピュレ-タ / ロボットア-ム / 学習制御 / 忘却係数 / 長期記憶 / 短期記憶 / ロバスト性 / 受動性 |
Research Abstract |
本研究では、ロボットの運動に少しのゆらぎや、運動初期化の誤差,および測定誤差を許したとき、制御入力が繰返し学習によって理想の入力の近傍の収束していくための力学的メカニズムを明らかにした。すなわち、測定値として各関節の速度を用い、学習則に微分を取らないP型学習制御について考察するとき、忘却ファクタ-の導入によって、学習のロバスト性と収束性が成立することを理論的かつ実験的に明らかにした。また、数回から十数回の繰返し練習を1セットとするインタ-バル練習法を提案した。この方法では、各セット終了後、長期記憶に貯えた制御入力を短期記憶のそれで更新することにより、学習の速度が著しく加速されることをシミュレ-ションと実験によって確認した。また、誤差ベクトルに関するある2乗誤差積分(誤差のエネルギ-量に相当)の意味で最適である制御入力をテンポラリ-メモリ-に常に貯え、各セットの終了後に、長期入力をこの最適入力で更新する方法を提案し、これを選択的学習制御法と名づけた。そして、この方法により、学習制御の収束性を理論的に証明した。これは、人間の場合にエネルギ-レセプタ-の存在を仮定することに対応しており、こうして、テンポラリ-と短期および長期の三種の異るメモリ-と忘却因子の果す役割が理論的に解明された。また、ロバスト性や収束性の証明にはロボットのダイナミクスの受動性と誤差ダイナミクスに関する指数関数的受動動性が本質的に効いていることが示された。人間の場合にも、力学系にこのような受動性が想定できるなら、運動の学習の本質には受動性が重要な働きをしていることが示唆される。
|
Report
(1 results)
Research Products
(5 results)