2007 Fiscal Year Annual Research Report
Project/Area Number |
19760299
|
Research Institution | 鹿島建設株式会社 研究・技術開発本部技術研究所 |
Principal Investigator |
浜本 研一 鹿島建設株式会社 研究・技術開発本部技術研究所, 先端・メカトロニクスグループ, 主任研究員 (70416717)
|
Keywords | 制御理論 / 反復学習制御 / 強化学習 / 軌道追従 / 補償器選択 / 台車系 |
Research Abstract |
本年度は下記の問題について検討を行った。アクチュエータを有する能動台車の軌道追従制御において,目標軌道の経路上,未知の位置に置かれているアクチュエータを持たない受動台車と結合して動作する場合を考える。ここで能動台車の目標軌道は事前に与えられ,受動台車の目標軌道は予め与えられた運動学モデルから算出可能であるとする。ただし,どの時点で結合するかは未知であるので,モデル構造の変動時点を事前に知ることはできない。このときにどちらの状態においても与えられた軌道をより追従するための補償器選択手法の検討を行う。 この問題に対して,台車系の軌道追従と対象の物理パラメータを同定するために申請者が過去に行ったリンク系に対する反復学習制御(ILC)法を用いた。台車系の運動方程式は,リンク系同様,入力uには物理パラメータαに対して線形性があるため,u=f(q,dq/dt, d^2q/dt^2)αと表せる(ここでqはシステムの状態変数である)。次に考えられ得る補償器構造の集合Fを上式に基づいて,F={f_1,f_2,…,f_n}のように与えておき,その中から適当な補償器構造を強化学習により選択する手法を検討した。同時にそれぞれの補償器構造と対応する物理パラメータα_i(i=1,…,n)はILC法を用いて調整を行った。本研究では強化学習で用いる報酬として,各補償器を使用したときの追従誤差及び試行の反復回数を利用すること検討し,数値シミュレーションにより有効性を確認した。
|