• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

適応型参照表を用いた強化学習による制御系の構成

研究課題

研究課題/領域番号 12750184
研究種目

奨励研究(A)

配分区分補助金
研究分野 機械力学・制御
研究機関岡山大学

研究代表者

平嶋 洋一  岡山大学, 工学部, 助手 (20284086)

研究期間 (年度) 2000 – 2001
研究課題ステータス 完了 (2001年度)
配分額 *注記
1,900千円 (直接経費: 1,900千円)
2001年度: 700千円 (直接経費: 700千円)
2000年度: 1,200千円 (直接経費: 1,200千円)
キーワード強化学習 / 非線形制御 / 先験的知識 / MBL system / 汎化作用 / 倒立振子 / 振り上げ制御 / 適応型参照表
研究概要

平成13年度は適応型参照表を用いた強化学習による制御系の構成法について理論の整備と実機実験を行った.提案手法を実験装置に適用するための準備として,シミュレータを開発し,提案手法の有効性の検討を行った.また,実験を実施することによって得られたデータを基に,適応型参照表を構成するための条件の見直しと改良を行った.具体的な内容を以下に示す.
1.未知動特性を持つ非線形プラントに対して,強化学習の一実現アルゴリズムであるQ-leaningを利用した制御系を構成した.
2.制御系を構成する際,Q-learningが必要とする参照表を,汎化作用が調節できる非線形関数学習法であるMemory Based Learning system (MBL system)によって構成し,参照表の入力空間が適応的に構成できる手法を開発した.
3.制御系が持つ学習プロセスの高速化を実現するために,従来法では利用できなかった,プラントの先験的情報を強化学習アルゴリズムに取り入れる手法を開発した.
4.提案手法を実験装置に適用するために,倒立振子をプラントとした制御シミュレータを開発し,計算機シミュレーションによって制御系の有効性を検討した.
5.提案手法を倒立振子実験装置に対して適用し,振り上げ安定化制御に関して高速に学習可能であることを実証するとともに,参照表を適応構成する際の各種判定条件について改良を行った.
4.は倒立振子を制御対象として用い,提案手法を適用した場合に,プラントの振り上げ安定化が高速に学習によって実現できることを示した.同様のシミュレータに従来の参照表を用いたQ-learningを適用した場合,提案手法に対して10倍以上の学習時間を必要とした.5.についても従来法の学習時間に対して大幅に改善できることを確認した.また,プラントの先験的情報を利用しない場合には倒立安定化が実現できなかった.以上の結果をもとに,提案手法の有効性について検討を行った.

報告書

(2件)
  • 2001 実績報告書
  • 2000 実績報告書
  • 研究成果

    (3件)

すべて その他

すべて 文献書誌 (3件)

  • [文献書誌] 平嶋 洋一, 井上 昭, 石本 慎治, 元山 俊: "先験的知識を用いたQ-learningによる倒立振子振り上げ制御"第28回知能システムシンポジウム. 183-186 (2001)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] Yoichi Hirashima, Akira Inoue: "A Q-Learning System with A priori Knowledge for control"Proceedings of IASTED International Conference in Intelligent Systems and Control (ISC2001). 316-321 (2001)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] 平嶋洋一: "先験的知識を用いたQ-learningによる倒立振子振り上げ制御"第28回知能システムシンポジウム(平成13年3月29日発表予定). (2001)

    • 関連する報告書
      2000 実績報告書

URL: 

公開日: 2000-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi