• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

経験強化型学習XoLに関する発展的研究

研究課題

研究課題/領域番号 22500143
研究種目

基盤研究(C)

配分区分補助金
応募区分一般
研究分野 知能情報学
研究機関独立行政法人大学評価・学位授与機構

研究代表者

宮崎 和光  独立行政法人大学評価・学位授与機構, 研究開発部, 准教授 (20282866)

研究期間 (年度) 2010 – 2012
研究課題ステータス 完了 (2012年度)
配分額 *注記
3,900千円 (直接経費: 3,000千円、間接経費: 900千円)
2012年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2011年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2010年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
キーワード経験強化型学習 / 強化学習 / 報酬と罰の設計指針 / 機械学習 / 知能機械 / エージェント
研究概要

得られた経験を強く強化する機械学習手法である「経験強化型学習XoL」の発展として、「複数種類の報酬と罰を扱える手法」を完成させるとともに、応用の際に特に重要となる「報酬と罰の設計指針」の提示に成功した。具体的な応用例として、「科目の分類を支援する実システム」、「2足歩行ロボットの腰軌道学習」および「Keepawayタスクと呼ばれるサッカーを模したゲーム問題」への適用を行った。これらの成果により、伝統的な強化学習手法に対するXoLの優位性を強く主張できたと考える。

報告書

(4件)
  • 2012 実績報告書   研究成果報告書 ( PDF )
  • 2011 実績報告書
  • 2010 実績報告書
  • 研究成果

    (38件)

すべて 2013 2012 2011 2010 その他

すべて 雑誌論文 (19件) (うち査読あり 11件) 学会発表 (14件) 図書 (2件) 備考 (3件)

  • [雑誌論文] Proposal of an Exploitation-oriented Learning Method on Multiple Rewards and Penalties Environments and the Design Guideline2013

    • 著者名/発表者名
      Kazuteru Miyazaki
    • 雑誌名

      Journal of Computers

      巻: 印刷中

    • 関連する報告書
      2012 実績報告書
    • 査読あり
  • [雑誌論文] リレー解説「強化学習の最近の発展」第5回:応用志向の「試行錯誤に基づく目的指向学習」Exploitation-oriented Learning; XoL2013

    • 著者名/発表者名
      宮崎和光
    • 雑誌名

      計測と制御

      巻: Vol.52, No.5

    • 関連する報告書
      2012 実績報告書
  • [雑誌論文] マルチエージェント環境下における失敗確率伝播アルゴリズムEFPの有効性に関する研究2013

    • 著者名/発表者名
      村岡宏紀, 宮崎和光, 小林博明
    • 雑誌名

      第40回知能システムシンポジウム資料

      巻: なし ページ: 319-324

    • 関連する報告書
      2012 実績報告書
  • [雑誌論文] リレー解説強化学習の最近の発展「第5回:応用志向の試行錯誤に基づく目的指向学習」Exploitation-oriented Learning;XoL2012

    • 著者名/発表者名
      宮崎和光
    • 雑誌名

      計測と制御

      巻: Vol.52, No.5 ページ: 462-467

    • 関連する報告書
      2012 研究成果報告書
  • [雑誌論文] Introduction of Fixed Mode States into Online Reinforcement Learning with Penalty and Reward and Its Application to Waist Trajectory Generation of Biped Robot2012

    • 著者名/発表者名
      Seiya Kuroda, Kazuteru Miyazaki and Hiroaki Kobayashi
    • 雑誌名

      Journal of Advanced Computational Intelligence and Intelligent Informatics

      巻: Vol.16, No.6 ページ: 758-768

    • 関連する報告書
      2012 実績報告書 2012 研究成果報告書
    • 査読あり
  • [雑誌論文] Propocal of the Continuous-Valued Penalty Avoiding Rational Policy Making Algorithm2012

    • 著者名/発表者名
      Kazuteru Miyazaki
    • 雑誌名

      Journal of Advanced Computational Intelligence and Intelligent Informatics

      巻: Vol.16, No.2 ページ: 183-190

    • 関連する報告書
      2012 研究成果報告書
    • 査読あり
  • [雑誌論文] Proposal and Evaluation of the Active Course Classification Support System with Exploitation-oriented Learning2012

    • 著者名/発表者名
      Kazuteru Miyazaki and Masaaki Ida
    • 雑誌名

      Lecture Notes in Computer Science

      巻: Vol.7188 ページ: 333-344

    • DOI

      10.1007/978-3-642-29946-9_32

    • ISBN
      9783642299452, 9783642299469
    • 関連する報告書
      2012 実績報告書
    • 査読あり
  • [雑誌論文] Introduction of Fixed Mode States into Online Profit Sharing and Its Application to Waist Trajectory Generation of Biped Robot2012

    • 著者名/発表者名
      Seiya Kuroda, Kazuteru Miyazaki and Hiroaki Kobayashi
    • 雑誌名

      Lecture Notes in Computer Science

      巻: Vol.7188 ページ: 297-308

    • DOI

      10.1007/978-3-642-29946-9_29

    • ISBN
      9783642299452, 9783642299469
    • 関連する報告書
      2012 実績報告書
    • 査読あり
  • [雑誌論文] Proposal of an Exploitation-oriented Learning Method on Multiple Rewards and Penalties Environments2012

    • 著者名/発表者名
      Kazuteru Miyazaki
    • 雑誌名

      Proc. of the 2nd International Conference on Applied and Theoretical Information Systems Research (2nd ATIRSR)

      巻: なし

    • 関連する報告書
      2012 実績報告書
    • 査読あり
  • [雑誌論文] Proposal of an Active Course Classification Support System with Exploitation-oriented Learning Extended by Positive and Negative Examples2012

    • 著者名/発表者名
      Kazuteru Miyazaki and Masaaki Ida
    • 雑誌名

      Proc. of the 6th International Conference on Soft Computing and Intelligent Systems and the 13th International Symposium on Advanced Intelligent Systems (SCIS-ISIS 2012)

      巻: なし ページ: 1520-1527

    • 関連する報告書
      2012 実績報告書
    • 査読あり
  • [雑誌論文] 複数種類の報酬と罰に対応した経験強化型学習の提案と設計指針に関する研究2012

    • 著者名/発表者名
      宮崎和光
    • 雑誌名

      平成24年 電気学会 電子・情報・システム部門大会 講演論文集

      巻: なし ページ: 559-564

    • 関連する報告書
      2012 実績報告書
  • [雑誌論文] Proposal of the Continuous-Valued Penalty Avoiding Rational Policy Making Algorithm2012

    • 著者名/発表者名
      Miyazaki, K
    • 雑誌名

      Journal of Advanced Computational Intelligence and Intelligent Informatics

      巻: Vol.16, No.2 ページ: 183-190

    • 関連する報告書
      2011 実績報告書
    • 査読あり
  • [雑誌論文] 複数報酬環境下における意識的意思決定方法に関する研究2012

    • 著者名/発表者名
      宮崎和光
    • 雑誌名

      第39回知能システムシンポジウム資料

      ページ: 95-98

    • 関連する報告書
      2011 実績報告書
  • [雑誌論文] 正例および負例の集合を考慮した科目分類支援システムの提案と経験強化型学習との融合2011

    • 著者名/発表者名
      宮崎和光, 井田正明
    • 雑誌名

      第21回インテリジェント・システム・シンポジウム講演原稿集

    • NAID

      120005566631

    • 関連する報告書
      2011 実績報告書
  • [雑誌論文] 経験強化型学習を利用した学位授与事業のための科目分類支援システムの提案2011

    • 著者名/発表者名
      宮崎和光, 井田正明
    • 雑誌名

      第38回知能システムシンポジウム予稿集

      ページ: 123-128

    • 関連する報告書
      2010 実績報告書
  • [雑誌論文] The Penalty Avoiding Rational Policy Making algorithm in Continuous Action Spaces2010

    • 著者名/発表者名
      Miyazaki, K.
    • 雑誌名

      Proceedings of the 11th International Conference on Intelligent Data Engineering and Automated Learning

      ページ: 178-185

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [雑誌論文] Threshold Learning in the Improved Penalty Avoiding Rational Policy Making Algorithm2010

    • 著者名/発表者名
      Miyazaki, K., Kobayashi, J., Kobayashi, H.
    • 雑誌名

      Proceedings of the SICE Annual Conference 2010

      ページ: 3240-3245

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [雑誌論文] Automatic Tuning of Judgement Parameter in Continuous State Exploitation-oriented Learning2010

    • 著者名/発表者名
      Miyazaki, K.
    • 雑誌名

      Proceedings of the SICE Annual Conference 2010

      ページ: 3246-3249

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [雑誌論文] マルチエージェント連続タスクへの改良型罰回避政策形成アルゴリズムの適用とサッカーロボットを用いた実験による評価2010

    • 著者名/発表者名
      伊藤昌樹, 宮崎和光, 小林博明
    • 雑誌名

      第53回自動制御連合講演会論文集

      ページ: 4-4

    • NAID

      130005025728

    • 関連する報告書
      2010 実績報告書
  • [学会発表] Proposal of an Exploitation-oriented Learning Method on Multiple Rewards and Penalties Environments2012

    • 著者名/発表者名
      Kazuteru Miyazaki
    • 学会等名
      The 2nd International Conference on Applied and Theoretical Information Systems Research (2nd ATISR)
    • 発表場所
      圓山大販店,台湾
    • 年月日
      2012-12-29
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] 複数種類の報酬と罰に対応した経験強化型学習の提案と設計指針に関する研究2012

    • 著者名/発表者名
      宮崎和光
    • 学会等名
      平成24年度電気学会電子・情報・システム部門大会
    • 発表場所
      弘前大学
    • 年月日
      2012-09-07
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] Proposal and Evaluation of the Active Course Classification Support System with Exploitation-oriented Learning2011

    • 著者名/発表者名
      Kazuteru Miyazaki
    • 学会等名
      The 9th European Workshop on Reinforcement Learning (EWRL-9)
    • 発表場所
      Athens Royal Olympic Hotel,ギリシャ
    • 年月日
      2011-09-11
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] Proposal and Evaluation of the Active Course Classification Support System with Exploitation-oriented Learning2011

    • 著者名/発表者名
      Miyazaki, K
    • 学会等名
      The 9th European Workshop on Reinforcement Learning (EWRL-9)
    • 発表場所
      Athens Royal Olympic Hotel
    • 年月日
      2011-09-11
    • 関連する報告書
      2011 実績報告書
  • [学会発表] 正例および負例の集合を考慮した科目分類支援システムの提案と経験強化型学習との融合2011

    • 著者名/発表者名
      宮崎和光
    • 学会等名
      第21回インテリジェント・システム・シンポジウム
    • 発表場所
      神戸大学
    • 年月日
      2011-09-01
    • 関連する報告書
      2011 実績報告書
  • [学会発表] 経験強化型学習を利用した学位授与事業のための科目分類支援システムの提案2011

    • 著者名/発表者名
      宮崎和光
    • 学会等名
      第38回知能システムシンポジウム
    • 発表場所
      IS38wiki講演会(インターネット上)(大震災のため)
    • 関連する報告書
      2010 実績報告書
  • [学会発表] マルチエージェント連続タスクへの改良型罰回避政策形成アルゴリズムの適用とサッカーロボットを用いた実験による評価2010

    • 著者名/発表者名
      伊藤昌樹
    • 学会等名
      第53回自動制御連合講演会
    • 発表場所
      高知城ホール
    • 年月日
      2010-11-04
    • 関連する報告書
      2010 実績報告書
  • [学会発表] The Penalty Avoiding Rational Policy Making algorithm in Continuous Action Spaces2010

    • 著者名/発表者名
      Miyazaki, K.
    • 学会等名
      11th International Conference on Intelligent Data Engineering and Automated Learning
    • 発表場所
      University of the West of Scotland
    • 年月日
      2010-09-01
    • 関連する報告書
      2010 実績報告書
  • [学会発表] Threshold Learning in the Improved Penalty Avoiding Rational Policy Making Algorithm2010

    • 著者名/発表者名
      Miyazaki, K.
    • 学会等名
      SICE Annual Conference 2010
    • 発表場所
      Gland Hotel, Taipei, Taiwan
    • 年月日
      2010-08-21
    • 関連する報告書
      2010 実績報告書
  • [学会発表] Automatic Tuning of Judgement Parameter in Continuous State Exploitation-oriented Learning2010

    • 著者名/発表者名
      Miyazaki, K.
    • 学会等名
      SICE Annual Conference 2010
    • 発表場所
      Gland Hotel, Taipei, Taiwan
    • 年月日
      2010-08-21
    • 関連する報告書
      2010 実績報告書
  • [学会発表] Proposal of an Exploitation-oriented Learning Method on Multiple Rewards and Penalties Environments

    • 著者名/発表者名
      Kazuteru Miyazaki
    • 学会等名
      The 2nd International Conference on Applied and Theoretical Information Systems Research (2nd ATIRSR)
    • 発表場所
      圓山大飯店, 台北
    • 関連する報告書
      2012 実績報告書
  • [学会発表] Proposal of an Active Course Classification Support System with Exploitation-oriented Learning Extended by Positive and Negative Examples

    • 著者名/発表者名
      Kazuteru Miyazaki
    • 学会等名
      The 6th International Conference on Soft Computing and Intelligent Systems and the 13th International Symposium on Advanced Intelligent Systems (SCIS-ISIS 2012)
    • 発表場所
      神戸コンベンションセンター
    • 関連する報告書
      2012 実績報告書
  • [学会発表] マルチエージェント環境下における失敗確率伝播アルゴリズムEFPの有効性に関する研究

    • 著者名/発表者名
      宮崎和光
    • 学会等名
      第40回知能システムシンポジウム
    • 発表場所
      京都工芸繊維大学
    • 関連する報告書
      2012 実績報告書
  • [学会発表] 複数種類の報酬と罰に対応した経験強化型学習の提案と設計指針に関する研究

    • 著者名/発表者名
      宮崎和光
    • 学会等名
      平成24年 電気学会 電子・情報・システム部門大会
    • 発表場所
      弘前大学
    • 関連する報告書
      2012 実績報告書
  • [図書] Exploitation-oriented Learning XoL - A new approach to machine learning based on trial-and-error searches-(Chapter 15), Multi-Agent Applications with Evolutionary Computational and Biologically Inspired Technologies Intelligent Techniques for Ubiquity and Optimization, Kambayashi, Y. (Ed.)2010

    • 著者名/発表者名
      Kazuteru Miyazaki
    • 出版者
      IGI Global
    • 関連する報告書
      2012 研究成果報告書
  • [図書] Exploitation-oriented Learning XoL-A new approach to machine learning based on trial-and-error searches-(Chapter 15)(Multi-Agent Applications with Evolutionary Computational and Biologically Inspired Technologies : Intelligent Techniques for Ubiquity and Optimization)(Kambayashi, Y.(Ed.))2010

    • 著者名/発表者名
      Miyazaki, K.
    • 出版者
      IGI Global
    • 関連する報告書
      2010 実績報告書
  • [備考]

    • 関連する報告書
      2012 研究成果報告書
  • [備考]

    • URL

      http://svrrd2.niad.ac.jp/faculty/teru/xol_s.html

    • 関連する報告書
      2011 実績報告書
  • [備考]

    • URL

      http://svrrd2.niad.ac.jp/faculty/teru/xol_s.html

    • 関連する報告書
      2010 実績報告書

URL: 

公開日: 2010-08-23   更新日: 2019-07-29  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi