• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

熟練者のスキルを超越するアンサンブル逆強化学習の提案

研究課題

研究課題/領域番号 16K12485
研究種目

挑戦的萌芽研究

配分区分基金
研究分野 知能情報学
研究機関横浜国立大学

研究代表者

濱上 知樹  横浜国立大学, 大学院工学研究院, 教授 (30334204)

研究期間 (年度) 2016-04-01 – 2018-03-31
研究課題ステータス 完了 (2017年度)
配分額 *注記
3,510千円 (直接経費: 2,700千円、間接経費: 810千円)
2017年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
2016年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
キーワード逆強化学習 / 強化学習 / アンサンブル学習 / 不完全知覚 / ブースティング / 機械学習 / 知能情報処理
研究成果の概要

アンサンブル学習の一種であるAdaboostアルゴリズムを逆強化学習に応用し,複数の報酬関数を統合するシステムを構築した。目的のタスクを達成可能な方策を持つエージェント(サブエキスパート)を複数利用することで,よりタスクの学習に適した報酬関数を獲得するアンサンブル逆強化学習を開発した。複数のサブエキスパートから推定した報酬関数の統合により,それぞれの報酬関数に含まれる不完全知覚の影響緩和を狙いとして適切な報酬配分へのが可能になった。不完全知覚状態を含む環境における実験を行い,アンサンブル逆強化学習によってよりタスクの学習に適した報酬関数を獲得できること確認し,本提案システムの有効性を示した。

報告書

(3件)
  • 2017 実績報告書   研究成果報告書 ( PDF )
  • 2016 実施状況報告書
  • 研究成果

    (8件)

すべて 2017 2016

すべて 雑誌論文 (3件) (うち査読あり 3件) 学会発表 (5件) (うち国際学会 2件)

  • [雑誌論文] An Analysis of Rule Deletion Scheme in XCS on Reinforcement Learning Problem2017

    • 著者名/発表者名
      Masaya Nakata, Tomoki Hamagami
    • 雑誌名

      Journal of Advanced Computational Intelligence and Intelligent Informatics

      巻: 21 号: 5 ページ: 876-884

    • DOI

      10.20965/jaciii.2017.p0876

    • NAID

      130007520184

    • ISSN
      1343-0130, 1883-8014
    • 年月日
      2017-09-20
    • 関連する報告書
      2017 実績報告書
    • 査読あり
  • [雑誌論文] 準エキスパート集団からのアンサンブル逆強化学習2017

    • 著者名/発表者名
      冨田真司,濱津文哉,濱上知樹
    • 雑誌名

      電気学会論文誌C(電子・情報・システム部門誌)

      巻: 137 号: 4 ページ: 667-673

    • DOI

      10.1541/ieejeiss.137.667

    • NAID

      130005530130

    • ISSN
      0385-4221, 1348-8155
    • 関連する報告書
      2017 実績報告書 2016 実施状況報告書
    • 査読あり
  • [雑誌論文] Revisit of Rule-Deletion Strategy for XCSAM Classifier System on Classification2017

    • 著者名/発表者名
      Masaya Nakata, Tomoki Hamagami
    • 雑誌名

      システム制御情報学会論文誌

      巻: 30 号: 7 ページ: 273-285

    • DOI

      10.5687/iscie.30.273

    • NAID

      130006890010

    • ISSN
      1342-5668, 2185-811X
    • 関連する報告書
      2017 実績報告書
    • 査読あり
  • [学会発表] パラメータ共有型マル チモーダル深層自己符号化器を用いた部分観測下多様体学習の検討2017

    • 著者名/発表者名
      佐々木勇人, 中田雅也, 濱津文哉, 濱上知樹
    • 学会等名
      第79 回情報処理学会全国大会
    • 発表場所
      名古屋
    • 年月日
      2017-03-16
    • 関連する報告書
      2016 実施状況報告書
  • [学会発表] 転移学習によるDeep Q-Networkの学習高速化に向けた検討2017

    • 著者名/発表者名
      足立一樹, 佐々木勇人, 中田雅也, 濱津文哉, 濱上知樹
    • 学会等名
      第79 回情報処理学会全国大会
    • 発表場所
      名古屋
    • 年月日
      2017-03-16
    • 関連する報告書
      2016 実施状況報告書
  • [学会発表] Effect of Parameter Sharing for Multimodal Deep Autoencoders2017

    • 著者名/発表者名
      Hayato Sasaki, Masaya Nakata, Fumiya Hamatsu, Tomoki Hamagami
    • 学会等名
      Proc. of IEEE SMC2017
    • 関連する報告書
      2017 実績報告書
    • 国際学会
  • [学会発表] マルチモーダル深層自己 符号化器におけるモダリティ間パラメータ共有の検討2016

    • 著者名/発表者名
      佐々木勇人, 中田雅也, 濱津文哉, 濱上知樹
    • 学会等名
      第10 回コンピュー テーショナル・インテリジェンス研究会
    • 発表場所
      富山
    • 年月日
      2016-12-16
    • 関連する報告書
      2016 実施状況報告書
  • [学会発表] Construction of visual codebook for speeding up visual-based Simultaneous Localization and Mapping2016

    • 著者名/発表者名
      Hayato Sasaki, Fumiya Hamatsu, Tomoki Hamagami
    • 学会等名
      The International Conference on  Electrical Engineering (ICEE)2016
    • 発表場所
      沖縄
    • 年月日
      2016-07-03
    • 関連する報告書
      2016 実施状況報告書
    • 国際学会

URL: 

公開日: 2016-04-21   更新日: 2019-03-29  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi