• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

限定合理性を備えた深層強化学習理論の展開

研究課題

研究課題/領域番号 17H04696
研究種目

若手研究(A)

配分区分補助金
研究分野 ソフトコンピューティング
研究機関東京電機大学

研究代表者

高橋 達二  東京電機大学, 理工学部, 准教授 (00514514)

研究期間 (年度) 2017-04-01 – 2020-03-31
研究課題ステータス 完了 (2019年度)
配分額 *注記
23,660千円 (直接経費: 18,200千円、間接経費: 5,460千円)
2019年度: 6,630千円 (直接経費: 5,100千円、間接経費: 1,530千円)
2018年度: 6,370千円 (直接経費: 4,900千円、間接経費: 1,470千円)
2017年度: 10,660千円 (直接経費: 8,200千円、間接経費: 2,460千円)
キーワード限定合理性 / 強化学習 / 満足化 / 社会学習 / 弱教示的学習 / 判定問題 / 仮説検証 / 試行錯誤 / 動機付け / 教示的フィードバック / 評価的フィードバック / 対抗模倣 / 競争 / 満足化原理 / 半教示的フィードバック / メタ情報 / 模倣学習 / エミュレーション / 教示フィードバック / 評価フィードバック / 社会的満足化 / プロスペクト理論 / 社会的学習 / 意志決定 / 因果推論 / 機械学習
研究成果の概要

実世界で活動する人間、動物、ロボットは、知覚の能力・情報処理の速度と容量・行動の効果、の三点それぞれにおいて制約のある状況で、各々のゴールの達成を目指して合理的(限定合理的)に学習・行動を行う。本研究はそれが「最適化」の代替案としての「満足化」という探索・意思決定の方策により可能になっていると仮定し、満足化に新しい実装を与え、工学的に有用なアルゴリズムとして世界で初めて確立するとともに、その性質について数学的に明らかにした。またそのアルゴリズムを、強化学習の分野において様々なタスクに適用し、最も基本的なバンディット問題や、一般的な強化学習タスクにおいてその有効性を示した。

研究成果の学術的意義や社会的意義

人間や動物の扱う、試行錯誤を伴う自律的な学習のロジックの重要な一端を明らかにした。特に、なぜ人間や動物が競争と「対抗模倣」により効率的なパフォーマンスの向上を見せるのかについて機械論的な説明を与えた。さらに、数学的に効率性を証明するとともに、様々な状況で効率性を示した。また、資本主義や市場の観点から、競争や対抗模倣の効率性と、表裏一体であるその危険性についても論じた。

報告書

(4件)
  • 2019 実績報告書   研究成果報告書 ( PDF )
  • 2018 実績報告書
  • 2017 実績報告書
  • 研究成果

    (16件)

すべて 2020 2019 2018 2017 その他

すべて 国際共同研究 (4件) 雑誌論文 (4件) (うち国際共著 2件、 査読あり 4件、 オープンアクセス 3件) 学会発表 (8件) (うち国際学会 2件)

  • [国際共同研究] ダーラム大学(英国)

    • 関連する報告書
      2018 実績報告書
  • [国際共同研究] パリ第8大学/高等研究実習院(EPHE)(フランス)

    • 関連する報告書
      2018 実績報告書
  • [国際共同研究] パリ第8大学/高等師範学校/高等研究実習院(フランス)

    • 関連する報告書
      2017 実績報告書
  • [国際共同研究] ダーラム大学(英国)

    • 関連する報告書
      2017 実績報告書
  • [雑誌論文] Extended Bayesian inference incorporating symmetry bias2020

    • 著者名/発表者名
      Shinohara Shuji、Manome Nobuhito、Suzuki Kouta、Chung Ung-il、Takahashi Tatsuji、Gunji Pegio-Yukio、Nakajima Yoshihiro、Mitsuyoshi Shunji
    • 雑誌名

      Biosystems

      巻: 190 ページ: 104104-104104

    • DOI

      10.1016/j.biosystems.2020.104104

    • 関連する報告書
      2019 実績報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Flexibility of Emulation Learning from Pioneers in Nonstationary Environments2020

    • 著者名/発表者名
      Shinriki Moto、Wakabayashi Hiroaki、Kono Yu、Takahashi Tatsuji
    • 雑誌名

      Advances in Artificial Intelligence.

      巻: 1128 ページ: 90-101

    • DOI

      10.1007/978-3-030-39878-1_9

    • NAID

      130007658419

    • ISBN
      9783030398774, 9783030398781
    • 関連する報告書
      2019 実績報告書
    • 査読あり
  • [雑誌論文] Guaranteed satisficing and finite regret: Analysis of a cognitive satisficing value function2019

    • 著者名/発表者名
      Tamatsukuri Akihiro、Takahashi Tatsuji
    • 雑誌名

      Biosystems

      巻: 180 ページ: 46-53

    • DOI

      10.1016/j.biosystems.2019.02.009

    • 関連する報告書
      2019 実績報告書 2018 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] The Psychology of Uncertainty and Three-Valued Truth Tables2018

    • 著者名/発表者名
      Baratgin Jean、Politzer Guy、Over David E.、Takahashi Tatsuji
    • 雑誌名

      Frontiers in Psychology

      巻: 9 ページ: 1479-1479

    • DOI

      10.3389/fpsyg.2018.01479

    • 関連する報告書
      2018 実績報告書
    • 査読あり / オープンアクセス / 国際共著
  • [学会発表] 満足化原理の強化学習全般への適用に向けて2018

    • 著者名/発表者名
      佐鳥 玖仁朗, 吉田 豊, 山岸 健太, 牛田 有哉, 神谷 匠, 高橋 達二
    • 学会等名
      2018年度人工知能学会全国大会 (第32回) (JSAI 2018)
    • 関連する報告書
      2017 実績報告書
  • [学会発表] 認知的満足化価値関数の分析2018

    • 著者名/発表者名
      玉造 晃弘, 高橋 達二
    • 学会等名
      2018年度人工知能学会全国大会 (第32回) (JSAI 2018)
    • 関連する報告書
      2017 実績報告書
  • [学会発表] 満足化を通じた最適な自律的探索2018

    • 著者名/発表者名
      甲野 佑, 高橋 達二
    • 学会等名
      2018年度人工知能学会全国大会 (第32回) (JSAI 2018)
    • 関連する報告書
      2017 実績報告書
  • [学会発表] 満足化基準値共有を用いた社会的強化学習2018

    • 著者名/発表者名
      其田 憲明, 神谷 匠, 甲野 佑, 高橋 達二
    • 学会等名
      2018年度人工知能学会全国大会 (第32回) (JSAI 2018)
    • 関連する報告書
      2017 実績報告書
  • [学会発表] Are word learning biases based on symmetry in cognition?2018

    • 著者名/発表者名
      Kamiya, T., Takahashi, T.
    • 学会等名
      The Twenty-Third International Symposium on Artificial Life and Robotics 2018 (AROB 23rd 2018)
    • 関連する報告書
      2017 実績報告書
    • 国際学会
  • [学会発表] Causal induction under rarity and small data2018

    • 著者名/発表者名
      Yokokawa, J., Oyo, K., Takahashi, T.
    • 学会等名
      The Twenty-Third International Symposium on Artificial Life and Robotics 2018 (AROB 23rd 2018)
    • 関連する報告書
      2017 実績報告書
    • 国際学会
  • [学会発表] 稀少性仮定の下での非独立性の判断としての人間の観察的因果推論2017

    • 著者名/発表者名
      高橋 達二, 大用 庫智, 玉造 晃弘, 横川 純貴
    • 学会等名
      2017年度人工知能学会全国大会 (第31回) (JSAI 2017)
    • 関連する報告書
      2017 実績報告書
  • [学会発表] 生存を目的とする満足化強化学習2017

    • 著者名/発表者名
      牛田 有哉, 甲野 佑, 高橋 達二
    • 学会等名
      2017年度人工知能学会全国大会 (第31回) (JSAI 2017)
    • 関連する報告書
      2017 実績報告書

URL: 

公開日: 2017-04-28   更新日: 2022-06-14  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi