• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

プロトタイプ理論に基づく強化学習ロボットの知識選択における認知的経済性の向上

研究課題

研究課題/領域番号 19K12173
研究種目

基盤研究(C)

配分区分基金
応募区分一般
審査区分 小区分61050:知能ロボティクス関連
研究機関東京電機大学

研究代表者

鈴木 剛  東京電機大学, 工学部, 教授 (00349789)

研究分担者 藤井 浩光  千葉工業大学, 先進工学部, 准教授 (30781215)
温 文  東京大学, 大学院工学系研究科(工学部), 特任准教授 (50646601)
河野 仁  東京工芸大学, 工学部, 准教授 (70758367)
研究期間 (年度) 2019-04-01 – 2022-03-31
研究課題ステータス 完了 (2021年度)
配分額 *注記
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2021年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2020年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2019年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
キーワード転移学習 / 認知心理学モデル / プロトタイプ理論 / 機械学習 / 強化学習 / マルチエージェントロボットシステム / マルチエージェント強化学習 / マルチロボット強化学習 / 認知的経済性
研究開始時の研究の概要

本研究課題では,転移学習を用いた強化学習ロボットにおける認知的経済性の実現を目指し,既獲得の複数の学習知識を選択的に再利用する際,保存されている全ての知識を検索して選択するのではなく,視覚等のセンサ入力情報から,再利用する「知識群」の候補をあらかじめ選択し,さらにその知識群にある複数の方策を結合して同時に利用する手法を確立する.特に,認知言語学や心理学で議論されてきたヒトにおけるプロトタイプ理論を用いて知識群をカテゴリ化し,選択すべき部分知識群(カテゴリ)を選択する手法を,強化学習ロボ ットで実現する.

研究成果の概要

転移学習を用いた強化学習ロボットの認知的経済性を実現するため,学習知識のカテゴリ化とプロトタイプの抽出,知識選択の高速化について検討した.最短経路探索を対象に,活性化拡散モデルに基づく知識のネットワーク化,プロトタイプ理論に基づくK-means++を用いた知識のカテゴリ化,カテゴリ内知識の平均化によるプロトタイプ抽出を行い,計算機実験により学習時間の短縮を確認した.計算機クラスタを用いた並列計算による知識選択時の計算高速化を図り,自律移動ロボットに実装し効果を検証した.物体形状のカテゴリ化とプロトタイプ抽出のために,学習による物体のプリミティブ形状認識を行い,形状に適した物体操作を実現した.

研究成果の学術的意義や社会的意義

本研究の最終的な目標は,「直観」や「直感」といったヒトの無意識的な判断機構をモデル化し,学習ロボットに実装することである.これにより,知能ロボットの新たなタスクへの導入時に,環境の拘束条件の緩和,タスク適応的な行動の迅速な獲得,咄嗟の環境条件変化への対応などが期待できる.本研究課題では,その基礎検討として,認知心理学の知見である活性化拡散モデルおよびプロトタイプ理論の導入による強化学習ロボットの効率的かつ高速な知識のカテゴリ化と選択(認知的経済性)の方法について提案し,実験により検証した.本研究課題の成果は,学習ロボットや学習エージェントの実用化・普及への貢献が期待できる.

報告書

(4件)
  • 2021 実績報告書   研究成果報告書 ( PDF )
  • 2020 実施状況報告書
  • 2019 実施状況報告書
  • 研究成果

    (6件)

すべて 2021 2020 2019

すべて 雑誌論文 (2件) (うち査読あり 2件、 オープンアクセス 2件) 学会発表 (4件)

  • [雑誌論文] Autonomous Reusing Policy Selection using Spreading Activation Model in Deep Reinforcement Learning2021

    • 著者名/発表者名
      Takakuwa Yusaku、Kono Hitoshi、Fujii Hiromitsu、Wen Wen、Suzuki Tsuyoshi
    • 雑誌名

      International Journal of Advanced Computer Science and Applications

      巻: 12 号: 4 ページ: 8-15

    • DOI

      10.14569/ijacsa.2021.0120402

    • 関連する報告書
      2021 実績報告書 2020 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Activation and Spreading Sequence for Spreading Activation Policy Selection Method in Transfer Reinforcement Learning2019

    • 著者名/発表者名
      Hitoshi Kono, Ren Katayama, Yusaku Takakuwa, Wen Wen, Tsuyoshi Suzuki
    • 雑誌名

      International Journal of Advanced Computer Science and Applications

      巻: 10 号: 12 ページ: 7-16

    • DOI

      10.14569/ijacsa.2019.0101202

    • 関連する報告書
      2019 実施状況報告書
    • 査読あり / オープンアクセス
  • [学会発表] プロトタイプ理論に基づきカテゴライズした知識を用いた転移学習2021

    • 著者名/発表者名
      秋山 智暉、河野 仁、温 文、藤井 浩光、鈴木 剛
    • 学会等名
      第22回計測自動制御学会 システムインテグレーション部門講演会
    • 関連する報告書
      2021 実績報告書
  • [学会発表] 転移強化学習のためのPCクラスタを用いた再利用知識選択アルゴリズムの開発2021

    • 著者名/発表者名
      坂本裕都、河野仁、温文、藤井浩光、鈴木剛
    • 学会等名
      2021年電気学会電子・情報・システム部門大会
    • 関連する報告書
      2021 実績報告書
  • [学会発表] 転移学習を用いた強化学習ロボットの方策選択における認知的経済性の検討2020

    • 著者名/発表者名
      坂本裕都,河野仁,温文,藤井浩光,鈴木剛
    • 学会等名
      日本機械学会ロボティクス・メカトロニクス講演会2020
    • 関連する報告書
      2019 実施状況報告書
  • [学会発表] 深層学習を用いた物体抽出と距離情報を用いた面検出によるプリミティブ形状の位置姿勢推定2020

    • 著者名/発表者名
      野口達矢, 藤井浩光
    • 学会等名
      日本機械学会ロボティクス・メカトロニクス講演会2020
    • 関連する報告書
      2019 実施状況報告書

URL: 

公開日: 2019-04-18   更新日: 2023-01-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi