2017 年度研究成果報告書

認知心理学におけるプライミング効果を基にした強化学習ロボットによる知識選択

研究課題

研究課題/領域番号	16K12493
研究種目	挑戦的萌芽研究
配分区分	基金
研究分野	知能情報学
研究機関	東京電機大学
研究代表者	鈴木剛東京電機大学, 工学部, 教授 (00349789)
研究分担者	温文東京大学, 大学院工学系研究科(工学部), 特別研究員 (50646601) 河野仁東京工芸大学, 工学部, 助教 (70758367)
研究期間 (年度)	2016-04-01 – 2018-03-31
キーワード	知識選択 / 活性化拡散モデル / 転移学習 / 強化学習
研究成果の概要	本研究では，転移学習において複数方策から有用な知識を選択するために，人間の記憶や知識の思い出しや再認識を行うメカニズムである活性化拡散モデルを用いた転移学習手法を提案した．本手法は，1)複数方策をカテゴリに分類してネットワークを構築，2)カテゴリから方策を想起，3)方策を選択，4)活性値の拡散（活性化拡散），5)活性値の減衰，という処理をロボットエージェントの行動毎に反復実行し，方策の活性値を調整しながら，転移する方策を選択する．計算機シミュレーションにより，方策を用いない強化学習，単一方策のみを用いた転移学習，提案手法を用いた転移学習の学習効率を比較し，提案手法の有用性を確認した．
自由記述の分野	ロボット工学、情報通信工学