研究課題/領域番号 |
16K12493
|
研究種目 |
挑戦的萌芽研究
|
配分区分 | 基金 |
研究分野 |
知能情報学
|
研究機関 | 東京電機大学 |
研究代表者 |
鈴木 剛 東京電機大学, 工学部, 教授 (00349789)
|
研究分担者 |
温 文 東京大学, 大学院工学系研究科(工学部), 特別研究員 (50646601)
河野 仁 東京工芸大学, 工学部, 助教 (70758367)
|
研究期間 (年度) |
2016-04-01 – 2018-03-31
|
キーワード | 知識選択 / 活性化拡散モデル / 転移学習 / 強化学習 |
研究成果の概要 |
本研究では,転移学習において複数方策から有用な知識を選択するために,人間の記憶や知識の思い出しや再認識を行うメカニズムである活性化拡散モデルを用いた転移学習手法を提案した.本手法は,1)複数方策をカテゴリに分類してネットワークを構築,2)カテゴリから方策を想起,3)方策を選択,4)活性値の拡散(活性化拡散),5)活性値の減衰,という処理をロボットエージェントの行動毎に反復実行し,方策の活性値を調整しながら,転移する方策を選択する.計算機シミュレーションにより,方策を用いない強化学習,単一方策のみを用いた転移学習,提案手法を用いた転移学習の学習効率を比較し,提案手法の有用性を確認した.
|
自由記述の分野 |
ロボット工学、情報通信工学
|