研究課題/領域番号 |
19K16894
|
研究機関 | 京都大学 |
研究代表者 |
東 広志 京都大学, 情報学研究科, 助教 (70734474)
|
研究期間 (年度) |
2019-04-01 – 2023-03-31
|
キーワード | 強化学習 / ベイズ学習 |
研究実績の概要 |
報酬に関する階層構造学習を行うときの行動と脳波の計測を行った.計測では次のようなタスクを実験参加者に行ってもらった.実験参加者に,合図として複数の画像が表示する.実験参加者はその中から画像を選ぶ.このとき,特定の位置にある特定の種類の画像を選ぶと報酬が得られる.実験参加者はこの一連の流れを繰り返すことで,「どの種類の画像が,どの位置にあれば報酬が得られるか」を学習する. この課題は「報酬に紐づく画像がわからなければ,位置もわからない」し,「位置が分からなければ,画像も分からない」という状況を生み出す.このような問題は通常の強化学習の枠組みで解くことができない.そこで,階層的なベイズ学習を利用した学習モデルを提案する.この学習モデルには,「画像」と「位置」のどちらの要素が,階層的に上位にあるのかは任意性があるため,行動と脳波計測によって,これを明らかにする. ヒトが実際にどのようにこのような問題を解くかを調べるために,10名の実験参加者に上記の課題をやってもらい,行動と脳波の計測を行った.行動実験の結果は,どちらの要素が階層的に上位に位置するかは,学習の進行度によって,適応的に変化することが示された.つまり,「画像」と「位置」に関する情報をどれだけ信頼しているかによって,階層構造は変化する.また,階層的に下位に位置する要素の学習を反映する脳波応答は,階層的に上位に位置する要素の学習を反映する脳波応答よりも,早く現れることがわかった.これは,行動の結果と一致する.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
実験参加者数を増やす予定だったが,コロナウイルス感染対策のため,実験実施を延期したため.
|
今後の研究の推進方策 |
行動・脳波実験を引き続き行う.計測データのモデル解析を進め,階層構造学習モデルの妥当性を検証する.
|
次年度使用額が生じた理由 |
コロナウイルス感染拡大予防のため,行動と脳波計測実験の延期した.それにともなう消耗品の購入や謝金の支払いを次年度へ回した.
|