2019 Fiscal Year Annual Research Report
強化学習理論に基づく問題解決のモデル化と創造的問題解決の認知機序の解明
Project/Area Number |
16H01725
|
Research Institution | The University of Tokyo |
Principal Investigator |
植田 一博 東京大学, 大学院総合文化研究科, 教授 (60262101)
|
Co-Investigator(Kenkyū-buntansha) |
鮫島 和行 玉川大学, 脳科学研究所, 教授 (30395131)
福田 玄明 東京大学, 大学院総合文化研究科, 助教 (40615100)
|
Project Period (FY) |
2016-04-01 – 2020-03-31
|
Keywords | 認知科学 / 実験心理学 / 学習心理学 / 脳・神経 |
Outline of Annual Research Achievements |
強化学習の計算理論における重要なパラメータとして、学習の速さを決定する学習率αと「既得情報の利用と新規情報の探索」のバランスを決定する逆温度βがある。この2つのパラメータによって特徴付けられる認知機構は、強化学習そのものや意思決定のみならず、問題解決の説明原理にもなり得るという仮説を、アイデア生成課題や創造的問題解決で検証することが本研究の目的である。 令和元年度は、前年度に引き続き、アイデア生成課題として3種類のUUT課題(Unusual Uses Test)、および学習における学習率αと逆温度βを調べるために山賊問題(bandit task)を47名の参加者に対して実施した。山賊問題としては、Daw et al. (2006) で用いられている四択課題を用い、個人ごとに学習率αと逆温度βを推定した。また、アイデアを生成した本人に、自分のアイデアからトップ2だと思うものを選定してもらった。令和2年度は、このトップ2のアイデアを3名の評定者に提示し、創造性(creativity)と独自性(originality)の観点から5段階で評価してもらい、これらの評価をアイデア生成者の創造性、独自性の得点とした。そして、47名の被験者に対して、学習率αあるいは逆温度βと、創造性得点あるいは独自性得点との間の相関を計算したところ、逆温度βと創造性得点、および逆温度βと独自性得点との間に有意な相関が見いだされた。以上から、強化学習における新規情報の探索傾向の強さがアイデア生成課題における創造性を説明し得ることがわかり、仮説は検証されたと言える。 さらに、実験のすべてのデータを5年間保管するために、データストレージを購入し保管した。また、研究成果を投稿すべく、論文原稿を作成した。
|
Research Progress Status |
令和元年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
令和元年度が最終年度であるため、記入しない。
|