研究課題/領域番号 |
20H04259
|
研究機関 | 東京電機大学 |
研究代表者 |
高橋 達二 東京電機大学, 理工学部, 教授 (00514514)
|
研究分担者 |
太田 宏之 防衛医科大学校(医学教育部医学科進学課程及び専門課程、動物実験施設、共同利用研究施設、病院並びに防衛, 薬理学, 講師 (20535190)
浦上 大輔 日本大学, 生産工学部, 准教授 (40458196)
甲野 佑 東京電機大学, 理工学部, 講師 (10870313)
大用 庫智 関西学院大学, 総合政策学部, 講師 (60755685)
玉造 晃弘 東京電機大学, 理工学部, 研究員 (10876361)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
キーワード | 強化学習 / 社会学習 / バンディット問題 / 模倣学習 / 限定合理性 / 満足化 / 行動経済学 / 採餌行動 |
研究実績の概要 |
本研究の実施項目は、大別して (T) 自然強化学習理論の理論的確立 (S) 社会学習の新しいモデリング (A) 応用における有効性の実証 (X) 理論の実験的検証 (人間・マウスなど) である。それぞれ、ジャーナル論文が 5, 1, 1, 2 編ずつ出版された。(T)においては、主観リグレットという概念により、限定合理性理論のモデルである満足化の実装、プロスペクト理論的な現象(リスク態度の反射効果)、合理的な採餌行動などの現象が再現できることが分かり、大きな進展があった。 (S) では、エミュレーション的競争(コンペティションとは異なる)により、分業が自己組織化されることが分かった。(A)の応用に関しては新しくベクトル量子化においても結果が出た。(X)では、マウスに関して、本研究の理論を一般化しうる興味深い結果が得られた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
「自然強化学習」に関して、計画以上に理論的に大きな進展と社会学習の新しいモデリングが成功した他、共同研究を通じて応用における有効性の実証も行えた。理論の実験的検証についてもマウスについて新しい結果が出、論文は注目を集めている。
|
今後の研究の推進方策 |
コロナを理由に延期(繰り越し)を行った実験的研究は実施する。他に関しては順調に進展しており、論文出版を中心に行う。
|