研究課題/領域番号 |
23K28159
|
補助金の研究課題番号 |
23H03469 (2023)
|
研究種目 |
基盤研究(B)
|
配分区分 | 基金 (2024) 補助金 (2023) |
応募区分 | 一般 |
審査区分 |
小区分61040:ソフトコンピューティング関連
|
研究機関 | 東京電機大学 |
研究代表者 |
高橋 達二 東京電機大学, 理工学部, 教授 (00514514)
|
研究分担者 |
甲野 佑 東京電機大学, 理工学部, 研究員 (10870313)
玉造 晃弘 東京電機大学, 理工学部, 研究員 (10876361)
太田 宏之 防衛医科大学校(医学教育部医学科進学課程及び専門課程、動物実験施設、共同利用研究施設、病院並びに防衛, 薬理学, 准教授 (20535190)
浦上 大輔 日本大学, 生産工学部, 教授 (40458196)
大用 庫智 関西学院大学, 総合政策学部, 講師 (60755685)
|
研究期間 (年度) |
2023-04-01 – 2026-03-31
|
研究課題ステータス |
交付 (2024年度)
|
配分額 *注記 |
18,720千円 (直接経費: 14,400千円、間接経費: 4,320千円)
2025年度: 5,980千円 (直接経費: 4,600千円、間接経費: 1,380千円)
2024年度: 6,110千円 (直接経費: 4,700千円、間接経費: 1,410千円)
2023年度: 6,630千円 (直接経費: 5,100千円、間接経費: 1,530千円)
|
キーワード | 強化学習 / 社会学習 / 満足化 / 限定合理性 / 認知実験 / 天然知能 / 計算論的認知科学 / バンディット問題 |
研究開始時の研究の概要 |
ゲームなどで人間を上回る性能を見せている「人工強化学習」に対し、代表者らは人間や動物の社会性や動機付け、環境の探索方法を組み込んだ「自然強化学習」を提案し発展させる。人工強化学習は単なるスカラー値としての報酬を自己評価に用いるため、学習に無数の致命的な失敗(=死)を要する。大量の個体集合 (並列化や大量のシミュレーション) で解決を図る。他方人間や多くの動物は、「原点」を導入して報酬を変換し、単なる評価ではない弱い教示として活用する。また他個体の学習状況を観察しながら探索し、結果無駄な死も避ける。この理論とモデルを構築し、それを動物や人間の実験で検証するとともに、工学的な応用も実現する。
|