研究課題/領域番号 |
24K22326
|
研究種目 |
挑戦的研究(萌芽)
|
配分区分 | 基金 |
審査区分 |
中区分61:人間情報学およびその関連分野
|
研究機関 | 国立情報学研究所 |
研究代表者 |
小林 泰介 国立情報学研究所, 情報学プリンシプル研究系, 助教 (10796452)
|
研究分担者 |
松原 崇充 奈良先端科学技術大学院大学, 先端科学技術研究科, 教授 (20508056)
鶴峯 義久 奈良先端科学技術大学院大学, 先端科学技術研究科, 助教 (00908113)
|
研究期間 (年度) |
2024-06-28 – 2026-03-31
|
研究課題ステータス |
交付 (2024年度)
|
配分額 *注記 |
6,500千円 (直接経費: 5,000千円、間接経費: 1,500千円)
2025年度: 4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2024年度: 2,210千円 (直接経費: 1,700千円、間接経費: 510千円)
|
キーワード | 強化学習 / ベイズ理論 / 内部モデル / 最適性 |
研究開始時の研究の概要 |
我々ヒトは行動がもたらす将来の結果を予測する際に,「かもしれない運転」のように予測結果にある優劣を事前に選好して予測できる一方,AIはあらゆる可能性を確率的に予測した後に所望の優劣となるものを選び出す.この2種類の予測プロセスは一長一短であり,ヒト型は認知バイアスが,AI型は計算時間が問題となる.そこで本研究では,これらを相補的に融合することで高効率・合理的な意思決定を支援する新たな予測プロセスを創出する.この新技術は,2種類の予測プロセスがベイズ理論の下で理論的に等価であることを活用して導出し,不確実性の大きなロボット実験を通じて実証する.
|