Project/Area Number |
24K22326
|
Research Category |
Grant-in-Aid for Challenging Research (Exploratory)
|
Allocation Type | Multi-year Fund |
Review Section |
Medium-sized Section 61:Human informatics and related fields
|
Research Institution | National Institute of Informatics |
Principal Investigator |
小林 泰介 国立情報学研究所, 情報学プリンシプル研究系, 助教 (10796452)
|
Co-Investigator(Kenkyū-buntansha) |
松原 崇充 奈良先端科学技術大学院大学, 先端科学技術研究科, 教授 (20508056)
鶴峯 義久 奈良先端科学技術大学院大学, 先端科学技術研究科, 助教 (00908113)
|
Project Period (FY) |
2024-06-28 – 2026-03-31
|
Project Status |
Granted (Fiscal Year 2024)
|
Budget Amount *help |
¥6,500,000 (Direct Cost: ¥5,000,000、Indirect Cost: ¥1,500,000)
Fiscal Year 2025: ¥4,290,000 (Direct Cost: ¥3,300,000、Indirect Cost: ¥990,000)
Fiscal Year 2024: ¥2,210,000 (Direct Cost: ¥1,700,000、Indirect Cost: ¥510,000)
|
Keywords | 強化学習 / ベイズ理論 / 内部モデル / 最適性 |
Outline of Research at the Start |
我々ヒトは行動がもたらす将来の結果を予測する際に,「かもしれない運転」のように予測結果にある優劣を事前に選好して予測できる一方,AIはあらゆる可能性を確率的に予測した後に所望の優劣となるものを選び出す.この2種類の予測プロセスは一長一短であり,ヒト型は認知バイアスが,AI型は計算時間が問題となる.そこで本研究では,これらを相補的に融合することで高効率・合理的な意思決定を支援する新たな予測プロセスを創出する.この新技術は,2種類の予測プロセスがベイズ理論の下で理論的に等価であることを活用して導出し,不確実性の大きなロボット実験を通じて実証する.
|