研究課題/領域番号 |
23K17547
|
研究種目 |
挑戦的研究(萌芽)
|
配分区分 | 基金 |
審査区分 |
中区分7:経済学、経営学およびその関連分野
|
研究機関 | 電気通信大学 |
研究代表者 |
岩崎 敦 電気通信大学, 大学院情報理工学研究科, 准教授 (30380679)
|
研究期間 (年度) |
2023-06-30 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
6,500千円 (直接経費: 5,000千円、間接経費: 1,500千円)
2024年度: 3,510千円 (直接経費: 2,700千円、間接経費: 810千円)
2023年度: 2,990千円 (直接経費: 2,300千円、間接経費: 690千円)
|
キーワード | ゲーム理論 / 繰り返しゲーム / 私的観測 / アルゴリズム / 最適化 |
研究開始時の研究の概要 |
本研究では,機械学習と情報理論の観点から,不完全情報下における逐次的意思決定の分析手法を開拓することを目的とする.具体的には,私的観測というお互いの行動を正確に観測できない状況におけるゲームの帰結 (均衡) を求める問題を扱う.これは部分観測可能マルコフ決定過程 (POMDP) に帰着できることが知られているが,一般には決定不能な問題であり,解析的な分析が可能な定式化や解法は未だ見つかっていない長年の学際的かつ挑戦的な課題である.本応募では機械学習理論および情報理論の観点から,POMDPを俯瞰し,大規模な問題に適用可能な,精度保証つきの近似解法を構築する.
|