本年度の研究では、動的なターゲティング政策の学習について理論と実証の両面から取り組み成果をあげた。前者の研究に関しては、昨年度の研究実績の拡張として、最適な動的トリートメント・レジームの新たな2重頑健推定の手法を開発した。昨年度の関連する研究成果との違いとして、今年度の研究では後ろ向き推論に基づく推定手法を開発した。後ろ向き推論によって最適化問題を解くことにより、開発した推定手法は高い計算効率性をもち、より応用のしやすい手法となった。本年度の研究では、開発した手法の理論的性質を解明した。とくに、リグレットの収束速度について、既存の手法よりも優れていることを示した。本研究では、小学校教育における補助教員付クラスと少人数クラスへの2学年にわたる生徒の最適な動的割り当て方法を、本研究で提案したアルゴリズムを使って推定した。提案したアルゴリズムを使って推定した動的なクラス割り当てを実施することで、生徒の学力が平均的に向上することを定量的に示した。 後者の研究に関して、家庭の電力消費量の削減を目標としたリベートプラグラムにおいて、決定木を使った動的政策学習の手法を応用することで、最適な動的ターゲティング政策を推定した。また、推定された動的ターゲティング政策の効果を実証データで評価した。本研究では、動的なターゲティング政策は静的なターゲティング政策よりも社会厚生を大きく改善することを示した。また、動的ターゲティング政策による社会厚生増大のメカニズムを、学習、馴化、スクリーニングといった概念に基づいて定量的に分析した。
|