本年度の研究では、理論と実証の両面から機械学習的手法によるターゲティング政策の学習に取り組み成果をあげた。前者の研究に関しては、doubly robust policy learningの方法を拡張して、最適な動的な公共政策を二重頑健に推定する手法を開発し、その性能を理論的に評価した。この方法は、例えば、逐次的な職業訓練、失業保険の段階的給付の最適なデザインに応用することができる。本研究では、小学校教育における補助教員付クラスと少人数クラスへの各学年における生徒の最適な割り当て方法を、本研究で提案したアルゴリズムを使って推定した。理論的な貢献として、本研究では、提案した手法が2種類の局外母数に対して二重頑健性をもつこと、局外母数がノンパラメトリックに推定された場合でも、最適な動的政策をパラメトリック収束レートで推定できることを示した。この結果は、局外母数を機械学習的手法で推定することへの正当性も与えている。 後者の研究に関して、家庭の電力消費量の削減を目標としたリベートプラグラムにおいて、決定木を使ったPolicy learningの手法を応用することで、最適なターゲティング政策を推定した。また、その政策効果を実証データで評価した。本研究では、推定されたターゲティング政策を実施することによって、政府が一様にプログラムを割り当てる場合や各世帯が自身でプログラムの参加・不参加を決める場合に比べて、より高い政策の効果を実現できることを示した。この結果を通して、ターゲティング政策およびターゲティング政策の統計的学習の有効性を実証することができた。本研究では、さらに逆進性の小さなターゲティング政策をデータから学習するアルゴリズムを開発し、そのアルゴリズムで推定されたリベート・ターゲティング政策は逆進性が実際に小さいことを実証した。
|