研究課題/領域番号 |
19J20984
|
研究種目 |
特別研究員奨励費
|
配分区分 | 補助金 |
応募区分 | 国内 |
審査区分 |
小区分07030:経済統計関連
|
研究機関 | 京都大学 |
研究代表者 |
木戸 大道 京都大学, 経済学研究科, 特別研究員(DC1)
|
研究期間 (年度) |
2019-04-25 – 2022-03-31
|
研究課題ステータス |
完了 (2021年度)
|
配分額 *注記 |
1,600千円 (直接経費: 1,600千円)
2021年度: 500千円 (直接経費: 500千円)
2020年度: 500千円 (直接経費: 500千円)
2019年度: 600千円 (直接経費: 600千円)
|
キーワード | 政策学習 / 外的妥当性 / 因果推論 / バンディット問題 / EBPM |
研究開始時の研究の概要 |
本研究では,エビデンスに基づいた政策形成(以下,「EBPM」という)におけるバンディット問題の応用について考察する.バンディット問題は,データを集める段階と,そのデータを利用する段階のトレードオフを具体的に考慮する.これは従来のEBPMに関する文脈では考えられてこなかった点である.したがって,バンディット問題をEBPMの枠組みで考察することで,新たな知見を得られる可能性がある. しかしながら,実際のEBPMで起こりうる状況は複雑であり,既存のアルゴリズムがそのまま適用可能なわけではない.ゆえに,実際のEBPMで起こりうる制約を考慮した上で,最適なアルゴリズムを導出することを目標とする.
|
研究実績の概要 |
本年度は政策学習の文脈において,利用可能な実験データを生成する母集団(以下,この母集団のことを「ソース母集団」という)が政策を適用したい母集団(以下,この母集団のことを「ターゲット母集団」という)とは異なる場合に,何を目標にどのように政策を学習すればよいかについて研究を行った.この問題は因果推論の文脈においては外的妥当性の問題として認知されており,追加的な強い仮定なしにはターゲット母集団の平均介入効果を識別・推定できないことが知られている.政策学習においても同様の問題が生じ,ターゲット母集団の平均厚生を最大化する最適な政策を識別・推定することができない. そこで本年度の研究では,「Distributionally Robust Optimization」のアイデアを援用し,ソース母集団とターゲット母集団が分布間の距離の意味で一定程度近くに存在するという仮定の下,最悪の場合の平均厚生を最大化するという手法を提案した.これは,ターゲット母集団において最適な政策を求めるというゴールを動かすことを意味する.この修正により,従来の研究で課されてきた追加的な仮定を置かずに意味のある政策を学習することが可能となる.本研究では,このような政策の推定手法を提案するとともに,その理論的性質を導出した.また,職業訓練プログラムに関する実験データを用いて,この手法が実証的にも有用であることを示した.
|
現在までの達成度 (段落) |
令和3年度が最終年度であるため、記入しない。
|
今後の研究の推進方策 |
令和3年度が最終年度であるため、記入しない。
|