Project/Area Number |
19J20984
|
Research Category |
Grant-in-Aid for JSPS Fellows
|
Allocation Type | Single-year Grants |
Section | 国内 |
Review Section |
Basic Section 07030:Economic statistics-related
|
Research Institution | Kyoto University |
Principal Investigator |
木戸 大道 京都大学, 経済学研究科, 特別研究員(DC1)
|
Project Period (FY) |
2019-04-25 – 2022-03-31
|
Project Status |
Completed (Fiscal Year 2021)
|
Budget Amount *help |
¥1,600,000 (Direct Cost: ¥1,600,000)
Fiscal Year 2021: ¥500,000 (Direct Cost: ¥500,000)
Fiscal Year 2020: ¥500,000 (Direct Cost: ¥500,000)
Fiscal Year 2019: ¥600,000 (Direct Cost: ¥600,000)
|
Keywords | 政策学習 / 外的妥当性 / 因果推論 / バンディット問題 / EBPM |
Outline of Research at the Start |
本研究では,エビデンスに基づいた政策形成(以下,「EBPM」という)におけるバンディット問題の応用について考察する.バンディット問題は,データを集める段階と,そのデータを利用する段階のトレードオフを具体的に考慮する.これは従来のEBPMに関する文脈では考えられてこなかった点である.したがって,バンディット問題をEBPMの枠組みで考察することで,新たな知見を得られる可能性がある. しかしながら,実際のEBPMで起こりうる状況は複雑であり,既存のアルゴリズムがそのまま適用可能なわけではない.ゆえに,実際のEBPMで起こりうる制約を考慮した上で,最適なアルゴリズムを導出することを目標とする.
|
Outline of Annual Research Achievements |
本年度は政策学習の文脈において,利用可能な実験データを生成する母集団(以下,この母集団のことを「ソース母集団」という)が政策を適用したい母集団(以下,この母集団のことを「ターゲット母集団」という)とは異なる場合に,何を目標にどのように政策を学習すればよいかについて研究を行った.この問題は因果推論の文脈においては外的妥当性の問題として認知されており,追加的な強い仮定なしにはターゲット母集団の平均介入効果を識別・推定できないことが知られている.政策学習においても同様の問題が生じ,ターゲット母集団の平均厚生を最大化する最適な政策を識別・推定することができない. そこで本年度の研究では,「Distributionally Robust Optimization」のアイデアを援用し,ソース母集団とターゲット母集団が分布間の距離の意味で一定程度近くに存在するという仮定の下,最悪の場合の平均厚生を最大化するという手法を提案した.これは,ターゲット母集団において最適な政策を求めるというゴールを動かすことを意味する.この修正により,従来の研究で課されてきた追加的な仮定を置かずに意味のある政策を学習することが可能となる.本研究では,このような政策の推定手法を提案するとともに,その理論的性質を導出した.また,職業訓練プログラムに関する実験データを用いて,この手法が実証的にも有用であることを示した.
|
Research Progress Status |
令和3年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
令和3年度が最終年度であるため、記入しない。
|