| Project/Area Number |
24K20743
|
| Research Category |
Grant-in-Aid for Early-Career Scientists
|
| Allocation Type | Multi-year Fund |
| Review Section |
Basic Section 60030:Statistical science-related
|
| Research Institution | Osaka University |
Principal Investigator |
森川 耕輔 大阪大学, 大学院基礎工学研究科, 招へい教員 (40824305)
|
| Project Period (FY) |
2024-04-01 – 2028-03-31
|
| Project Status |
Granted (Fiscal Year 2024)
|
| Budget Amount *help |
¥4,680,000 (Direct Cost: ¥3,600,000、Indirect Cost: ¥1,080,000)
Fiscal Year 2027: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2026: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2025: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2024: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
|
| Keywords | 因果推論 / 傾向スコア / 情報量規準 / 欠測値データ解析 / 特異モデル |
| Outline of Research at the Start |
特定の母集団からのデータの抽出や,回答拒否により,抽出されたデータには”偏り”が生じる.このような場合,データの観測確率や割り当て確率である傾向スコアを推定し,その推定された傾向スコアの逆数で重みづけることで偏ったデータから生じるバイアスを補正することが可能である.しかし,一般に傾向スコアの逆数値は傾向スコアが0もしくは1に近づいた場合無限大に発散し,推定値として機能しない.そこで本研究では,傾向スコアに上限と下限の閾値を設けた打切り傾向スコアを提案する.しかし,この打切り傾向スコアは特異モデルとなるため,特異モデルに対する情報量規準を応用し,特異な傾向スコアを用いた統計的推測法を構築する.
|
| Outline of Annual Research Achievements |
本研究の目的は,因果推論や欠測値データ解析で用いられる傾向スコアの逆確率が発散することを防ぐため,適切な傾向スコアの上限と下限を設定することである.特に、上限や下限を設定することによりモデルが不連続となるため,Akaike Information Criterion (AIC)やBayesian Information Criterion (BIC)といった通常のモデル選択規準が適用できないという問題が生じる. そこで,特異モデルの枠組みで擬事後分布による汎化誤差を定義した.特異モデルとは,通常仮定される正則条件が成り立たない統計モデルのことである.本設定では,微分不可能点を含む打切り傾向スコアの選択を対象としており,自然と特異モデルの設定となっている.擬似後分布を用いたベイズ的なアプローチをとる理由は,微分を必要とする通常のテイラー展開による漸近展開を避けるためである. これらの設定のもと,汎化誤差に対する漸近不偏推定量を導出することで情報量規準を提案した.提案する情報量規準は,Leave-one-out cross-validation(LOOCV)やブートストラップ法などで要求される追加の計算を必要としない.そのため,ベイズ推定する際に使用した事後サンプルを情報量規準の計算へ二次利用できるという計算上の利点もあることがわかった. また簡単な数値実験により,提案する情報量規準が想定通り機能しており,データ駆動で適切な傾向スコアモデルを選択可能であることを確認した.2024年度はこれらの結果をまとめ,統計学における最大規模の国際学会であるJoint Statistical Meeting 2024で研究報告を行った.
|
| Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究実績の概要で述べている通り,これまでの計画に沿って進めている.一件の国際学会での研究報告も行っており,初年度としては十分と考えている.
|
| Strategy for Future Research Activity |
提案する情報量規準は,これまで提案されているWidely Applicable Information Criterion (WAIC),Widely Applicable Bayesian Information Criterion (WBIC), Posterior Covariance Information Criterion (PCIC)などを包含するものとなっている.ほかの情報量規準との関係を入念に調べ,2025年度中に論文化を行う予定である.
現在までの設定では,strong ignorabilityと呼ばれる共変量を条件づけたもとで,データの割り付け変数と潜在結果変数が独立であるという強い条件を課している.これらは欠測値データ解析の文脈ではmissing at random (MAR)とも呼ばれている.近年これらの仮定を緩めたMissing not at random (MNAR),さらに非単調データなどのさまざまな欠測パターンのもとでの理論解析が進められており,実データ解析における需要も高い.2026年以降はこれらのより一般的な状況への拡張を行う.また,ベイズ推定による一般ユーザーに対するハードルを下げるため,PythonやRなどでパッケージの作成し公開する.
|