研究課題/領域番号 |
20K19752
|
研究機関 | 東京大学 |
研究代表者 |
小川 光紀 東京大学, 大学院情報学環・学際情報学府, 特任講師 (50758290)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
キーワード | 欠測データ解析 |
研究実績の概要 |
初年度は、主に欠測データ解析に関連する研究課題に着手した。現実のデータ解析の場面では一部の変数に欠測があることが多く、解析における欠測の扱いには注意が必要である。欠測データの解析にはいくつかの主だったアプローチがあるが、初年度の研究では、補完に基づく方法として代表的手法である多重補完法に注目した。欠測値を補完するという考え方は直観的に自然であることから、多重補完法などの補完に基づく方法は実用上もしばしば適用される。一方、統計モデルに基づく補完を行う際には、モデルの誤特定が最終的な解析結果を歪ませることが問題になる。そのため、欠測データ解析の文献では補完のためのモデルとしてノンパラメトリックモデルなど柔軟なモデルを推奨するものが多い。本研究では、補完のためのモデルとして柔軟なモデルを用いることとは別のアプローチで、補完モデルの誤特定による悪影響を緩和する方法の枠組みを提案した。具体的には、欠測値補完の多くの場合が共変量シフトを内包している状況であることに着目し、補完モデルの学習に密度比を用いた調整を取り入れることで、補完の正確度を改善する方法を検討した。簡単な設定のもとでシミュレーションを行い、提案する方法が補完モデルの誤特定の影響だけでなく、そもそもの解析に用いる解析モデルの誤特定に対しても、欠測にともなう悪影響を緩和する状況があることを発見した。多重補完法に関する既存研究の多くは、補完モデルの誤特定の問題に主眼をおいており、欠測データ解析における解析モデルの誤特定の問題に取り組んだものは少ないことから、提案手法の枠組みを精査することにより、補完に基づく欠測データ解析手法の発展に寄与するものと考えられる。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
初年度の環境の特殊性に影響を受け、計画当初の想定よりも遅れている部分が生じた。一方、取り組む課題の順序に計画段階から変更はあったものの、課題の一つについて解決方針が得られているため、全体としてはやや遅れている状況であると判断した。
|
今後の研究の推進方策 |
初年度の欠測データ解析に関する研究において明らかになっていない部分に引き続き取り組む。特に、提案する手法の枠組みの構成要素にはいくつかの候補があることから、その統計的性質の解析と実用の両方に配慮し、詳細を検討する。当初の研究計画で挙げたその他の課題についても順次着手する。
|
次年度使用額が生じた理由 |
参加を予定していた国際会議が延期やオンライン開催に変更になったため、旅費に残額が生じた。差額については、次年度以降に開催される学会への参加経費や、パソコンなどの物品、ソフトウェアの購入などに使用する予定である。
|