研究課題/領域番号 |
20K19757
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分60030:統計科学関連
|
研究機関 | 広島大学 |
研究代表者 |
伊森 晋平 広島大学, 先進理工系科学研究科(理), 准教授 (80747345)
|
研究期間 (年度) |
2020-04-01 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2023年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2022年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2021年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2020年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
|
キーワード | 補助変数 / 最適輸送理論 / フレシェ距離 / Greedy algorithm / 共変量シフト / ガンマダイバージェンス / Wasserstein距離 / 貪欲法 / 数理統計学 / 変数選択 |
研究開始時の研究の概要 |
本研究では補助変数を活用した主要変数の解析を考える.すべての補助変数が有用であるとは限らないため,補助変数と主要変数の関連が解析結果にどのように影響するのかを理論的に明らかにすることが肝要である.そこで,変数間の関係性を最適輸送理論に基づき定式化することで,結果に与える影響のメカニズムを解明していく.さらにその結果を用いて,大規模データにも適用可能で理論的に妥当な補助変数の活用手法の構築を目指す.
|
研究成果の概要 |
最適輸送理論(Wasserstein距離)に基づいた補助変数の活用に関する研究を行った.特に,完全データにおける混合分布に対するWasserstein距離を上から評価する式を導出した.また,フレシェ距離に基づくデータ(分布)の分類問題を考え,補助変数を追加した際のフレシェ距離の性質やフレシェ距離の推定量の収束レートを求めた.さらに,共変量シフト下での貪欲法やガンマダイバージェンスに基づく貪欲法の収束レートを導出した.
|
研究成果の学術的意義や社会的意義 |
有用な補助変数を活用することで主要変数の推定精度の向上が見込まれるため,その理論的な性質の解明は重要である.本研究で導出したWasserstein距離の評価式やフレシェ距離の推定量の収束レートは,これまでの補助変数の活用では考えられていなかったため,今後の補助変数の活用,選択手法の開発の基盤になりうると期待される.また,貪欲法に関する研究内容は高次元データにおける効率的な解析に役立つと考えられる.
|