研究課題/領域番号 |
20K11711
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分60030:統計科学関連
|
研究機関 | 九州大学 |
研究代表者 |
大西 俊郎 九州大学, 経済学研究院, 教授 (60353413)
|
研究期間 (年度) |
2020-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2023年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2022年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2021年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2020年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
|
キーワード | Tweedie分布 / 指数型分布族 / 安定分布 / 統計計算ソフトウェアR / Bayes統計学 / 予測問題 / 事前分布 / Jeffreysの事前分布 / Bayes予測問題 / Stein現象 / 熱力学 |
研究開始時の研究の概要 |
ビッグデータでは複雑な(=未知パラメータが多い)統計モデルが用いられる,典型的な例として,多変量正規分布を考える.パラメータだけでなく,確率分布の関数形も推定するのが予測問題であり,これをBayes統計学の枠組みで考察するのがBayes予測問題である.推定の良さをα-ダイバージェンスと呼ばれる確率分布間の「距離」で測ることにする.無情報量事前分布と呼ばれる事前分布に基づく最適予測分布(=Bayes予測分布)は一定のよい性質を持つことが知られている.このBayes予測分布を頻度主義の意味で改善することからスタートし,Bayes予測問題と熱力学に通底する基本構造を明らかにする.
|
研究実績の概要 |
Tweedie分布の確率密度の計算について理論研究を行った.実際のデータ解析で重要な役割を果たす確率分布は,正規分布・2項分布・ガンマ分布・ポアソン分布などであり,これらはすべて指数型分布族という確率分布のクラスに属している.Tweedie分布も指数型分布族の1つである.指数型分布族に属する確率分布は,分散の平均パラメータ依存性で区別される.Tweedie分布は分散が平均パラメータのべき乗関数になっている.べき指数がゼロの場合が正規分布であり,1の場合がポアソン分布,2の場合がガンマ分布である.今回の理論的進展はべき指数が2より大きい場合である.この場合は安定分布と呼ばれる確率分布のクラスと密接に関係している. オーストラリアのUniversity of the Sunshine CoastのPeter Dunn准教授は,Tweedie分布の確率密度を精度よく計算するアルゴリズムを開発し,Rのパッケージとして公開している.Rとはフリーの統計計算ソフトウェアである.Dunn准教授のアルゴリズムは,①無限級数を精度よく計算する方法と②被積分関数の符号がプラスとマイナスに振動するような積分を効率的に計算する方法の二本立てである.数学的には①と②は実は等価であり,複素関数論における「Cauchyの積分定理」により結ばれている.方法①と②は,原点付近での計算が苦手である.①の方は見当違いの値を返し,②の方は精度が他の領域に比べると劣る.これは「プラスの量とマイナスの量を足した結果,非常に小さい値になる」ことが原因である. 本研究では,「Cauchyの積分定理」を用いて第3の方法を導いた.これは安定分布の分野でZolotarev (1986)によって考案された方法に相当し,Dunn准教授のアルゴリズムの弱点をカバーするものである.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
家庭の事情などにより研究時間が限定されている.当初の計画とは必ずしも一致しないが,予想外の部分で一定の進展があった.
|
今後の研究の推進方策 |
Tweedie分布の数値計算について研究を進めて,現在公開されているRパッケージを修正する予定である.
|