研究課題/領域番号 |
23K16850
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分60030:統計科学関連
|
研究機関 | 横浜市立大学 |
研究代表者 |
森山 卓 横浜市立大学, データサイエンス学部, 准教授 (30823190)
|
研究期間 (年度) |
2023-04-01 – 2027-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
2026年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2025年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2024年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2023年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
|
キーワード | セミパラメトリック統計 / 極値統計 / ノンパラメトリック統計 / 超過分布 / 裾確率 |
研究開始時の研究の概要 |
現代の多様な場面において,大規模リスクの定量的評価の重要性が高まっている.「十分には大きくない大きな値」に対する極値理論に推定精度上の課題があると考える応募者は,ノンパラメトリックな方法をうまく組み合わせることで精度を改善できると見込んでいる.リスクを測る尺度として,本研究では超過分布と裾確率を取り扱う.極値理論に基づく方法とノンパラメトリックな方法の推定精度について,理論と数値実験の両面から優位性と問題点を明確化する.そして,両方の良い性質を併せ持つセミパラメトリックな推定方法を確立する.統計解析ソフトRへの提案手法の実装や,各分野への応用により研究成果を積極的に社会へ還元する.
|
研究実績の概要 |
2023年度は「セミパラメトリックなアプローチによる高精度リスク評価方法の確立とその応用」のための基礎研究として,ノンパラメトリック推定や極値理論に関するいくつかの研究を行った.1つ目の研究は,境界バイアスと呼ばれる固有の問題があることが知られているカーネル平滑化を用いた累積分布推定に関するものである.境界は未知であると考えるこの研究の問題設定では,標本最大値を用いる従来手法は境界をある意味で過小評価していると考え,この観点から分布推定の精度の改良方法について研究を行った.大規模数値実験の結果により,従来手法より提案手法の精度が数値的に優れることを実証した(単著)投稿論文は査読付き国際誌に採択,出版された.2つ目の研究は超過分布関数の推定に関する理論研究およびその数値実験からなる.超過分布関数とは,ある数値(閾値)以上の値をとると仮定したとき,どれくらいの値がどのような確率で発生するかを表すものであり,大規模リスクを定量的に評価するために必要不可欠なものである.超過分布関数の推定には,ノンパラメトリックなカーネル平滑化を用いる方法,極値理論に基づく一般パレート分布へのフィッティングを用いる方法の大きく異なる2通りアプローチがある.閾値の大小や母集団分布の裾の重さ(具体的には極値パラメータや二次パラメータ)の観点から推定精度を比較し,それぞれの理論的および数値的性質を明らかにした(単著)論文を査読付き国際誌へ投稿した.関連する研究成果について,国際学会2件,国内学会2件で講演を行い,他の研究者からのレビューを受けた.これらの研究成果に関する学術論文も来年度以降の採択を目指している.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本年度の具体的な研究成果は査読付き国際論文出版1件,国際学会発表2件,国内学会発表2件でおおむね予定通りとなった.そのほかの研究内容の進展としては,超過分布関数推定に関する基礎研究のほか,データ変換による極値の推測精度の向上に関して一定の成果を得ている.データ分析の重要なツールであるデータ変換は,ノンパラメトリック推測の枠組みにおいても,その有用性が議論されてきた.極値理論においてその基礎的な性質を調査している先行研究を発見し,標本最大値に関する推測精度の向上にデータ変換が寄与するかどうか研究を行った.標本最大値の確率分布を推定する際には,ノンパラメトリックなカーネル平滑化を用いる方法,極値理論に基づく一般極値分布へのフィッティングを用いる方法の大きく異なる2通りアプローチがあるが,両アプローチの良し悪しは場面によりはっきり分かれることが分かっていた.特にカーネル平滑化を用いる方法は極値パラメータが正の大きな値を取る場合にパフォーマンスが理論的にも数値的にも著しく低いことを明らかにしていた自身の先行研究から,極値指数を0にする対数変換に着目した.極値理論に基づくアプローチにおいては全く無意味であることがわかったが,カーネル平滑化においては裾の重い分布に対し最適なパフォーマンス(漸近収束速度)を達成するための条件を緩和することがわかった.そして大規模数値実験の結果から,有限標本において数値的な精度を向上させることも確認できた.本研究に関しても(単著)論文を査読付き国際誌へ投稿している.
|
今後の研究の推進方策 |
超過分布関数推定に関して,ノンパラメトリックなカーネル平滑化を用いる方法,極値理論に基づく一般パレート分布へのフィッティングを用いる方法の理論的性質および数値的性質を明らかにすることに成功したので,両アプローチの良い性質を併せ持つ(セミパラメトリックな)アプローチの考案を今後進める予定である.また超過分布関数と関連して,裾確率の推定に関しても基礎研究を行う.確率分布の裾に基づく裾確率は,発生確率は低いものの発生した場合に(極めて)大きな値をとる事象に関する定量的な評価に必要であり,さまざまな分野におけるリスク管理で求められる.裾確率に関してもカーネル平滑化を用いる方法,極値理論に基づく方法の大きく2通り考えられる.「極めて大きいとまでは言えないような値」の発生確率に関しては,カーネル平滑化の方が優れると考えられるが,「極めて大きいとまでは言えないような値」の定義はサンプルサイズや確率分布の裾の重さ等に依存し,これを明確に定めることは理論的にも数値的にも難しいことが想定される.超過分布関数推定や裾確率の推定に関して引き続き研究を続け,次年度以降も査読付き国際誌への投稿および国際学会,国内学会での講演を継続する.
|