Project/Area Number |
22K11935
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 60030:Statistical science-related
|
Research Institution | Kagoshima University |
Principal Investigator |
吉田 拓真 鹿児島大学, 理工学域理学系, 准教授 (80707141)
|
Project Period (FY) |
2022-04-01 – 2026-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥4,030,000 (Direct Cost: ¥3,100,000、Indirect Cost: ¥930,000)
Fiscal Year 2025: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
Fiscal Year 2024: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2023: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
Fiscal Year 2022: ¥1,950,000 (Direct Cost: ¥1,500,000、Indirect Cost: ¥450,000)
|
Keywords | 極値統計学 / 加法モデル / 変化係数モデル / 高次元データ / ノンパラメトリック回帰 |
Outline of Research at the Start |
高次元データの極値解析モデルを開発することが目的である。特に、(1)加法モデル (2)変動係数モデル (3) 次元削減モデル (4)スパースモデルを極値統計学に発展させる。(1)--(4)のモデルはこれまでは平均や中央値の推測には十分に開発されてきたが、最大値、最小値予測モデルに応用された例は多くない。 上記の4モデルは分析目的やデータの構造を見て使い分けるものである。よって、本研究目的の達成は、極値統計学を用いたリスク分析に新たに4つの視点をもたらすこととなる。本研究は多様性の観点から極値統計学の発展に貢献するものである。
|
Outline of Annual Research Achievements |
加法モデルを極値統計分布に組み込んだモデルはExtreme value generalized additive models (EVGAM)と呼ばれ、広く知られている。2023年度は特にこのEVGAMの漸近理論の構築に着手した。EVGAMでは形状パラメータ、尺度パラメータと推定すべきパラメータが2つあり、これらの同時推定を行う必要があることが他の統計モデルと異なる部分である。この2つのパラメータの推定量は互いに従属関係にあり、その従属構造を見出すときに、形状パラメータの一意性の問題が発生する。この研究では、形状パラメータが一意に存在するための条件を導出した。その条件は比較的緩く、実データ解析を行う際に致命的なものではないことも示した。漸近理論としては、推定量の一様収束レートを導出した。極値統計学の一様収束に関する結果は簡単なモデルで2000年に、尺度パラメータ固定の下で形状パラメータに対する結果が2015年に解明されているが、2つのパラメータの同時推定の下でそれぞれの一様収束レートを示したのは本研究が初である。EVGAMはこれまで理論研究が行われていないもののアプリケーションではよく用いられている。本研究はその有用性を理論面から保証されるものである。本研究は論文にまとめ、現在、国際ジャーナルに登校中である。 他に変化係数モデルを用いた極値分布論に関する研究を2022年から継続した。本研究の詳細は2022年度の実績を参照するが、今年度、本研究をまとめた論文が統計学関連の国際ジャーナルに採択された。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究課題は4つの統計モデルを極値統計学に発展させることであるが、その内2つのモデルである加法モデル、変化係数モデルについて結果を論文にまとめることができた。これらの研究は国際会議や国内会議でも発表し、専門家からもコメントを得ている。どちらのモデルも応用する上では重要なモデルで、研究の方向性も間違ってはいない確信を得ている。変化係数モデルについては最近、応用先として経済データにマッチすることを知ったため、その専門家と議論し、さらに研究を深めていける可能性を感じている。 残りの研究期間2年で2つのモデル:single-indexモデル, スパースモデルの導入を目指す。まず、single-indexモデルについてはすでに数値解析は完成しており、漸近理論構築を残すのみである。理論面においてもこのモデルは極値以外の分布では広く研究され、先行研究は十分にある。極値分布ならではのバイアス導出が難点となるが、道具は揃っていると考えてよい。スパースモデルについてもすでに気象データへの適用を試みている。厳密な精度評価は今後行うが、感触は良好であり、少なくとも方針変更の必要はないと考えている。理論的性質の解明は今後の課題であるが、こちらも先行研究は豊富に存在する。ひとつ気がかりがあるとすれば、スパースモデルのパラメータ推定の計算コストを要する点である。計算機のスペックも依存してくるが研究成果を挙げる段階では効率化を極めたものを発表したい。本研究は完成にはまだ時間を要するが、研究の骨格は出来上がっていると判断できる。今後の進捗で上記の問題点を解決したい。
以上の理由から、本研究はおおむね順調に進展していると判断する。
|
Strategy for Future Research Activity |
2024年度はまずはsingle-indexモデルの極値分布への適用を重点的に研究する。single-indexモデルのパラメータ推定方法は様々なものが知られており、極値に合う方法を探す必要がある。複数の方法を比較し、ベストなものを見つけ、なぜその方法が極値に合うのかも理論的に考察を与えたい。また、single-indexモデルはパラメータと非線形関数が混在しているため、それぞれの漸近理論を構築するだけでなく、同時に組み合わさった状態での理論構築が望まれる。これらは先行研究は存在するものの、極値分布に適用したときに極値バイアスとどう関連してくるのかを調べる必要がある。必要な仮定を十分に吟味し、理論解明に取り組む。数値実験による手法の妥当性はすでに得られている。一方でこのモデルはモデリング後のデータ解釈が多少難しいため、実データへの応用を通じて、極値分析においてどのような利点があるのかをクリティカルにまとめたい。ある程度成果がまとまったら、国内会議で講演し、専門家からの助言を得たい。その後、この研究は2024年度内に成果を論文にまとめ、国際ジャーナルに投稿したい。 スパースモデルは本格的には2025年度に取り組むが、数値実験は本年度中には始めたい。スパース構造の入れ方として様々なものが考えられるが、先行研究で特に重要視される設定である「重要な変数と重要でない変数間の相関構造のパターン」に可能な限り実データの特徴を反映させたい。実データとしては気象データへの適用を視野に入れているが、経済データや医療データへの可能性も視野に入れている。様々なデータに適用できる汎用的な手法の開発を目指すべく、様々な実学の研究者らと議論を行いたい。
|