研究課題/領域番号 |
22K11935
|
研究機関 | 鹿児島大学 |
研究代表者 |
吉田 拓真 鹿児島大学, 理工学域理学系, 准教授 (80707141)
|
研究期間 (年度) |
2022-04-01 – 2026-03-31
|
キーワード | 極値統計学 / 高次元データ / ノンパラメトリック回帰 |
研究実績の概要 |
一般化極値分布における高次元ノンパラメトリック法の漸近理論研究に着手した。この研究は2000年代後半より、重要とされていながらも未解決であった問題であった。ベースとなる手法は2005年に提案されていたものの、そこからの発展は遅かった。ところが2020年に統計ソフトRのパッケージ"evgam"が開発・公開されたことから誰でも簡単にこの手法を利用でき、応用例も増加した。ところが、本手法の漸近理論研究は未だに未開発であり、高まる受容を受け、理論研究に着手した。本研究では該当手法の漸近収束レートと漸近分布を導出した。また、計算効率、また解釈性のある直交変換モデルについても理論を構築した。得られた成果は一般化極値分布の理論研究を総括するものであり、evgamの理論の基盤となると考えている。1件の国内学会で報告し、現在、国際ジャーナルに投稿中である。 また、クラスターデータにおける極値統計モデリングの開発も進めた。このモデルでは小地域推定を極値統計学に応用したモデリング方法である。極値統計学は得られるデータ数が少なくモデリングが不安定になる困難さが常につきまとう。この問題を小地域推定の利点を活かし、克服することが目的である。小地域推定の特性は、各地域(クラスター)のデータ数が少なくても、クラスター数が多ければ、全クラスター共有の情報がデータ数が少ない各クラスターの不安定な推測をカバーし、精度が向上するというものである。この特性をそもそも得られるデータ数が少ない極値統計学に応用している。本件に関しては2023年度に国内・国際会議での報告、また、国際ジャーナルへの投稿を目指す。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
2022年度に計画していた成果は得られた。また, 2023年度に実施する予定のクラスターデータの極値統計学に関しても結果はすでに得られており、これから論文執筆に着手する段階である。こちらの研究は2023年前半には論文投稿ができる見込みである。
|
今後の研究の推進方策 |
今後も引き続き、高次元極値統計学の手法開発に着手していく。まずは現在進行中である大規模クラスターデータの極値モデルの開発である。極値データはデータ数が少なくモデリングが不安定になりやすいが、混合効果モデルを用いることで問題を解決できる見込みである。また、クラスター間で共有できる情報をピックアップするためにスパース法を利用する。このように本研究は見通しが立っており、最新研究を織り交ぜながら精度の高いモデリングを実現する。
|
次年度使用額が生じた理由 |
新型コロナウィルスの収束が見えず、本年度の国内・国際学会はすべてオンラインで参加した。研究の理解者や共同研究者を得るためにはやはり対面で直接議論する方が望ましい。そのため、2023年度以降対面で学会開催がされる機会のために予算を保留しておいた。実際に、2023年度は対面での国際会議出張を計画している。
|