研究課題/領域番号 |
19K23242
|
研究機関 | 統計数理研究所 |
研究代表者 |
伊藤 翼 統計数理研究所, 統計思考院, 特任助教 (90849001)
|
研究期間 (年度) |
2019-08-30 – 2021-03-31
|
キーワード | 小地域推定 / 線形混合モデル / 縮小推定 / 高次元データ |
研究実績の概要 |
本研究は、相関をもった多次元の観測値ベクトルを同時に扱う多変量小地域推定問題についての研究であり、また観測値の次元が地域数に対して比較的大きい場合の問題について考察するものである。 小地域推定問題においては、興味のある地域の特性値の推定、予測が主目的である。そこで、多次元の観測値のすべてが連続値で与えられると考え、また線形混合モデルの地域効果と誤差項がともに多変量正規分布に従うと仮定することで、その予測量をベイズ推定量により導出した。また、このベイズ推定量は回帰係数や地域効果の分散成分などの未知パラメータを含むため、これらを推定量として、それぞれ一般最小二乗推定量とモーメント推定量を用いたが、まずは観測値の次元と地域数の比が0に収束するといった漸近論の下でこれらの推定量の一致性と収束レートと評価した。 また、小地域推定においては、予測量を公表するだけでは不十分であり、その予測リスクを評価する必要がある。そこで、まず本研究における予測量の平均二乗誤差行列をその予測リスクとして評価した。この評価は、予測量が未知パラメータの推定量を含むため、誤差のオーダーが(1/地域数)より小さくなるように近似することが求められるが、今回もまた観測値の次元は地域数よりも小さいといった漸近論の下で、モデルのパラメータ数も考量して平均二乗誤差行列の漸近近似を行った。得られた結果としては、観測値の次元を固定した多変量小地域推定における平均二乗誤差行列と比べて追加的な項が現れることが分かり、実際に数値実験を行うと、観測値の次元が地域数に対して比較的大きい場合には、この差は無視できないことが観察できる。多変量小地域推定の手法を実データ解析に応用する場合、扱う観測値の次元は大きく設定することが必然的であるため、この差を考慮することで、より正しい意思決定を導くといった点に本研究で得られた結果の意義がある。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究では、現在までに多変量小地域推定モデルにおける予測量の予測リスクとして平均二乗誤差行列の評価を行うことができた。しかし、平均二乗誤差行列は実際の解釈が困難である面がある。また、例えば予測量をもとに疾病地図を作成する場合、予測リスクとしては多変量予測量の信頼区間や信頼領域を評価できていることが望ましい。そこで、引き続き多変量の信頼領域の評価を行っている。これは単にパラメータの推定量を代入しただけの信頼領域では信頼水準に対して下方バイアスをもつことが知られているため、それを補正するような信頼領域を構成する必要がある。現時点では、信頼領域をマハラノビス距離に基づいて構成し、漸近近似の評価を行っている段階であり、研究自体は順調である。 しかし、完全に信頼領域を漸近評価し、数値実験や実データ解析を行っていないため、研究発表が依然行えていない状況である。また、論文投稿した際も、最終的に受理されるまでに長時間要することを考慮すると期待以上に進展しているとは考えられない。
|
今後の研究の推進方策 |
[現在までの進捗状況]でも述べたように、信頼領域の漸近評価をおこない理論的な部分の研究を完了し、数値実験や実データ解析を行うことが今後の推進方策である。実データ解析としては、あるがん種による標準化死亡比を複数のがん種を同時に扱うことで予測を行い、それをもとにがん種ごとの死亡リスクの疾病地図をつくることを考えている。その際、マハラノビス距離に基づく信頼領域から、どのように個々の死亡リスクの信頼区間を構成するかが問題となるが、現時点では、他のがん種の死亡リスクをその予測量で固定することで得られる信頼区間を用いることを考えている。
|
次年度使用額が生じた理由 |
参加を考えていた国際学会の申し込み締め切り日が、本研究費交付前であったため、想定していた旅費が発生しなかったために次年度使用額が生じた。 使用計画については、書籍購入と国内、国際学会参加の際の旅費として使うことを計画している。
|