2016 Fiscal Year Research-status Report
高次元データの多変量解析についての統計的推測に関する研究とその応用
Project/Area Number |
26800088
|
Research Institution | Kagoshima University |
Principal Investigator |
山田 隆行 鹿児島大学, 教育センター, 講師 (60510956)
|
Project Period (FY) |
2014-04-01 – 2018-03-31
|
Keywords | 高次元データ / 判別分析 / 正規性の診断 |
Outline of Annual Research Achievements |
本研究課題は、高次元データに関しての推測法の開発およびその数値的な検証、手法の性質に関する理論研究である。
平成28年度は、まず昨年度から進めてきている2群の判別分析についての研究を行った。2群の判別分析とは、2つの群のどちらか一方から取り出されたデータを、どちらの群に属していたかを判断する手法である。本研究では、遺伝子データに代表される高次元データは、観測項目たちの中で相関が強いグループを形成することに着目し、共分散構造にブロック構造を想定して判別手法を作った。昨年度、その判別手法の誤判別確率が次元数と標本サイズがともに大きくする漸近枠組みの下で0に収束することを証明したのだが、今年度は数値実験や実データの応用を行った。なお、本研究はスウェーデン王立工科大学数理統計学教室のT. Pavlenko氏と共同で行っている。
次に、高次元データを取り出した母集団分布が正規分布であるかどうかの診断法についての研究を行った。古典的な多変量の歪度の定義は、1次元のもの歪度の2乗をとったものであったことに違和感をもった。そのため、本研究ではベクトルのアダマール積を使って、1次元の歪度の自然な拡張となるような3次モーメントを定義した。この不偏推定量を使い、3次モーメントが0であるかどうかの診断規準を考えた。3次モーメントが0にならないような分布から取り出した乱数を使って診断法の性能を調べた実験を通し、性能が概ねよいことを調べた。本研究内容を日本計算機統計学会第30回シンポジウムで発表した。なお、本研究は滋賀大学の姫野哲人氏と共同で行っている。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
当該課題のひとつである高次元データの共分散行列の構造についての研究は暗礁に乗り上げている。昨年度までに、母集団分布が正規分布を含むような多変量分布の場合に、検定統計量が標本サイズと次元数をともに大きくする漸近枠組みの下で正規分布に分布収束することを証明した。しかし、実用のためには、漸近分散の推定が必要になる。漸近分散の推定量について、いくつか候補を考えたが、その精度がよくなくて、別のアイディアがないか検討中である。
|
Strategy for Future Research Activity |
まず、2群の判別分析についての研究は、現在、数値実験の追加や整理を行っており、その後に論文作成に取り組む予定である。共同研究であるため、相手との情報交換などは基本メールで行っているが、論文作成過程で直に会わないといけない状況になった際は、自分の所属する機関の長期休暇を利用して相手先に赴き、打ち合わせを行う予定である。
正規性の診断法についての研究は、昨年度の内容を少し拡張したものをISI 61st World Statistics Congressにて発表する予定である。そこで得られた知見などを参考に、論文としてまとめて投稿する。
|
Causes of Carryover |
研究の進捗が芳しくなく、当初計画していた研究集会などに参加するのを見合わせたため
|
Expenditure Plan for Carryover Budget |
研究期間を1年延長し、次年度に研究成果を発表する目的で参加する国際研究集会の旅費に充てる。さらに、論文として成果をまとめるのに参考とする書籍を購入する。
|
Research Products
(1 results)