2008 Fiscal Year Annual Research Report
特異な統計モデルに対するリサンプリング法の適用に関する研究
Project/Area Number |
17500177
|
Research Institution | Hokkaido University |
Principal Investigator |
今井 英幸 Hokkaido University, 大学院・情報科学研究科, 准教授 (10213216)
|
Co-Investigator(Kenkyū-buntansha) |
佐藤 義治 北海道大学, 大学院・情報科学研究科, 教授 (80091461)
工藤 峰一 北海道大学, 大学院・情報科学研究科, 教授 (60205101)
種市 信裕 鹿児島大学, 理学部, 教授 (00207200)
村井 哲也 北海道大学, 大学院・情報科学研究科, 准教授 (90201805)
櫻井 裕仁 北海道大学, 大学院・情報科学研究科, 助教 (00333625)
|
Keywords | 正則化 / 判別分析 / 誤判別率 / 最近隣法 / 機械学習 / バイアス補正 |
Research Abstract |
1.正則化判別分析の誤判別率に関する研究従来の判別手法では十分な判別性能が得られない特異、または特異に近い統計モデルに対しても適用可能な正則化判別分析の誤判別率に関する検討を行った。数値実験により正規母集団に対しては既存手法に対して誤判別率が小さくなることを示した。また、正則化判別分析が、母集団の形状に対してどのような影響を受けるかを検討した。代表的な非正規性の尺度として歪度と尖度を用い、これらを変化させた非正規母集団からのサンプルによる誤判別率を数値的に求め、判別性能の比較を行った結果、提案手法である情報量規準を用いた。正則化判別分析を用いることにより、母集団が正規分布の仮定を満たさない場合でも、既在手法と比較して誤判別率を小さく抑えることが観察された。一方で、既存手法の多くは母集団の形状に敏感であり、仮定と合致しない判別手法を用いた場合には、誤判別率が著しく悪くなるこども観察された。 2.最近隣法におけるブートストラップ法の適用に関する研究パターン認識や機械学習において用いられる際近隣法にブートストラップ法を用いるための基礎的な検討を行った。データマイニングなどで分析対象となるデータは特徴数に対してサンプルサイズが小さく、疎なデータ構造をもつものが多い。こうした場合には、データの距離構造をなるべく保存したまま、低次元空間に射影して分析することにより、計算量を削減する効果が期待できる。そのため、射影されたデータ間の距離の分布をリサンプリングにより推定し、その分布に基づいて際近隣を精度よく求める手法を提案した。また、極値分布の性質を用いて推定のバイアスを補正することで、推定精度が向上することが数値実験により示された。
|