2001 Fiscal Year Annual Research Report
多様性を含む大規模データからの情報抽出のための統計モデルの開発
Project/Area Number |
13680507
|
Research Institution | Gunma University |
Principal Investigator |
関 庸一 群馬大学, 工学部, 教授 (90196949)
|
Keywords | 樹形回帰分析 / データマイニング / MDL基準 / 交互作用効果 / Nearest Neighbor / ノンパラメトリック回帰 / POSデータ |
Research Abstract |
3年間の研究の初年度は、以下の一般化について理論的な検討を進め、以下のようなモデルを開発、提案し、解析手法のプロトタイププログラムを統計解析言語S上で作成・評価した。 また、応用事例の作成として、日本オペレーションズ・リサーチ学会マーケティングエンジニアリング部会他が主催したデータ解析コンペティションに参加し、ID付きPOSデータを対象とした解析を行った。この研究成果は技能賞を受賞した。 (1)樹形回帰モデルの線形項の整理手法の開発 線形項採用の基本アルゴリズム(関&筒井98)における、変数選択手法について再検討した。また、Greedyに木を成長させた後に、作成された木の線形項や枝を計画行列レベルで再検討し、従来の変数選択基準の適用により、木の形状を維持したまま樹形モデルを評価整理する方法を検討提案した。今後、その評価に基づき、自動的に刈り取りを行うプログラムを作成することが課題となる。 (2)Nearest Neighbor型ノンパラメトリック回帰の距離定義の拡張 参照データセット中に適切なクラスタ中心を探索し、それを中心とした局所的な距離定義を最適化することにより、データセット中の多様性を表現できる統計モデルの推定算法について検討した。 (3)混合効果モデルによる異常劣化モニタリング法 オンラインで収集される劣化データに対して、混合効果モデルにより予測モデルを作成し、異常な劣化を発見するモニタリング法を検討、提案した。
|