研究課題/領域番号 |
17K12648
|
研究機関 | 岡山大学 |
研究代表者 |
山本 倫生 岡山大学, 環境生命科学研究科, 准教授 (50721396)
|
研究期間 (年度) |
2017-04-01 – 2020-03-31
|
キーワード | クラスタリング / 次元縮小 / 判別分析 |
研究実績の概要 |
複数の目的変数の特徴を反映したクラスター構造の予測を説明変数によって行う際には,従来はまずは目的変数に対するクラスタリングを行い,次に得られたクラスターを真のラベルとして説明変数による予測式の推定を行っていた。本研究ではこのような逐次的な方法ではなく,目的変数のクラスター構造の探索と説明変数によるラベルの予測を同時に行う方法を提案した。具体的には,クラスタリングと予測に関する損失関数の凸結合によって構成される新たな損失関数を導入し,さらに,説明変数に対する重み係数も含めることで,クラスターの予測に影響を与える因子の特定を試みた。 提案方法ではクラスター中心集合と重み係数行列を同時に推定する必要があるが,以前開発した Yamamoto & Hwang (2014, Behaviormetrika) の推定方法を参考に,固有値分解とK-meansアルゴリズムを組み合わせた推定アルゴリズムを開発した。 また,クラスタリングの統計的性質として,損失関数の一致性およびパラメータ(クラスター中心集合,重み係数行列)の推定量の一致性を検討した。提案手法の損失関数は,Reduced K-means (RKM) 法の特殊な形として表現できることから,RKM法における証明方法を参考に,損失関数の一致性およびパラメータの推定量の一致性を示した。 開発した手法の性能を検討するために,目的変数の真のクラスター構造が説明変数によって予測可能である場合を想定したシミュレーションを実施した。その結果,既存のアプローチに比べて提案手法がより正確に真のクラスター構造を再現でき,かつ,得られたクラスター構造が説明変数によって予測可能であることを確認した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
研究実施計画として想定していた通り,目的変数のクラスター構造の探索と説明変数によるラベルの予測の同時分析法を定式化し,パラメータ推定のための最適化アルゴリズムの開発および推定量の統計的性質の検討を行った。また,提案手法の性能の検討のためのシミュレーションを計画通り実施し,既存手法よりもよい性能を持つことが示された。しかし,提案手法のような2つの損失関数の凸結合を損失関数とするアプローチ以外にも,部分最小二乗回帰を応用した方法によっても同様の目的を達成することが可能であることが判明した。そのため,現在は新たな方法の定式化について検討し,1つ目の提案手法との性能の違いについて検討している。 また,今年度は所属組織の変更等,環境の変化により,当初予定していた各学会での発表およびそこでのフィードバックの検討は予定よりも少なくせざるをえなかった。
|
今後の研究の推進方策 |
まずは上記の部分最小二乗回帰を応用した新たな手法についての統計的性質を検討する。さらに,当初の提案手法との性質の比較のためのシミュレーションを実施する。なお,両手法ともに,実行の際にはクラスター数とその他の制御パラメータの値を事前に決定する必要がある。そのための方法として,既存のClustering Stabilityを今回の目的(クラスタリングと予測の同時分析)に適する形に拡張したモデル選択方法を開発する。
|