研究実績の概要 |
多変量関数データを特徴量に持つ対象のクラスタリングを行う際に,クラスター構造に影響を与える変数,もしくは,影響を与える領域を特定できる方法として,FPCK法が提案されている(Yamamoto, 2012, Adv Data Anal Cassif).また,FPCK法と相補的な方法として FFKM法が開発されている(Yamamoto and Terada, 2014, Comput Stat Data An).これらの方法は,単純に次元縮小後にクラスタリングを行ういわゆるタンデムな方法よりも,真のクラスター構造を正しく推定できることが知られている.しかし,FPCK法やFFKM法を含む多くのクラスタリング法において,データにある種の構造(disturbing structure)が存在する場合,クラスター構造を正しく推定することができない.そこで,そのような構造を定式化し,データの構造に合わせて柔軟なモデリングが可能なクラスタリング法(FGRC法)を開発した(Yamamoto and Hwang, in press, J Classif). また,多変量関数データの次元縮小法としては,関数主成分分析(FPCA)法および関数多群正準相関分析(FMCCA)法が有用であるが,それぞれに一長一短がある.そこで,FPCA法とFMCCA法を組み合わせて,分析者がより柔軟に次元縮小を行うことが可能な方法を開発した(Choi, Hwang, Yamamoto, et al., in press, Psychometrika). さらに,上記の関数データに対する次元縮小とクラスタリングの同時分析法を発展させ,画像データやSNPデータなど,高次元2値データを特徴量とする対象のクラスタリング法を開発した(Yamamoto and Hayashi, 2015, Pattern Recogn).
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
開発した多変量関数データに対するクラスタリング法についてまとめた論文が,分類の専門誌に採択された(Yamamoto and Hwang, in press, J Classif).本方法によって,既存方法よりも柔軟に時間・空間依存性を持つ多変量関数データのクラスタリングと次元縮小を同時に行うことが可能となった.この方法によって,経時的に測定されるfMRIデータなどのクラスタリングを柔軟に行うことが可能である.また,多変量関数データと予後因子を同時に利用することによって,臨床バイオマーカーの探索を目的とすることが本研究の大きな目的の1つである.そのための方法として,臨床的アウトカムと関連するクラスター構造を推定する方法を提案し,関連する学会(International Meeting of Psychometric Society,日本計算機統計学会国際シンポジウムなど)で発表を行った.現在は,開発手法についてまとめた論文を投稿中である(Yamamoto, Kawaguchi, and Hwang, submitted).
|