研究概要 |
本研究では,可視化モデリングにおける明示性の基準を(1)次元圧縮の線形性,(2)クラスタ間の分離性,(3)クラスタと射影軸との平行性と定義し,これまでに,(1)を次元圧縮へ,また(3)をクラスタリングに取り入れる可視化モデリング手法を提案してきた. 本年度では,(2)を次元圧縮の基準とした可視化モデリング手法を提案した.本手法は,多次元王規分布を規定関数とするEMアルゴリズムによるクラスタリング手法(EMC)と,クラスタ内のデータ分布を射影軸に対して平行に分布させる次元圧縮法とを組み合わせたものである.さらに、データの特徴に応じてKernel-FCMを利用することや,次元圧縮法に対して,重みつきのクラスタ間距離を利用することも併せて提案した. 数値実験によりEMCおよびKernel-FCMが,従来のFCMと比較し,データ分布を捉えた適切なクラスタを構築できることを示し,射影軸に対してクラスタが平行に分布する可視化モデルが得られることを示した.これは,前年度開発したFuzzy Multiple Discriminant Analysisによる次元圧縮では得られない結果である. この成果を学術論文としてまとめ,昨年度までの研究成果とあわせて博士論文としてまとめた. また本研究により,明示性はデータを解釈する人に依存することを再確認し,人間の主観を反映した多変量データの可視化に取り込む研究を展開した.言葉によって表現される,ユーザのデータに対する主観的知識を可視化モデルにする手法を提案した.提案手法では,ユーザがデータの特徴を示すと思う言葉に関連すると判断した変数に対して主成分分析/判別分析を適用し可視化モデルを構築する.本手法を十種競技のデータに対して適用し,ユーザによる変数選択が有効なデータ解釈の手段の一つになりうることを確認した.この成果を国際会議にて発表し,学術論文としてまとめた.
|