研究概要 |
シンボリック・データ・アナリシスは、膨大なデータの統合・要約で生ずる、シンボリック・データ(ヒストグラム、区間、有限集合などの記述による複雑なデータ)の解析を目的としている。本研究では、各種の異なる記述に対して、適当な累積分布関数を導入して予め定めた数の分位数の組に変換することで、統一的な数量化を実現し、シンボリック・データに対して伝統的な多変量解析の方法を一般化する、各種の方法を提案している。既に、(Nオブジェクト)x(d特徴)のシンボリック・データ・テーブルを(Nx(m+1)サブオブジェクト)x(d特徴)の数値データ・テーブルに変換して主成分分析を可能とする方法を、論文誌Statistical Anlysis and Data Mining (2011)に発表している。この方法をさらに一般化したデータ累積法は、期間毎にまとめられた政府統計等の複数データ・テーブルを、一括して主成分分析に掛ける手段を与える。例えば、過去30年間における我が国の実質GDPの変化およびその特性を、直感的に理解できる形式で因子平面上に再現可能である。このような成果の一部を、国際会議COMSTAT2012(August 27-31, Limassol,Cyprus)において報告した。
|