研究課題
シンボリック・データ・アナリシスは、大規模なデータの統合・要約で生ずるシンボリック・データ(ヒストグラム、区間、有限集合などの記述が混在した複雑なデータ)の解析を目的としている。分位数法は、ヒストグラム、区間、有限集合等を、背景となる累積分布関数の利用によって、予め定められた個数の分位数に帰着することが出来る。これによって、与えられたシンボリック・データは、統一的に通常の数値データに変換可能であり、一般的な数量化の方法が実現されることになる。本年度は、以下に述べる成果を得た。1)分位数法による数量化の方法を利用し、シンボリック・データを対象とした、階層的クラスタリングの方法を提案した。2)クラスタリングにおける概念記述の方法を工夫することで、階層的な概念クラスタリングの方法が可能であることを示した。3)分位数法に基づく主成分分析法の一般化として、データ累積法に基づいた主成分分析法を提案した。この方法を用いると、例えば年次毎にまとめた複数のデータを一括して主成分分析に掛けることが可能であり、政府統計を始めとした、多くの年次データの解析に有用なツールを提供する。以上の成果は、主に国際会議において、発表した。上記の成果に加えて、分位数法を利用した教師付き概念クラスタリングに基づいて、新たな判別(識別)の方法と、線形等の特定のモデルを仮定しない、極めて一般的な回帰モデルを構成可能とする知見を得ている。
2: おおむね順調に進展している
シンボリック・データ・アナリシスの方法として、分位数法とよぶ数量化の方法を提案し、多くの多変量解析法の一般化を行っている。代表的な解析法である、主成分分析法やクラスター分析法に対して、既に成果を公表しており、今後引き続き新たな方法の開発とともに、成果公表に努力したい。
1)データ累積法に基づく主成分分析法の論文誌への投稿。2)階層的な概念クラスタリング法の論文誌への投稿。3)教師付き概念クラスタリングに基づく、識別法および回帰モデルの確立。以上を、24年度の目標としたい。
すべて 2011 その他
すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (4件) 備考 (1件)
Far East Journal of Theoretical Statistics
巻: Vol.37 No.2 ページ: 125-143
http://www.csm.ia.dendai.ac.jp