Research Abstract |
本年度は,様々な関連性データのうち,大規模かつ複雑な性質をもつデータに注目して,シンボリックデータ解析によるアプローチを中心に,これらのデータに対するいくつかの新たな分析法の提案を行った.ここで,シンボリックデータとは,データの表現を一般化した概念である.従来のデータは,データ点が実数空間の一点で表現されるのに対して,シンボリックデータは,データが区間やヒストグラムなどシンボリックオブジェクトによって表現される.そして,シンボリックデータ解析は,シンボリックデータに対する解析手法であり,従来のデータ解析手法をシンボリックデータに対するものへと拡張したものである. 本研究では,関連性データが,区間値データ,分布値データ,符号付きデータ,四本値データ,多元データで与えられた場合における,新たな手法を提案した.具体的には以下のテーマについて研究を行った. ○区間値で記述された分割表に対する対応分析の提案 ○Mixed Feature-typeシンボリックデータに対するクラスタリングの提案 ○分布値非類似性データに対する多次元尺度構成法の提案 ○四本値データ間の類似度の提案 ○符号付きグラフを用いた重複クラスタリング法の提案 ○3元データに対する部分空間クラスタリングの提案 その成果は,CAS2011,IASC-ARS2011,The 4^<th> Japan-German Symposium on Classification,日本分類学会第30回研究報告会など国内外の学会で発表した.
|