2011 Fiscal Year Annual Research Report
分位数法に基づくシンボリック・データ・アナリシスの提案
Project/Area Number |
22500138
|
Research Institution | Tokyo Denki University |
Principal Investigator |
市野 学 東京電機大学, 理工学部, 教授 (40057245)
|
Keywords | データマイニング / シンボリック・データ・アナリシス / 分位数 / 主成分分析 / 概念クラスタリング / データ累積 / 年次データの解析 / 教師付き概念クラスタリング |
Research Abstract |
シンボリック・データ・アナリシスは、大規模なデータの統合・要約で生ずるシンボリック・データ(ヒストグラム、区間、有限集合などの記述が混在した複雑なデータ)の解析を目的としている。分位数法は、ヒストグラム、区間、有限集合等を、背景となる累積分布関数の利用によって、予め定められた個数の分位数に帰着することが出来る。これによって、与えられたシンボリック・データは、統一的に通常の数値データに変換可能であり、一般的な数量化の方法が実現されることになる。本年度は、以下に述べる成果を得た。 1)分位数法による数量化の方法を利用し、シンボリック・データを対象とした、階層的クラスタリングの方法を提案した。 2)クラスタリングにおける概念記述の方法を工夫することで、階層的な概念クラスタリングの方法が可能であることを示した。 3)分位数法に基づく主成分分析法の一般化として、データ累積法に基づいた主成分分析法を提案した。この方法を用いると、例えば年次毎にまとめた複数のデータを一括して主成分分析に掛けることが可能であり、政府統計を始めとした、多くの年次データの解析に有用なツールを提供する。 以上の成果は、主に国際会議において、発表した。 上記の成果に加えて、分位数法を利用した教師付き概念クラスタリングに基づいて、新たな判別(識別)の方法と、線形等の特定のモデルを仮定しない、極めて一般的な回帰モデルを構成可能とする知見を得ている。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
シンボリック・データ・アナリシスの方法として、分位数法とよぶ数量化の方法を提案し、多くの多変量解析法の一般化を行っている。代表的な解析法である、主成分分析法やクラスター分析法に対して、既に成果を公表しており、今後引き続き新たな方法の開発とともに、成果公表に努力したい。
|
Strategy for Future Research Activity |
1)データ累積法に基づく主成分分析法の論文誌への投稿。 2)階層的な概念クラスタリング法の論文誌への投稿。 3)教師付き概念クラスタリングに基づく、識別法および回帰モデルの確立。 以上を、24年度の目標としたい。
|
Research Products
(6 results)