Establishing the foundation of aggregated symbolic data analysis
Project/Area Number |
26330054
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Research Field |
Statistical science
|
Research Institution | The Institute of Statistical Mathematics |
Principal Investigator |
Nakano Junji 統計数理研究所, モデリング研究系, 教授 (60136281)
|
Research Collaborator |
SHIMIZU Nobuo
YAMAMOTO Yoshikazu
|
Project Period (FY) |
2014-04-01 – 2019-03-31
|
Project Status |
Completed (Fiscal Year 2018)
|
Budget Amount *help |
¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2017: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Fiscal Year 2016: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Fiscal Year 2015: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
Fiscal Year 2014: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
|
Keywords | カテゴリー変数 / シンボリックデータ / 分類 / 連続変数 / 相関関係 / 非類似度 / 可視化 / クラスター分析 |
Outline of Final Research Achievements |
When we have a large amount of individual data, we are often interested in meaningful groups of individuals. For example, when we have data such as body length, weight, color and species of several thousand birds, we hope to know the characteristics of species as groups of individual birds. Characteristics of the group may be represented by small number of descriptive statistics. We call them symbolic data. We consider the case where each individual data has continuous variables and categorical variables. Categorical variables are expressed by dummy variables. Such dummy variables and continuous variables can be summarized by up to second order moment statistics, which are called aggregated symbolic data. We proposed dissimilarities and the visualization method among aggregated symbolic data.
|
Academic Significance and Societal Importance of the Research Achievements |
現在、データ量が爆発的に増加しており、その解析のために新しい手法が必要となっている。個々のデータではなくデータのグループを対象とするシンボリックデータ解析は、超大量データを縮約し、人間が現実的に扱い理解することを可能にする手法である。最近は実用的で強力だが人間が解釈・理解することの難しい手法も機械学習や人工知能の分野で多く開発されている。ただ、社会的にも学術的にも、現象の本質を人間が理解することは重要である。コンピュータ、通信、センサーなどの技術の発展により、観測されるデータの量は莫大になっている。そのようなデータを人間に近づけるために集約的シンボリックデータ解析は有用である。
|
Report
(6 results)
Research Products
(19 results)
-
-
-
[Journal Article] 18-year variability of ultraviolet radiation penetration in the mid-latitude coastal waters of the western boundary Pacific2015
Author(s)
Kuwahara, V., Nozaki, S., Nakano, J., Toda. T., Kikuchi, T. and Taguchi, S.
-
Journal Title
Estuarine, Coastal and Shelf Science
Volume: 160
Pages: 1-9
DOI
Related Report
Peer Reviewed
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-