High-Dimension Low-Sample-Size Big Data Analysis by Higher Order Metrics
Project/Area Number |
17K00043
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Research Field |
Statistical science
|
Research Institution | University of Tsukuba |
Principal Investigator |
Sato-Ilic Mika 筑波大学, システム情報系, 教授 (60269214)
|
Co-Investigator(Kenkyū-buntansha) |
青嶋 誠 筑波大学, 数理物質系, 教授 (90246679)
清水 信夫 統計数理研究所, データ科学研究系, 助教 (00332130)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Project Status |
Completed (Fiscal Year 2019)
|
Budget Amount *help |
¥4,550,000 (Direct Cost: ¥3,500,000、Indirect Cost: ¥1,050,000)
Fiscal Year 2019: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2018: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
Fiscal Year 2017: ¥1,950,000 (Direct Cost: ¥1,500,000、Indirect Cost: ¥450,000)
|
Keywords | 分類 / ビックデータ / 尺度構成 / Fuzzy Clustering / Scales of Clusters / Fuzzy Clustering Models / Regression Analysis / HDLSS Data / Data Fusion / Categorical Data / Geometrical Data / Big Data Analysis / 統計科学 / 高次計量 / クラスタリング |
Outline of Final Research Achievements |
It has been theoretically clarified that conventional statistical science-based methods cannot be used to analyze high-dimensional small sample size big data. Therefore, in this research, for the analysis of this data, we developed an appropriate metric in a common metric space that can measure multiple data at once, and developed a cluster metric model based on it. Furthermore, we evaluated the various performances of the developed method, applied it to various data, and evaluated its applicability.
|
Academic Significance and Societal Importance of the Research Achievements |
一般に、高次元小標本型データが複数得られた場合、典型的な高次元小標本型ビックデータとなる。これらの複数のデータを同時に解析するための新たな方法の開発に取り組んだ。具体的には、複数のデータを通じて共通に得られるクラスターを共通尺度とする計量とそれを利用したモデルの開発を行った。これにより、高次元のデータの動的変動をより低次元の空間で説明することが可能となった。また、共通の部分ベクトル空間への射影を用いることで、種々のデータ構造を比較可能とし、かつ低次元空間に縮約可能とするモデルの開発も行った。この方法は、ビックデータ解析で問題とされる種々のデータの融合法としても有効であることを示した。
|
Report
(4 results)
Research Products
(37 results)
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
[Presentation] A Fuzzy Clustering based Data Fusion Method2017
Author(s)
M. Sato-Ilic
Organizer
11th International Conference on Computational and Financial Econometrics and 10th International Conference of the ERCIM Working Group on Computational and Methodological Statistics
Related Report
Int'l Joint Research / Invited
-
-
-
-
-
-