2019 Fiscal Year Final Research Report
High-Dimension Low-Sample-Size Big Data Analysis by Higher Order Metrics
Project/Area Number |
17K00043
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Research Field |
Statistical science
|
Research Institution | University of Tsukuba |
Principal Investigator |
Sato-Ilic Mika (佐藤美佳) 筑波大学, システム情報系, 教授 (60269214)
|
Co-Investigator(Kenkyū-buntansha) |
青嶋 誠 筑波大学, 数理物質系, 教授 (90246679)
清水 信夫 統計数理研究所, データ科学研究系, 助教 (00332130)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | 分類 / ビックデータ / 尺度構成 |
Outline of Final Research Achievements |
It has been theoretically clarified that conventional statistical science-based methods cannot be used to analyze high-dimensional small sample size big data. Therefore, in this research, for the analysis of this data, we developed an appropriate metric in a common metric space that can measure multiple data at once, and developed a cluster metric model based on it. Furthermore, we evaluated the various performances of the developed method, applied it to various data, and evaluated its applicability.
|
Free Research Field |
統計科学
|
Academic Significance and Societal Importance of the Research Achievements |
一般に、高次元小標本型データが複数得られた場合、典型的な高次元小標本型ビックデータとなる。これらの複数のデータを同時に解析するための新たな方法の開発に取り組んだ。具体的には、複数のデータを通じて共通に得られるクラスターを共通尺度とする計量とそれを利用したモデルの開発を行った。これにより、高次元のデータの動的変動をより低次元の空間で説明することが可能となった。また、共通の部分ベクトル空間への射影を用いることで、種々のデータ構造を比較可能とし、かつ低次元空間に縮約可能とするモデルの開発も行った。この方法は、ビックデータ解析で問題とされる種々のデータの融合法としても有効であることを示した。
|