2018 Fiscal Year Research-status Report
High-Dimension Low-Sample-Size Big Data Analysis by Higher Order Metrics
Project/Area Number |
17K00043
|
Research Institution | University of Tsukuba |
Principal Investigator |
イリチュ 美佳 (佐藤美佳) 筑波大学, システム情報系, 教授 (60269214)
|
Co-Investigator(Kenkyū-buntansha) |
青嶋 誠 筑波大学, 数理物質系, 教授 (90246679)
清水 信夫 統計数理研究所, データ科学研究系, 助教 (00332130)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | Fuzzy Clustering / Scales of Clusters / Regression Analysis / HDLSS Data / Data Fusion / Categorical Data / Geometrical Data / Fuzzy Clustering Models |
Outline of Annual Research Achievements |
高次元小標本型ビックデータの解析法として、高次計量に基づく解析法を開発し、社会的応用を図ることが本研究の主目的である。本年度は、昨年度に引き続き、高次元小標本型データが複数得られた時に、それらを同時に解析するための新たな方法の開発に取り組むと共に、質の異なるデータが複数得られた場合の計量を、分類構造を用いることにより、適切に融合し、複数のデータを通じて分類結果を同定する方法の開発を行った。この研究は、データの性質を考慮した計量をクラスタリング結果から得られた分類構造を用いて定義し、データを測りなおす(再計量する)ことで、適切な融合を図る手法である。数値例より、一定の妥当性を示した。この融合法はビックデータ解析で問題とされる種々のデータの融合法としても有効であると考えられる。また、モデルに基づくクラスタリングとクラスタリングに基づくモデルの二つの概念を定義し、ファジィクラスタリングモデルが類似度データの多様性に対応するように解空間の多様性を取り入れている点や、解の精度向上を目指してクラスターを異なるデータの共通尺度とする多次元クラスター尺度構成法の位置付けを明確にする研究を進めた。この研究成果を、米国、シカゴにて開催されたCAS2018国際会議で発表し、発表した論文" Homogeneous Cluster Analysis"に対して、2nd Runner-Up Theoretical Paper Awardを受賞した。さらに、SCI国際会議にて、" Cluster-Scaled Intelligent Data Analysis”と題して基調講演を行うと共に、COMPSTAT国際会議での招待研究発表、KES-IDT国際会議での発表と論文の出版、統計関連学会連合大会やファジィシステムシンポジウム等の研究発表を通じて、これらの手法に対する理論的、応用的研究成果を発表した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年度は、異なる性質のデータの融合とクラスターの同定を目的として、それに適用可能なクラスター尺度に基づく計量とモデルの開発が目的であったが、その目的を達成しているため、おおむね順調に進展しているといえる。 特に、異なる性質の複数のデータの性質を数理的に考慮した上で、データに共通にある潜在的尺度をクラスター構造から捉え、それにより複数のデータを通じてクラスターを同定し得る方法の開発を行った。
|
Strategy for Future Research Activity |
開発した計量の高次計量モデルへの応用と、それらの理論的検証を進める必要がある。さらに、開発したモデルを種々のビックデータに適用し、論文にまとめ公表する必要がある。
|