• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2018 Fiscal Year Research-status Report

High-Dimension Low-Sample-Size Big Data Analysis by Higher Order Metrics

Research Project

Project/Area Number 17K00043
Research InstitutionUniversity of Tsukuba

Principal Investigator

イリチュ 美佳 (佐藤美佳)  筑波大学, システム情報系, 教授 (60269214)

Co-Investigator(Kenkyū-buntansha) 青嶋 誠  筑波大学, 数理物質系, 教授 (90246679)
清水 信夫  統計数理研究所, データ科学研究系, 助教 (00332130)
Project Period (FY) 2017-04-01 – 2020-03-31
KeywordsFuzzy Clustering / Scales of Clusters / Regression Analysis / HDLSS Data / Data Fusion / Categorical Data / Geometrical Data / Fuzzy Clustering Models
Outline of Annual Research Achievements

高次元小標本型ビックデータの解析法として、高次計量に基づく解析法を開発し、社会的応用を図ることが本研究の主目的である。本年度は、昨年度に引き続き、高次元小標本型データが複数得られた時に、それらを同時に解析するための新たな方法の開発に取り組むと共に、質の異なるデータが複数得られた場合の計量を、分類構造を用いることにより、適切に融合し、複数のデータを通じて分類結果を同定する方法の開発を行った。この研究は、データの性質を考慮した計量をクラスタリング結果から得られた分類構造を用いて定義し、データを測りなおす(再計量する)ことで、適切な融合を図る手法である。数値例より、一定の妥当性を示した。この融合法はビックデータ解析で問題とされる種々のデータの融合法としても有効であると考えられる。また、モデルに基づくクラスタリングとクラスタリングに基づくモデルの二つの概念を定義し、ファジィクラスタリングモデルが類似度データの多様性に対応するように解空間の多様性を取り入れている点や、解の精度向上を目指してクラスターを異なるデータの共通尺度とする多次元クラスター尺度構成法の位置付けを明確にする研究を進めた。この研究成果を、米国、シカゴにて開催されたCAS2018国際会議で発表し、発表した論文" Homogeneous Cluster Analysis"に対して、2nd Runner-Up Theoretical Paper Awardを受賞した。さらに、SCI国際会議にて、" Cluster-Scaled Intelligent Data Analysis”と題して基調講演を行うと共に、COMPSTAT国際会議での招待研究発表、KES-IDT国際会議での発表と論文の出版、統計関連学会連合大会やファジィシステムシンポジウム等の研究発表を通じて、これらの手法に対する理論的、応用的研究成果を発表した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

本年度は、異なる性質のデータの融合とクラスターの同定を目的として、それに適用可能なクラスター尺度に基づく計量とモデルの開発が目的であったが、その目的を達成しているため、おおむね順調に進展しているといえる。
特に、異なる性質の複数のデータの性質を数理的に考慮した上で、データに共通にある潜在的尺度をクラスター構造から捉え、それにより複数のデータを通じてクラスターを同定し得る方法の開発を行った。

Strategy for Future Research Activity

開発した計量の高次計量モデルへの応用と、それらの理論的検証を進める必要がある。さらに、開発したモデルを種々のビックデータに適用し、論文にまとめ公表する必要がある。

  • Research Products

    (13 results)

All 2018

All Journal Article (6 results) (of which Peer Reviewed: 3 results,  Open Access: 3 results) Presentation (7 results) (of which Int'l Joint Research: 5 results,  Invited: 2 results)

  • [Journal Article] Homogeneous Cluster Analysis2018

    • Author(s)
      M. Sato-Ilic
    • Journal Title

      Procedia Computer Sciences, Elsevier

      Volume: 140 Pages: 269-275

    • DOI

      10.1016/j.procs.2018.10.320

    • Peer Reviewed / Open Access
  • [Journal Article] Cluster-Scaled Regression Analysis for High-Dimension and Low-Sample Size Data2018

    • Author(s)
      M. Sato-Ilic
    • Journal Title

      Advances in Smart Systems Research

      Volume: 7 Pages: 1-10

    • Peer Reviewed
  • [Journal Article] 高次元小標本データに対するT-ノルムに基づくマルチレイヤークラスタリング2018

    • Author(s)
      伊藤佳輝, 元田卓, 佐藤美佳
    • Journal Title

      第34回ファジィシステムシンポジウム講演論文集

      Volume: - Pages: 480-485

  • [Journal Article] Two-sample tests for high-dimension, strongly spiked eigenvalue models2018

    • Author(s)
      M. Aoshima, K. Yata
    • Journal Title

      Statistica Sinica

      Volume: 28 Pages: 43-62

    • DOI

      10.5705/ss.202016.0063

    • Open Access
  • [Journal Article] A survey of high dimension low sample size asymptotics2018

    • Author(s)
      M. Aoshima, D. Shen, H. Shen, K. Yata, Y. Zhou, J.S. Marron
    • Journal Title

      Aust. N. Z. J. Stat.

      Volume: 60 Pages: 4-19

    • DOI

      10.1111/anzs.12212

    • Open Access
  • [Journal Article] 集約的シンボリックデータのカイ2乗統計量を用いた非類似度とその不動産情報データへの適用2018

    • Author(s)
      清水信夫, 中野純司, 山本由和
    • Journal Title

      統計数理

      Volume: 66 Pages: 279-294

    • Peer Reviewed
  • [Presentation] Cluster-Scaled Intelligent Data Analysis(基調講演)2018

    • Author(s)
      M. Sato-Ilic
    • Organizer
      3rd International Conference on Smart Computing & Informatics
    • Int'l Joint Research / Invited
  • [Presentation] Soft Clustering-based Models2018

    • Author(s)
      M.Sato-Ilic
    • Organizer
      23rd International Conference on Computattional Statistics (COMPSTAT 2018)
    • Int'l Joint Research / Invited
  • [Presentation] Homogeneous Cluster Analysis2018

    • Author(s)
      M.Sato-Ilic
    • Organizer
      Complex Adaptive Systems 2018
    • Int'l Joint Research
  • [Presentation] Cluster-Scaled Regression Analysis for High-Dimension and Low-Sample Size Data2018

    • Author(s)
      M. Sato-Ilic
    • Organizer
      Knowledge-Based and Intelligent Information & Engineering Systems - Intelligent Decision Technologies
    • Int'l Joint Research
  • [Presentation] 高次元小標本データに対するT-ノルムに基づくマルチレイヤークラスタリング2018

    • Author(s)
      伊藤佳輝, 元田卓, 佐藤美佳
    • Organizer
      第34回ファジィシステムシンポジウム
  • [Presentation] 分類構造に基づく異常検知手法2018

    • Author(s)
      小林大悟, 佐藤美佳
    • Organizer
      2018年度統計関連学会連合大会
  • [Presentation] Dissimilarity between aggregated symbolic data using chi-squared statistics2018

    • Author(s)
      N. Shimizu, J. Nakano, Y. Yamamoto
    • Organizer
      2018 Workshop in Symbolic Data Analysis
    • Int'l Joint Research

URL: 

Published: 2019-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi