• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2011 Fiscal Year Research-status Report

高次シンボリックデータに対するクラスターワイズ手法の開発とその応用

Research Project

Project/Area Number 23500343
Research InstitutionUniversity of Tsukuba

Principal Investigator

イリチュ 美佳 (佐藤 美佳)  筑波大学, システム情報系, 准教授 (60269214)

Co-Investigator(Kenkyū-buntansha) 青嶋 誠  筑波大学, 数理物質科学研究科(系), 教授 (90246679)
清水 信夫  統計数理研究所, データ科学研究系, 助教 (00332130)
Project Period (FY) 2011-04-28 – 2014-03-31
Keywordsシンボリックデータ / シンボリックデータ解析 / 高次元小標本データ / 主成分分析 / ファジィクラスタリング
Research Abstract

高次元小標本のシンボリックデータに対する解析手法を開発し、開発した手法の各種性能を精査するとともに、実用化を図った。従来、得られたデータの次元が標本数に比べて遥かに大きいデータ(高次元小標本データ)に対する解析が問題とされている。このデータに、既存の統計手法を適用すると、いわゆる"次元の呪い"により、有効な結果が得られないという問題がある。この問題を解決するために、様々な解析法が提案されている。しかし、これらの解析法は、従来のデータの型に対する手法にとどまり、シンボリックデータに対しては、未だ開発されていない。そこで、本研究では、より多様なデータを扱うことを可能とするシンボリックデータの特性を活かし、高次元小標本シンボリックデータに対する新たな知識発見手法を提案し、実用化に向けた性能評価を行うことを目的として実施されたものである。これらの研究の具体的内容は、これまで、高次元小標本データでは、固有値の一致性の問題から解が得られないという問題について、クラスター構造間の相関を導入することにより、この問題を解決したことにある。また、クラスター構造の類似性による変数選択基準を提案し、それにより、変数の部分空間によるクラスタリング手法を開発したことにある。これまでの変数の扱いは、変数のカテゴリーという考えが含まれていない。その主な原因は、従来のデータ解析においては、変数をベクトル空間の次元とみなして数学的解析を行ってきたことにある。しかし、次元が非常に大きい場合には、それをカテゴリー化して次元を縮約する操作をする必要がある。そこで、シンボリックデータの考えを導入し、これまで単一の次元として考えていた解析に、カテゴリー(シンボル)としての次元表現を取り入れ、その解析法を開発した。これらの研究結果を各種の論文で発表した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

高次元小標本シンボリックデータに対するファジィクラスタリング手法を提案し、次元縮約によりその視覚化を図ることが本年度の主目的であった。これについて、新たな相関構造を取り入れたファジィクラスタリング手法、及び主成分分析法を提案し、高次元小標本データに対する問題を解決し、当初の計画を達成している。さらに、これらの方法について、遺伝子発現データ等の数値例により、性能を評価した。シンボリックデータの型の中では、主に、区間データを用いて解析を実施した。

Strategy for Future Research Activity

前年度、開発した手法に基づいて、他のシンボリックデータ(モーダルデータなど)に対する解析手法を開発する。新たに提案した相関構造の数学的性質を解明する。クラスタリング手法において、部分空間選択法を導入した場合の性能評価を行う。各種の高次元小標本データに適用し、性能を評価することにより、有効性を検証する。

Expenditure Plans for the Next FY Research Funding

前年度に得られた結果を基にして、提案した手法に、高次元小標本シンボリックデータを適用することにより、評価を行う。具体的には、各種のシンボリックデータに適用可能なように提案した手法のプログラムを作成する。また、人工データを用いて、シミュレーションを行い、提案手法の性能を数値実験により検証する。脳波データや遺伝子データに対する有効性を検証する。成果を随時、国内外の論文誌に発表する。また、国際会議で随時発表を行う。このため、主として、プログラム作成、検証、成果発表に研究費を使用する計画である。また、昨年度の繰越金(2173円)は、予想よりも安価で購入できたことにより発生したものであるが、今年度は、この繰越金と合わせて、必要物品の購入をする計画である。

  • Research Products

    (6 results)

All 2012 2011

All Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (4 results)

  • [Journal Article] A Learning Based Self-Organized Additive Fuzzy Clustering Method and Its Application for EEG Data2012

    • Author(s)
      T. Kuwata, M. Sato-Ilic, L.C. Jain
    • Journal Title

      International Journal of Knowledge-Based and Intelligent Engineering Systems

      Volume: 16 Pages: 69-78

    • DOI

      10.3233/KES-2012-0238

    • Peer Reviewed
  • [Journal Article] Symbolic Clustering with Interval-Valued Data, Complex Adaptive Systems2011

    • Author(s)
      M. Sato-Ilic
    • Journal Title

      Procedia Computer Sciences, Elsevier

      Volume: 6 Pages: 358-363

    • DOI

      10.1016/j.procs.2011.08.066

    • Peer Reviewed
  • [Presentation] Identification of a Classifier on Subspace of Attributes for Symbolic Data2011

    • Author(s)
      M. Sato-Ilic
    • Organizer
      2011 年度統計関連学会連合大会
    • Place of Presentation
      九州大学(福岡市)
    • Year and Date
      2011年9月5日
  • [Presentation] Clustering High Dimension Low Sample-Size Data with Fuzzy Cluster-based Principal Component Analysis2011

    • Author(s)
      M. Sato-Ilic
    • Organizer
      the 58th ISI World Statistics Congress
    • Place of Presentation
      Dublin Convention Centre(Ireland)
    • Year and Date
      2011年8月23日
  • [Presentation] Application of a Learning-Based Self-Organized Additive Fuzzy Clustering Method Integrated with the COSA Algorithm2011

    • Author(s)
      T. Kuwata and M. Sato-Ilic
    • Organizer
      The 8th International Symposium on Management Engineering
    • Place of Presentation
      Chang Yung-Fa Foundation Hall(Taiwan)
    • Year and Date
      2011年8月22日
  • [Presentation] Intelligent Symbolic Clustering through High Dimensional Space2011

    • Author(s)
      M. Sato-Ilic
    • Organizer
      UPMC Seminar(招待講演)
    • Place of Presentation
      University of Paris(France)
    • Year and Date
      2011年4月8日

URL: 

Published: 2013-07-10  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi