• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2012 年度 実施状況報告書

高次シンボリックデータに対するクラスターワイズ手法の開発とその応用

研究課題

研究課題/領域番号 23500343
研究機関筑波大学

研究代表者

イリチュ 美佳(佐藤美佳)  筑波大学, システム情報系, 教授 (60269214)

研究分担者 青嶋 誠  筑波大学, 数理物質系, 教授 (90246679)
清水 信夫  統計数理研究所, データ科学研究系 計量科学グループ, 助教 (00332130)
キーワードデータマイニング / ファジィクラスタリング / 類似性 / クラスター間相関 / 遺伝子データ
研究概要

高次元小標本データに、既存の統計手法を適用すると、有効な結果が得られないという問題がある。この問題を解決するための基本的な解決法としては、データを何らかの方法で分類して次元を縮小し解析を行うことであるが、本研究では、二つの方法を提案した。
一つは、データの次元(属性)を分類して次元を縮小する方法であり、他方は、元のデータ構造を分類構造へ変換することにより次元の縮小を図る方法である。
昨年度は、第1の方法について、研究を進めたが、本年度は、第2の方法に重点を置き、研究を進めた。
その結果、理論的実績として、ファジィクラスタリング結果から得られる分類構造間の相関は、研究代表者らがすでに提案したファジィ自己類似性の特性を使って説明できることを明らかにした。この特性とは、提案した相関は、データの類似性に存在するノイズを学習して除去し、データの分類による説明力を取り入れることである。また、数値例から、遺伝子に関する実データで、有効な結果を得た。これらの研究成果に対して、米国、ワシントンD.C.において開催された国際会議でBest Theoretical Paper Awardを受賞した。また国際会議KES-IDT2012で基調講演を行い、パリ大学(Department of Databases and Machine Learning, LIP6, University of Paris (UPMC))で招待講演を行った。また、研究結果を各種の論文で発表した。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

昨年度、開発した高次元小標本データに対するクラスター間相関構造を取り入れたファジィクラスタリング手法、及び主成分分析法を更に発展させ、この方法の理論的解明と共に、実用化に向けて、数値解析を行うことが本年度の主目的であった。これについて、理論・応用の両側面から研究を進め、当初の計画を達成した。さらに、これらの方法について、遺伝子発現データ等の数値例により、性能を評価した。

今後の研究の推進方策

本研究で開発した二つの手法のハイブリッド手法を開発する。すなわち、シンボリックデータにより、属性の縮小を図りつつ、データを分類構造へ変換する方法を開発する。前者は、データの外的情報である分類情報の取得に優れ、後者は、データが内在的にもつ分類構造の説明に優れている。これらを合わせることにより、双方の利点を併せ持つ高次元小標本データに対する方法の開発が期待できる。

次年度の研究費の使用計画

「該当なし」

  • 研究成果

    (19件)

すべて 2013 2012 その他

すべて 雑誌論文 (8件) (うち査読あり 8件) 学会発表 (11件) (うち招待講演 4件)

  • [雑誌論文] Two Covariances Harnessing Fuzzy Clustering for Discrimination of Microarray Data2013

    • 著者名/発表者名
      M. Sato-Ilic
    • 雑誌名

      Lecture Notes in Bioinformatics, Springer-Verlag, Berlin Heidelberg (Germany)

      巻: 1 ページ: 158-172

    • 査読あり
  • [雑誌論文] Correlation Tests for High-Dimensional Data using Extended Cross-Data-Matrix Methodology2013

    • 著者名/発表者名
      K. Yata, M. Aoshima
    • 雑誌名

      J. Multivariate Anal.

      巻: 117 ページ: 313-331

    • DOI

      10.1016/j.jmva.2013.03.007

    • 査読あり
  • [雑誌論文] On Fuzzy Clustering based Correlation2012

    • 著者名/発表者名
      M. Sato-Ilic
    • 雑誌名

      Procedia Computer Sciences, Elsevier

      巻: 12 ページ: 230-235

    • DOI

      10.1016/j.procs.2012.09.061

    • 査読あり
  • [雑誌論文] A Structural Analysis based on Similarity between Fuzzy Clusters and its Application to Evaluation Data2012

    • 著者名/発表者名
      R. Chiba, T. Furutani, M. Sato-Ilic
    • 雑誌名

      Intelligent Decision Technologies, Springer-Verlag, Berlin Heidelberg (Germany)

      巻: 1 ページ: 77-87

    • DOI

      10.1007/978-3-642-29977-3_8

    • 査読あり
  • [雑誌論文] Analysis of Web Survey Data based on Similarity of Fuzzy Clusters2012

    • 著者名/発表者名
      R. Chiba, M. Sato-Ilic
    • 雑誌名

      Procedia Computer Sciences, Elsevier

      巻: 12 ページ: 224-229

    • DOI

      10.1016/j.procs.2012.09.060

    • 査読あり
  • [雑誌論文] Fuzzy Clustering Model based on Operators on a Product Space of Linear Spaces2012

    • 著者名/発表者名
      M. Sato-Ilic
    • 雑誌名

      20th International Conference on Computational Statistics

      巻: 1 ページ: 745-756

    • DOI

      10.1109/CIBCB.2011.5948471

    • 査読あり
  • [雑誌論文] Structural Classification based Correlation and its Application to Principal Component Analysis for High-Dimension Low-Sample Size Data2012

    • 著者名/発表者名
      M. Sato-Ilic
    • 雑誌名

      IEEE World Congress on Computational Intelligence

      巻: 1 ページ: 981-988

    • DOI

      10.1109/FUZZ-IEEE.2012.6251200

    • 査読あり
  • [雑誌論文] Effective PCA for High-Dimension, Low-Sample-Size Data with Noise Reduction via Geometric Representations2012

    • 著者名/発表者名
      K. Yata, M. Aoshima
    • 雑誌名

      J. Multivariate Anal.

      巻: 105 ページ: 193-215

    • DOI

      10.1016/j.jmva.2011.09.002

    • 査読あり
  • [学会発表] Cluster-based Scaling for Symbolic Data and its Applications in Decision Making

    • 著者名/発表者名
      M. Sato-Ilic
    • 学会等名
      4th International Conference on Intelligent Decision Technologies (KES-IDT2012)
    • 発表場所
      Nagaragawa Convention Center, Gifu, Japan
    • 招待講演
  • [学会発表] Symbolic Nonlinear Fuzzy Clustering Model

    • 著者名/発表者名
      M. Sato-Ilic
    • 学会等名
      ims-APRM2012
    • 発表場所
      Tsukuba International Congress Center, Tsukuba, Japan
  • [学会発表] Fuzzy Cluster based Principal Component Analysis for High-Dimension and Low-Sample Size Data

    • 著者名/発表者名
      M. Sato-Ilic
    • 学会等名
      2012年度統計関連学会連合大会講演報告集
    • 発表場所
      北海道大学, 札幌
  • [学会発表] Classification of High-Dimension Low-Sample Size Data

    • 著者名/発表者名
      M. Sato-Ilic
    • 学会等名
      第28回ファジィシステムシンポジウム講演論文集
    • 発表場所
      名古屋工業大学, 名古屋
  • [学会発表] 評価データのクラスタリングに基づくクラスター間類似度とその応用

    • 著者名/発表者名
      千葉龍之介, 佐藤美佳
    • 学会等名
      日本分類学会第31回大会
    • 発表場所
      中央大学, 東京
  • [学会発表] Misclassification Rate Adjusted Classifier for Multiclass, High-Dimensional Data

    • 著者名/発表者名
      M. Aoshima
    • 学会等名
      The Sixth International Workshop on Applied Probability
    • 発表場所
      Jerusalem, Israel
    • 招待講演
  • [学会発表] 高次元小標本データの統計学

    • 著者名/発表者名
      青嶋 誠,矢田和善
    • 学会等名
      2012年度統計関連学会連合大会講演報告集
    • 発表場所
      北海道大学, 札幌
    • 招待講演
  • [学会発表] PCA Consistency for the Power Spiked Model in High-Dimensional Settings

    • 著者名/発表者名
      矢田和善,青嶋 誠
    • 学会等名
      第7回日本統計学会春季集会
    • 発表場所
      学習院大学, 東京
    • 招待講演
  • [学会発表] Cluster Analysis for Interval-valued Functional Data

    • 著者名/発表者名
      N. Shimizu
    • 学会等名
      ims-APRM2012
    • 発表場所
      Tsukuba International Congress Center, Tsukuba, Japan
  • [学会発表] 集約的シンボリックデータの混合分布モデルに基づくクラスタリング

    • 著者名/発表者名
      清水信夫, 中野純司
    • 学会等名
      2012年度統計関連学会連合大会講演報告集
    • 発表場所
      北海道大学, 札幌
  • [学会発表] Clustering based on Normal Mixture Model for Aggregated Symbolic Data

    • 著者名/発表者名
      N. Shimizu, J. Nakano
    • 学会等名
      3rd Workshop in Symbolic Data Analysis
    • 発表場所
      Madrid, Spain

URL: 

公開日: 2014-07-24  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi