2012 Fiscal Year Research-status Report
高次シンボリックデータに対するクラスターワイズ手法の開発とその応用
Project/Area Number |
23500343
|
Research Institution | University of Tsukuba |
Principal Investigator |
イリチュ 美佳(佐藤美佳) 筑波大学, システム情報系, 教授 (60269214)
|
Co-Investigator(Kenkyū-buntansha) |
青嶋 誠 筑波大学, 数理物質系, 教授 (90246679)
清水 信夫 統計数理研究所, データ科学研究系 計量科学グループ, 助教 (00332130)
|
Keywords | データマイニング / ファジィクラスタリング / 類似性 / クラスター間相関 / 遺伝子データ |
Research Abstract |
高次元小標本データに、既存の統計手法を適用すると、有効な結果が得られないという問題がある。この問題を解決するための基本的な解決法としては、データを何らかの方法で分類して次元を縮小し解析を行うことであるが、本研究では、二つの方法を提案した。 一つは、データの次元(属性)を分類して次元を縮小する方法であり、他方は、元のデータ構造を分類構造へ変換することにより次元の縮小を図る方法である。 昨年度は、第1の方法について、研究を進めたが、本年度は、第2の方法に重点を置き、研究を進めた。 その結果、理論的実績として、ファジィクラスタリング結果から得られる分類構造間の相関は、研究代表者らがすでに提案したファジィ自己類似性の特性を使って説明できることを明らかにした。この特性とは、提案した相関は、データの類似性に存在するノイズを学習して除去し、データの分類による説明力を取り入れることである。また、数値例から、遺伝子に関する実データで、有効な結果を得た。これらの研究成果に対して、米国、ワシントンD.C.において開催された国際会議でBest Theoretical Paper Awardを受賞した。また国際会議KES-IDT2012で基調講演を行い、パリ大学(Department of Databases and Machine Learning, LIP6, University of Paris (UPMC))で招待講演を行った。また、研究結果を各種の論文で発表した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
昨年度、開発した高次元小標本データに対するクラスター間相関構造を取り入れたファジィクラスタリング手法、及び主成分分析法を更に発展させ、この方法の理論的解明と共に、実用化に向けて、数値解析を行うことが本年度の主目的であった。これについて、理論・応用の両側面から研究を進め、当初の計画を達成した。さらに、これらの方法について、遺伝子発現データ等の数値例により、性能を評価した。
|
Strategy for Future Research Activity |
本研究で開発した二つの手法のハイブリッド手法を開発する。すなわち、シンボリックデータにより、属性の縮小を図りつつ、データを分類構造へ変換する方法を開発する。前者は、データの外的情報である分類情報の取得に優れ、後者は、データが内在的にもつ分類構造の説明に優れている。これらを合わせることにより、双方の利点を併せ持つ高次元小標本データに対する方法の開発が期待できる。
|
Expenditure Plans for the Next FY Research Funding |
「該当なし」
|
Research Products
(19 results)