研究課題/領域番号 |
23500343
|
研究機関 | 筑波大学 |
研究代表者 |
イリチュ 美佳 (佐藤 美佳) 筑波大学, システム情報系, 准教授 (60269214)
|
研究分担者 |
青嶋 誠 筑波大学, 数理物質科学研究科(系), 教授 (90246679)
清水 信夫 統計数理研究所, データ科学研究系, 助教 (00332130)
|
研究期間 (年度) |
2011-04-28 – 2014-03-31
|
キーワード | シンボリックデータ / シンボリックデータ解析 / 高次元小標本データ / 主成分分析 / ファジィクラスタリング |
研究概要 |
高次元小標本のシンボリックデータに対する解析手法を開発し、開発した手法の各種性能を精査するとともに、実用化を図った。従来、得られたデータの次元が標本数に比べて遥かに大きいデータ(高次元小標本データ)に対する解析が問題とされている。このデータに、既存の統計手法を適用すると、いわゆる"次元の呪い"により、有効な結果が得られないという問題がある。この問題を解決するために、様々な解析法が提案されている。しかし、これらの解析法は、従来のデータの型に対する手法にとどまり、シンボリックデータに対しては、未だ開発されていない。そこで、本研究では、より多様なデータを扱うことを可能とするシンボリックデータの特性を活かし、高次元小標本シンボリックデータに対する新たな知識発見手法を提案し、実用化に向けた性能評価を行うことを目的として実施されたものである。これらの研究の具体的内容は、これまで、高次元小標本データでは、固有値の一致性の問題から解が得られないという問題について、クラスター構造間の相関を導入することにより、この問題を解決したことにある。また、クラスター構造の類似性による変数選択基準を提案し、それにより、変数の部分空間によるクラスタリング手法を開発したことにある。これまでの変数の扱いは、変数のカテゴリーという考えが含まれていない。その主な原因は、従来のデータ解析においては、変数をベクトル空間の次元とみなして数学的解析を行ってきたことにある。しかし、次元が非常に大きい場合には、それをカテゴリー化して次元を縮約する操作をする必要がある。そこで、シンボリックデータの考えを導入し、これまで単一の次元として考えていた解析に、カテゴリー(シンボル)としての次元表現を取り入れ、その解析法を開発した。これらの研究結果を各種の論文で発表した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
高次元小標本シンボリックデータに対するファジィクラスタリング手法を提案し、次元縮約によりその視覚化を図ることが本年度の主目的であった。これについて、新たな相関構造を取り入れたファジィクラスタリング手法、及び主成分分析法を提案し、高次元小標本データに対する問題を解決し、当初の計画を達成している。さらに、これらの方法について、遺伝子発現データ等の数値例により、性能を評価した。シンボリックデータの型の中では、主に、区間データを用いて解析を実施した。
|
今後の研究の推進方策 |
前年度、開発した手法に基づいて、他のシンボリックデータ(モーダルデータなど)に対する解析手法を開発する。新たに提案した相関構造の数学的性質を解明する。クラスタリング手法において、部分空間選択法を導入した場合の性能評価を行う。各種の高次元小標本データに適用し、性能を評価することにより、有効性を検証する。
|
次年度の研究費の使用計画 |
前年度に得られた結果を基にして、提案した手法に、高次元小標本シンボリックデータを適用することにより、評価を行う。具体的には、各種のシンボリックデータに適用可能なように提案した手法のプログラムを作成する。また、人工データを用いて、シミュレーションを行い、提案手法の性能を数値実験により検証する。脳波データや遺伝子データに対する有効性を検証する。成果を随時、国内外の論文誌に発表する。また、国際会議で随時発表を行う。このため、主として、プログラム作成、検証、成果発表に研究費を使用する計画である。また、昨年度の繰越金(2173円)は、予想よりも安価で購入できたことにより発生したものであるが、今年度は、この繰越金と合わせて、必要物品の購入をする計画である。
|