研究課題/領域番号 |
15K00348
|
研究機関 | 芝浦工業大学 |
研究代表者 |
神澤 雄智 芝浦工業大学, 工学部, 准教授 (00298176)
|
研究期間 (年度) |
2015-04-01 – 2018-03-31
|
キーワード | ファジィクラスタリング / 球面データ / 不完全データ |
研究実績の概要 |
本研究の目的は、不完全データに対する球面ファジィクラスタリング技法を確立することである。3年間の研究計画において、初年度にあたる今年度は、不完全データに対応するための準備として先ず、これまで開発してきた、完全データに対する球面ファジィクラスタリング手法群を整備し、そして、データの不完全部分を削除する方法の性能を評価することを計画していた。 前者については、概ね良好に研究を遂行でき、幾つかの査読付き論文を出版し、1件の国際会議にて成果を発表した。特に、国際会議で発表した手法は、これまで他の研究者によって提案されてきた多くの手法群を統一的に扱えるものである。元々は多くの各手法について個別に、不完全データに対応する手法を検討していくことを考えていたが、提案した手法を基にして研究を遂行することによって、多くの手法の不完全データへの対応をまとめて統一的に扱うことができることになった。 後者については、前者の手法の球面不完全データに対する定量的性能を実験的に評価することを試みた。具体的には、人工的に生成した球面完全データから徐々に欠損箇所を増やしていくことによって得られる不完全データに対してこの手法群を適用し、欠損比率とクラスタリング精度との関係を数値的実験によって得ようとした。しかしながら、その関係は欠損箇所に大きく依存し、欠損比率を増やしていくとクラスタリング精度の分散が爆発的に増えてしまい、定量的な関係を見出すことはできなかった。ただし、ここでは定量的な関係を見出すことそのものが目的なのではなく、今後に開発していく不完全データへの新たな手法の有効性を最も基本的な手法と比較検討していくための基準が得られたという意味では、提案手法の特性検証を次年度に行っていくための準備が整ったことになる。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
今年度は、不完全データに対応するための準備として先ず、これまで開発してきた、完全データに対する球面ファジィクラスタリング手法群を整備し、そして、データの不完全部分を削除する方法の性能を評価することを計画していた。 前者については、概ね良好に研究を遂行でき、これまで他の研究者によって提案されてきた多くの手法群を統一的に扱えるものである。元々は多くの各手法について個別に、不完全データに対応する手法を検討していくことを考えていたが、提案した手法を基にして研究を遂行することによって、多くの手法の不完全データへの対応をまとめて統一的に扱うことができることになった。 後者については、前者の手法の球面不完全データに対する定量的性能を実験的に評価することを試みた。具体的には、人工的に生成した球面完全データから徐々に欠損箇所を増やしていくことによって得られる不完全データに対してこの手法群を適用し、欠損比率とクラスタリング精度との関係を数値的実験によって得ようとした。しかしながら、その関係は欠損箇所に大きく依存し、欠損比率を増やしていくとクラスタリング精度の分散が爆発的に増えてしまい、定量的な関係を見出すことはできなかった。ただし、ここでは定量的な関係を見出すことそのものが目的なのではなく、今後に開発していく不完全データへの新たな手法の有効性を最も基本的な手法と比較検討していくための基準が得られたという意味では、提案手法の特性検証を次年度に行っていくための準備が整ったことになる。 次は、平均、近傍、回帰などの初等的手法を用いて不完全部分を初等的に予測して完全化する方法群を開発することになるが、この内、回帰を用いる場合には球面データの回帰分析をまず定式化しなければならないため、すぐに本質的な研究を進められる状態にあるとはいえない。 以上より、本研究は概ね順調に進展していると考える。
|
今後の研究の推進方策 |
今後はまず、不完全部分を初等的に予測して完全化する方法群の開発・性能評価を行う。リニアデータそのものに対する手法と非類似度関係性データに潜在するリニアデータに対する手法に分けられる。基になる初等的手法として、平均、近傍、回帰の3 法がある。平均と近傍に基づく手法については、正規化を援用して開発する。一方、回帰に基づく場合には球面データに対する回帰を定式化(球面回帰) してから球面回帰に基づいて完全化手法を開発する。開発手法の周辺分野との関係解明は方法論確立の上で重要である。そこで、開発した完全化手法群の既存手法との理論的類似性について検証する。再定式化技法群の定量的性能を評価するために、手順1 に基づいて実験する。開発した手法と従来法の精度を定量的に比較するために、ベンチマーク用実データ群から選んだ完全データから徐々に欠損箇所を増やしていくことによって得られる不完全データに対して、リニアクラスタリングと球面クラスタリングについて、欠損比率とクラスタリング精度との関係を明らかにすると共に、欠損箇所とクラスタリング精度との関係についても検証する。これによって、不完全データに対して、開発手法群を用いた球面クラスタリングとリニアクラスタリングとの精度面での優位性を明らかにできる。 本年度のまとめと来年度の全体計画本年度の総括を行い、来年度以降の全体計画を再検討する。
|
次年度使用額が生じた理由 |
全て計画通りに支出したが旅費の予算額と実費額の差による。
|
次年度使用額の使用計画 |
次年度も引き続き当初計画通りに使用していく。
|