研究概要 |
情報通信技術の著しい発達により,以前までとは比較にならない大規模・大容量・複雑なデータが蓄積されており,そのようなデータを対象として,人間のように柔軟な処理を経て,情報を抽出する必然性は高まる一方である.そのような手法の一つにクラスタリングがある.クラスタリングは,上述のようなデータから,人間には抽出困難な構造を抽出するための非常に重要な手法であり,自然言語・画像認識など多くの分野に利用されている.通常,クラスタリングで対象となるデータはパターン空間上の点として表される.しかしながら,データが誤差や欠損といった固有の不確実性を伴う場合,データは区間や幅として表されるため,既存の手法で扱うことは非常に困難である.そこで,本研究課題では,不確実性に対して人間のように柔軟な処理を行える方法論の構築を目標とし,データに伴う不確実性を許容範囲付きデータとして扱うクラスタリング手法の高度化に取り組んでいる.現在までの主な成果として,許容範囲付きデータに対するクラスタリング手法の提案及び高度化,クラスタワイズ許容を用いた新たなクラスタリング手法の枠組みの構築を進めている.また,クラスタリングにより得られる分類結果を評価する妥当性基準の高度化に取り組み,許容範囲付きデータに対する妥当性基準を構築した.既に提案されている手法では,不確実性を伴うデータに対する妥当性基準を議論することは非常に困難であったが,許容の概念を用いることで前述の問題点を解決する新たな方法を構築したことは本研究の特色であり,独創的な点であると言える,また,許容の概念を拡張したクラスタワイズ許容という新たな概念を用いたクラスタリング手法では,従来は扱うことが困難であった形状やサイズの異なるデータを柔軟に扱うことが可能となった.これらの成果より,本研究課題は現時点では十分に果たされていると考えている.
|