Budget Amount *help |
¥1,400,000 (Direct Cost: ¥1,400,000)
Fiscal Year 2010: ¥700,000 (Direct Cost: ¥700,000)
Fiscal Year 2009: ¥700,000 (Direct Cost: ¥700,000)
|
Research Abstract |
情報通信技術の著しい発達により,以前とは比較にならない大規模・複雑なデータが蓄積されており,そのようなデータを対象として,人間のように柔軟な処理を経て,有用な情報を抽出する必然性は高まる一方である.そのようなデータ解析手法の一つにクラスタリングがある.クラスタリングは,大規模・複雑なデータから,人間には抽出困難な構造を抽出するための重要な手法であり,自然言語・画像認識など様々な分野に応用されている.通常,クラスタリングで対象となるデータはパターン空間上の点として表される.しかしながら,データが誤差や欠損といった固有の不確実性を伴う場合,データは区間や幅として表されるため,既存の手法で扱うことは困難である.そこで,本研究課題では,不確実性に対して人間のように柔軟な処理を行える方法論の構築を目標とし,データに伴う不確実性を許容範囲付きデータとして扱うクラスタリング手法の高度化に取り組んだ.本研究課題の成果として,許容範囲付きデータに対するクラスタリング手法,回帰分析の構築,クラスタワイズ許容を用いたクラスタリング手法の確立が成された.また,クラスタリングにより得られる分類結果を評価する妥当性基準の不確実データへの拡張を試み,許容範囲付きデータに対する妥当性基準を新たに構築した.それらに並行して,教師あり学習の一手法である回帰分析の不確実データへの拡張を行った.これらの研究により得られた成果から,許容の概念を用いて不確実データを扱うデータ解析の方法論が確立されたと考えている.特に,不確実データに対するクラスタリング手法では,データの分類からその評価までを許容の概念を用いた統一的な枠組みで議論することを可能とした点は従来のデータ解析手法と大きく異なっている点である.さらに,本研究課題の発展であるクラスタワイズ許容の半教師付きクラスタリング手法への援用など,様々な発展性を示すことができ,本研究課題の目的は十分に達成することができたと考えている.
|