研究概要 |
本年度は,昨年度の研究に引き続き,データの非対称構造を測る基準や分類結果の評価を行うための指標の提案,及び数値実験による実証的に分類結果の検証を行い,データの非対称構造を考慮した分類結果の特徴づけや特徴的な現象を探った. 具体的には,昨年度提案したクラスタリング結果を測る指標を用いてデータ構造と手法間の関係を検証した.特に本研究では,非対称構造をもつデータに適用したクラスター分析法とデータの関係を解明するために,実データに現れる様々な条件(非対称さ,同値(タイ)の発生頻度欠損値状態など)をもつデータを考え,様々な視点で数値実験を行い,非対称クラスター分析法と分類結果の特徴の研究を行い,IMPS2007で研究結果を報告した.また非階層的クラスター分析手法で知られているk-means法を非対称データの分析に拡張した非対称k-medoids手法を提案し,階層的クラスター手法の場合と同様にデータと手法の関係を検証した.これらの結果はISI2007で報告した. 引き続き,対人間選好度やウェブアクセスデータなど非対称構造をもつ非対称データにおいて,サイズの大小,数値の散らばり等,いくつか条件を想定し,シミュレーションによりそれぞれのデータに合わせた手法の最適化を目指した.特に分類結果を評価する指標をこれまでに提案してある指標を参考にいくつか考え,それらを元に分類結果の評価を行った.これらは十分な結果が得られなかったため,方法を変えるなど今後の課題として検討している.
|