研究概要 |
識別問題を解く上で様々な識別子の中からどの識別子を用いるかが一つの問題となる.しかし,どの識別子を選ぶにせよ,特徴空間の次元数が高い場合には,いわゆる「次元の呪い」により,識別率の低下を招きかねない.また,識別問題ごとに必要となる特徴は異なる.例えば指の数は動物の分類には有効な特徴となるものの,雄か雌かを識別する問題では有効な特徴とはなり得ない.そこで,識別子に依存せず,どの識別子を用いた場合でも識別率の低下を招くことなく不要な特徴を除去する方法を提案し有効性を確認した. また,ヒトが様々な物事を識別,判断する際には感覚的,もしくは無意識に行うことが多い.この観点に立つと識別に必要となるそれぞれの特徴は有効数字が何桁も必要となるような数値を用いているとは考え難く,大きい,中ぐらい,小さいといった程度の大雑把な分類しか用いていないように考えられる.この観点から,ヒトの感性に着目し,各特徴の粗さ(粒度)に着目した特徴の圧縮に関しての提案を行い,有効性を確認した. さらに,プロトタイプの発見方法として,従来用いられてきたクラスタリング手法はプロトタイプが点であったのに対し,本研究では体積を伴なったプロトタイプを考えることにより,データの分布状況をプロトタイプに反映させることに成功した.開発した手法においてはプロトタイプの数を事前に設定する必要がないという利点も併せて兼ね備えている.
|