研究課題
学習と理解を同時に行うために、われわれは以前に最近傍識別木(NNC-Tree: Nearest Neighbor Classification Tree)とその構築方法を提案した。これまで提案した構築法では、パターン間類似度を求めるために、全ての特徴量が必要であった。しかし、現実問題においては、データが不完全である場合が多い。本研究では、以下のことを想定する:1)特徴は重要度を持ち、正しい分類をするために重要な特徴があれば、不必要なものもある;2)特徴はコストを持ち、簡単に測定できる特徴があれば、そうでないものもある;3)特徴だけではなく、クラスラベルまで欠損しているデータがある。本研究の目的は、以上の条件でNNC-Treeの効率的構築方法を提案したい。今年度では、われわれが以下のことについて考察した:1) 大量の特徴量の中で、最も重要なものを自動的に検出するための評価基準。2) 不完全データを基に、従来のNNC-Tree構築法をそのまま使える方法。1)については、特徴分布差、相対優勢などの評価基準を新たに提案し、文書分類などの問題を用いて検証実験をした。2)については、特徴量のファジィー化によって、不完全データを完全データと同じ形に変換する方法を提案し、これからさまざまな検証実験を行いたい。
すべて 2007
すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (3件)
Journal of Pervasive Computing and Communications Vol.3,No.2
ページ: 205-220