研究概要 |
理解できる知識やノウハウを機械学習によって自動的に獲得するために、われわれは最近傍識別木(NNC-Tree: Nearest Neighbor Classification Tree)とその構築方法を提案した(Q. F. Zhao,"Inducing NNC-Trees with the R^4-rule," IEEE Trans. on SMC-B, Vol.36, No.3, pp.520-533,2006)。しかし、これまでに提案した構築法では、パターン間類似度を求めるために、すべての特徴量が必要であった。実際問題においては、一部の観測値に基づいて結論を出さなければならない場合もある。データが不完全であってもNNC-Treeを効率的構築するために、今年度においてわれわれが主に2つの方法について考察した。一つ目は、重要特徴を抽出し、それだけを利用してNNC-Treeを構築する方法である。二つ目は、不完全データを完全データの形に写像し、データが完全であるかどうかに気にせず、従来通りNNC-Treeを構築する方法である。1番目の方法については、重要特徴を効率良く見つけるために、われわれが相対優勢というコンセプトに基づく高速クラスタリング法を提案した。2番目の方法については、われわれがデータのファジィ化に基づく知識抽出法を提案した。以上の成果とは別に、注意学習によるNNC-Treeの効率的構築、次元圧縮による多変数決定木の小型化などについても考察した。
|