2009 Fiscal Year Annual Research Report
パターン間類似度に基づく不完全データからの知識学習と理解に関する研究
Project/Area Number |
19500128
|
Research Institution | The University of Aizu |
Principal Investigator |
趙 強福 The University of Aizu, コンピュータ理工学部, 教授 (90260421)
|
Co-Investigator(Kenkyū-buntansha) |
劉 勇 会津大学, コンピュータ理工学部, 上級準教授 (60325967)
|
Keywords | 機械学習 / 学習と理解 / 知識獲得 / 最近傍識別木 / 不完全データ / 特徴抽出 / ファジィ変換 / 次元圧縮 |
Research Abstract |
理解できる知識を機械学習によって獲得するために、われわれは最近傍識別木(NNC-Tree:Nearest Neighbor Classification Tree)とその構築方法を提案した(Q.F. Zhao, "Inducing NNC-Trees with the R^4-rule," IEEE Trans. on SMC-B, Vol.36, No.3, 2006)。しかし、パターン間の類似度を求めるために、すべての特徴量が必要であった。実際問題においては、一部の観測値に基づいて結論を出さなければならない場合もある。データが不完全であってもNNC-Treeを効率的構築するために、いままでわれわれは2つの方法について考察した。一つ目は、重要特徴を抽出し、それだけを利用してNNC-Treeを構築する方法である。二つ目は、不完全データを完全データの形に写像し、データが完全であるかどうかに気にせず、従来通りNNC-Treeを構築する方法である。実際、この二つの方法を独立に使用するよりも、それらを結合したほうがより有効であることが、今年度の研究でわかった。結合方法は次のようになる。まず2番目の方法でデータを離散化し、もとの特徴ベクトルをBoW(Bag-of-word)モデルに変換する。これによって不完全問題は完全問題と同じ形になるが、特徴ベクトルは数倍大きくなる。ここで1番目の方法(相対優勢法の改良方法)を利用すれば、学習効率が劣らずに重要特徴を自動的に見つけることができる。実際のパターン分類は重要特徴だけを利用するので、学習も認識も効率的に行うことができる。また、重要特徴が観測されていない場合、無理に判断を行わずに、特徴の追加を求めることができ、判断結果の信頼性を高めることができる。
|
Research Products
(8 results)