研究概要 |
半教師つき学習は,ラベルデータが少量しか得られない状況で,大量かつ用意に得られるラベルなしデータを訓練集合に加えて,両方のデータを用いて学習するという特徴を持っている.本研究では,両方のデータを節点として,データ間の類似度を枝の重みとして置き換えたグラフを用いてデータ集合を表現し,このグラフのマルチウェイカットを求めて分類を行う,新たな半教師つき学習を提案した.さらに本研究では,半教師つき学習でのみ解決問題である,特徴選択手法を提案した.特徴選択は,通常,各属性が分類に有効かどうかを判断するために,多くのラベルデータが必要である.しかしながら,半教師つき学習ではラベルデータが少量しか得られないことを仮定しているため,有効属性の評価を行うことが困難である.このため,グラフ中の特徴的なパターン発見で使われている最大密度部分グラフを用いて,属性の分類に対する有効度を評価する方法を提案した.さらに,元の属性集合から最適な有効属性集合を求めるために,属性の有効性評価の結果を用いて,属性間の関係を示す属性関連グラフを定議し,このグラフからクリークを発見して有効属性集合を決定する手法も提案した.
|