機械学習分野では、近年、大量の学習データに手動でラベルを付ける作業を避けるため、半教師付き学習が盛んに研究されている。しかし、学習データに付与するラベルはできるだけ少なくしたいが、ラベル付けすべき学習データとその個数を定めることは半教師付き学習の非常に難しい問題である。つまり、ラベル情報の少ない学習データを利用して、大量のデータを分類することはパターン認識や機械学習における大きな課題である。実際の利用場面では学習データにノイズが混入するため、問題は更に難しくなる。また、グラフベース半教師付き学習はデータの構造を図示することができ、アルゴリズムを解釈しやすいという優れた点があるが、データにノイズが含まれている場合に敏感や、不安定になるという欠点がある。 本申請者が上記の問題点に基づいて、画像処理の分野の一つ手法である動的輪郭モデルで二階微分によってノイズを効果的に削除できる特性を用いて、グラフベース半教師付き学習と組み合わせることによって、データに含まれるノイズを削除し、少ないラベル情報を元にラベルなしデータにラベルを付けることのできる新しい手法を提案した。また、提案したアルゴリズムの有効性を検討するため、医用画像のヒストグラムや、画素値の情報を利用して特徴量を抽出し、学習データからランダムに少数のデータを選び、正かいのラベルを付けた。提案したアルゴリズムをこのラベルのある学習データとラベルのないラベルデータに応用し、分類を行った。
|