近年、AIという呼称の元、機械学習手法が様々な分野で利用されるようになり、汎化性の意味における分類・識別性能向上に大きな関心が集まるようになった。この問題を解決するには、爆発的に増加し続ける収集データ量の適切な削減にも資する、学習データの取捨選択、すなわちサンプル選択を行うことが有効な対応の一つである。 そこで本研究では、入力データの統計的性質を踏まえた再生成データの構築と、これら入力データと再生性データの誤差基準などから、大多数のデータが示す基準値から大きく外れる、すなわち例外となるデータを検出・削除するために、特に因子分解手法に着目した検討を実施した。
|