研究課題
研究活動スタート支援
本研究の目的は、擬似的なラベルを学習済のモデルに基づいてデータ点に付与し、それを用いて改めて新たなモデルを学習する操作を繰り返すという自己学習アルゴリズムの挙動を解明することであった。そのために、2クラスの分類の問題において線形モデルを当該手法で学習した際の挙動を、統計力学の平均場理論を用いて解析した。これにより、更新回数に応じて最適なアプローチが異なるということ明らかとし、当該アルゴリズムを用いて効率的に汎化性能を向上させるためのアプローチを整理した。
ソフトコンピューティング
データ科学の実務的な場面ではラベル付きデータが十分にあるという理想的な設定にないことは一般的で、分析者は様々なヒューリスティクスを用いて問題に対処している。そのなかで多段階の学習に基づくヒューリスティクスはアイディアを実装に繋げやすく、近年盛んに用いられている。本研究はその流れに沿い、そのような多段階の学習に基づくヒューリスティクスの利用方法に関する示唆を与えるものであり、実務に向けた理論的知見を新たに加えたという意義があると思われる。