平成22年度は研究計画に沿って、オンライン・グラフティングのアンサンブル学習の研究を行った。オンライン・グラフティングは素性選択と目的関数の最適化を同時に与える手法であるが、過学習を起こすことが知られている。本研究ではオンライン・グラフティングの過学習を抑制するために、バギングやオンラインBPMなどで用いられている確率的アルゴリズムを用いたアンサンブル学習の提案、実装、および実験を行った。 オンライン・グラフティングのアンサンブル学習は、オンライン・グラフティングにより学習された複数の識別器のパラメータを平均化することにより実現し、次の二つの平均化手法を試みた。 (i)元の訓練データからランダムにデータを削減し、新たに複数の訓練データを作成する。得られた複数の訓練データから複数の識別器を学習し、それらのパラメータの平均を得る。 (ii)元の訓練データからランダムに素性を削減し、新たに複数の訓練データを作成する。得られた複数の訓練データから複数の識別器を学習し、それらのパラメータの平均を得る。 提案手法の性能評価のためにLIBSUM Dataのijcnn1に対し実験を行った。従来のオンライン・グラフティングでは93.09%の精度であったが、(i)の手法で93.61%の精度まで向上し、(ii)の手法では、93.78%め精度まで向上した。 本研究により、オンライン・グラフティングに対してアンサンブル学習を用いることで、精度の向上が実現されることを示した。今後は、オンライン・グラフティングとの比較だけでなく、機械学習の識別器として代表的なSVMやロジスティック回帰との比較を行っていく必要がある。
|