超大規模階層的文書分類データセットであるLSHTC3 Wikipediaデータを対象に,高速な学習手法を考案し,高い予測性能を実現した.特に,Wikipedia Medium データを対象にした学習時間を30分程度に短縮することに成功した.従来手法では,数時間~数日の学習時間を必要としていた.テスト時の分類性能が,世界最高スコアを達成していることも示した.さらに,各特長の分散ベクトル表現から新しい特徴を生成し,元の特徴ベクトルに追加することで,階層的分類の精度が44.92%にまで向上することを示した.階層的分類システムEzeをオープンソースソフトウェアとして公開した.
|