研究の最終年度にあたる本年度は、これまで開発した手法を基に、SVMの詳細な評価実験、および、音声に代表される時系列信号を扱うことができる新たなモデルの開発・評価を行い3年間にわたる研究のまとめを行った。 1.モデルの拡張 SVMによる時系列信号の認識を行うために、複数のSVMを連鎖した識別モデルCSVC(Chain Support Vector Classifier)を新たに提案した。SVMは入力特徴ベクトルの次元数が固定であることを仮定している。そのため、音声のような特徴ベクトルの時系列パターンをSVMで認識するためには時系列パターンを一定の長さに正規化する手法が従来用いられてきたが、この手法は連続音声の認識には不向きである。一方、開発したCSVCは隠れマルコフモデル(HMM)と同様の構造を持つため、HMMで使われている連続音声認識の手法をほぼそのまま利用することができる。 2.学習方式の開発 CSVCの学習アルゴリズムとしてHMMの学習法で使われているViterbiアルゴリズムと同様の学習アルゴリズムを開発した。HMMのViterbi学習の収束性が厳密に証明されているのに対して、CSVCのそれは、SVMの学習誤りが無く、かついくつかの条件が成り立つ場合にのみ収束が証明できる。 3.評価 提案したCSVCを評価するために、オンライン手書き文字認識実験を行った。現在のCSVCは膨大な計算時間を要するため、モデルの学習には10名のみの手書き数字にとどめ、評価には学習時と異なる10名の手書き数字を用いた。その結果、10数字の平均認識率として約97%が得られ、HMMとほぼ同様の認識性能が得られた。 4.結論・課題 CSVCはHMMに匹敵する識別能力を示唆する実験結果が得られた。しかし、現在の学習の収束性が非常に悪いとともに、学習に膨大な時間がかかることが問題である。学習の収束性問題を解決するためには、CSVCの学習時の評価関数および認識時の評価関数間での整合性の問題について検討する必要がある。学習速度については、SMO等の手法を用いることによって改善できると期待される。
|