研究概要 |
本研究では, パターン認識システムの性能向上を目指し, 1) 相補的な識別器を効率的に生成する方式, および2) 生成された複数の識別器を効果的に統合する方式について検討を行った. 本年度は, 提案方式の適用範囲を広げることを目的に, 識別器統合部において下記拡張を行った. 1) 尤度パターン特徴ベクトルの次元数削減 提案方式を音声認識に適用する場合, 生成された複数の識別器(HMM)が各識別クラス(単語)に与える尤度のパターンを特徴量として静的なパターン認識を行うことで, 識別器を統合する. しかし, この枠組みでは特徴ベクトルの次元数が語彙数と一致するため, 大語彙を扱うタスクでは特徴ベクトルの次元数が膨大になる. そこで, 認識語彙のうち識別に寄与する単語クラスのみを選択し, 得られたクラスに対する尤度のみを用いて特徴ベクトルを構成することで, 尤度特徴ベクトルの次元数を削減する方式を開発した. 提案する次元圧縮法が認識性能に与える影響を調査するため, 次元圧縮を行った尤度空間上におけるSVMを用いたパターン認識を, 単語音声認識システムのリスコアリングに適用した. その結果, 4.6%に圧縮したベクトルを特徴量とした場合においても, 次元圧縮を行わないシステムの認識性能を劣化させることなく, かつ従来のHMMを上回る性能を与えることがわかった. 2) 合成音声の利用 識別器統合部に用いるパターン認識システムでは学習データとして単語音声を必要とするため, 語彙数の増大に伴い学習データ不足の問題が生じる. この問題を解決するため, HMM音声合成方式により生成した合成音声を学習データとして識別器統合部のパターン認識システムを構築することを試みた. 識別器統合部では尤度パターン空間上で識別を行うため, HMM合成音声とは整合性が高い. この方法を用いることで, 実際の単語発話を大量に収集することなく, 提案方式を用いることが可能となった.
|