研究概要 |
本研究の目的は,実環境での高い有効性を考慮し,雑音に強い音声認識システムの方式実現と,システムのLSI化による低消費電力型実時間認識システムの実現,及びそのシステムのフィールド実験による有効性検証である。方式の開発については,汎用ロバスト音声認識システムの設計と開発を行い,その成果として,環境雑音0dB〜20dBの環境で、不特定話者の成人男性・女性の場合、ピーク性能で98%程度の認識正答率を実現している(自動車ノイズ・100単語認識・平均60%(40種類の雑音環境))。さらに、子供の声に関しても、実用的なレベルである、雑音環境(10dB)における、子供の認識率95%程度を達成する方式を実現した。さらに連続的に発声する音声の中からキーワードだけを抽出・認識する方式も開発し,雑音環境下でも、従来の方式に比べ高い性能が得られることを示し、約70%程度の抽出性能を実現した。 そのLSI実現では,認識語彙数を1000単語として設計を行い、単語数の増加によっても処理時間がほとんど増えない超並列方式を実現した。これらの設計データはFPGAチップ上で実装し、性能を評価し,予想通りの性能が出ていることを確認した。さらに,システムのTEG用LSIチップを試作した。LSIチップは、VDEC提供のTSMC 0.25ミクロンルールをターゲットとして実現している。低消費電力型のチップ試作も同時に行った。できるだけ低いクロック周波数で、超高速の処理を実現できるアーキテクチャを設計・開発し、従来のDSPによる実現方法と比べて、1/5の消費電力で実現できることがわかった。このチップを実際に利用して、マイクによる音声入力部分・自動利得制御を有するアナログ増幅器などのアナログフロントエンド部分を有する小型音声認識ボードを試作・実現し、その性能評価を、フィールド実験において行い,システムの有効性を確認した。
|