研究概要 |
本年度では,音響ゴーストや各種環境雑音に耐性を持つフレーズ音声認識システム中で,棄却方式の改良と実現及びその評価を行った。本システムの目的は,自然発話中でのターゲット単語やフレーズに対する認識である。そのため,音声区間検出部は,自然発話から得られた連続音声波形より単語やフレーズの抽出を行う必要がある。雑音環境下を考慮して,区間検出フリーの並列型音声認識・棄却方式をさらに改良し,その実験をMATLABシミュレータ上で行った。音声棄却方式とは,対象となるフレーズや単語以外の音声が入力された場合それを自動で判断し,認識処理を実施しない機能である。本研究の申請段階では,この棄却手法について言及していなかったが,"ターゲットとする単語"の認識とそうではない単語の棄却方式は必要であり,昨年度からその実現・改良・実装を行った。 音声分析部(雑音・ゴースト除去部)では,観測音声から,雑音や音響ゴーストを抑制し,その後音声の特徴であるメル周波数軸上ケプストラム係数(MFCC)を計算する。その音声の特徴を用いて,音声認識を行うのが,音声認識部である。これらの各モジュールをレジスタトランスファレベル(RTL)により設計をし,動作確認を行った。次に,その各モジュールの消費電力を,上記のサブスレッシュホールド領域での回路デバイスライブラリにより計算した。RTL設計とは,VLSI設計教育研究センタ(VDEC,東京大学)のCADシステムを用いて行った。今年度は,本研究課題の最終年度であり,「音響ゴーストキャンセラ手法の設計・ソフトウエア開発」に関し,認識性能は,長いエコー時においての性能が若干劣るがほぼ予定の性能を実現し,棄却方式も提案・導入した。「極低消費電力型実時間音声認識チップの実現」に関しては,サブスレッシュホールド設計を導入することで,当初の予定通りの性能を達成している。
|