2003 Fiscal Year Annual Research Report
特徴空間フィルタによるロバスト音声認識の開発と極低消費電力型LSIの設計
Project/Area Number |
15300010
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Research Institution | Hokkaido University |
Principal Investigator |
宮永 喜一 北海道大学, 大学院・工学研究科, 教授 (20166185)
|
Keywords | 音声認識 / 雑音ロバスト化 / ランニングスペクトル / 並列LSIシステム / 極低消費電力システム / FPGAシステム / 実時間音声認識 / モバイルヒューマンインターフェイス |
Research Abstract |
本年度内において,(1)汎用ロバスト音声認識システムの設計と開発及び(2)極低消費電力型超高速音声認識LSIの設計を行った.各項目ついては,次の点について設計・検討・評価・実現を行った (1)汎用ロバスト音声認識システムの設計と開発 (1)多次元ランニングスペクトルフィルタの設計. 音声のランニングスペクトルは、窓関数などの利用により、近似的に時変な特性を示すため,観測区間では、外乱などの雑音やシステム雑音は定常とみなせる。そこで、非常に精度の高い2次元FIRハイパスフィルタ(時空間FIRフィルタ)を設計し、それにより、時間的に緩やかな変動(主に雑音によるもの)を除去し、時間変動の多い(主に音声信号の特徴)特徴量を求める手法を提案,開発した. (2)認識用雑音ロバスト音声特徴の推定. 外乱や雑音は時間的に定常な場合が多いため、音声の特徴を時変量としてみなし、その部分を高精度に推定する手法を提案した。ケプストラム領域における、雑音耐性を各ケプストラム係数に対して調査した例はないので、雑音ロバスト性を詳細に調べ、良好な特徴パラメータの推定法の設計を行い、それに基づく、単語音声認識ソフトウエアシステムを実現した。 (2)極低消費電力型超高速音声認識LSIの設計 (1)超高速認識LSI. 認識語彙数を1000単語として設計を行い、単語数の増加によっても処理時間が増えない方式を実現した。これらの設計データはFPGAチップ上で実現して、性能を評価し,予想通りの性能が出ていることを確認した. (2)極低消費電力型LSI. モバイルシステムの必須事項は低消費電力である。そのため、クロックを下げることや、ダイナミックアーキテクチャを導入することなどが必要であり、最適なデータ構想の設計を行うと同時に、リコンフィグアラブルアーキテクチャを導入することで、極低消費電力型の認識チップを実現した.
|
Research Products
(6 results)
-
[Publications] H.Ryu, Y.Miyanaga: "A Method of Self-Organizing Segmentation Algorith"Proceedings of IEICE International Technical Conference on Circuits/Systems, Computers and Communications. 1. 531-534 (2003)
-
[Publications] Q.Zhu, Y.Miyanaga, N.Yoshida: "Speech Analysis using a Robust Adaptive Processing"Proceedings of IEICE International Technical Conference on Circuits/Systems, Computers and Communications. 1. 670-673 (2003)
-
[Publications] N.Wada, N.Hayasaka, N.Hataoka, Y.Miyanaga: "A Noise Robust Speech Detection/Recognition System Including RSF/DRA and MFCC"Proceedings of ECTI International Symposium on Communications and Information Technology. 1. 455-458 (2003)
-
[Publications] S.Yoshizawa, N.Hayasaka, A.Kageyama, Y.Miyanaga: "Development of a Dedicated Hardware System for Noise Robust Speech Recognition Using RSF/DRA Technique"Proceedings of ECTI International Symposium on Communications and Information Technology. 1. 463-466 (2003)
-
[Publications] A.Nachin, S.Mitatha, K.Kobchai, Y.Miyanaga: "Design and Development of Protocol for Village Security System"Proceedings of IEEE International Symposium on Intelligent Signal Processing and Communication Systems. 1. 70-74 (2003)
-
[Publications] S.Yoshizawa, N.Wada, N.Hayasaka, Y.Miyanaga: "Noise Robust Speech Recognition Focusing on Time Variation and Dynamic Range of Speech Feature Parameters"Proceedings of IEEE International Symposium on Intelligent Signal Processing and Communication Systems. 1. 484-487 (2003)