2005 Fiscal Year Annual Research Report
特徴空間フィルタによるロバスト音声認識の開発と極低消費電力型LSIの設計
Project/Area Number |
15300010
|
Research Institution | Hokkaido University |
Principal Investigator |
宮永 喜一 北海道大学, 大学院・情報科学研究科, 教授 (20166185)
|
Keywords | 音声認識 / 雑音ロバスト化 / ランニングスペクトル / 並列LSIシステム / 極低消費電力システム / FPGAシステム / 実時間音声認識 / モバイルヒューマンインターフェイス |
Research Abstract |
本年度において、(1)汎用ロバスト認識システムの高度化および、極低消費電力型超高速認識LSIの開発・試作を行った。 (1)汎用ロバスト認識システムの高度化 (1)遺伝子アルゴリズムによる多次元ランニングスペクトルフィルタの最適化 ランニングスペクトルフィルタの最適化を行った。すでに様々な雑音を用いていくつかのフィルタ特性が求められているが、実環境に対してより有効に動作するように、フィルタの最適化を実施した。最適化は、音声認識を実施する上での最適化であるため、遺伝子アルゴリズムを用いる。これにより、実環境雑音にロバストな処理が可能となる。 (2)キーワード認識ソフトウエアシステムの実現 自然に発生されている連続音声データから、ターゲットとする単語音声を獲得する処理方式を開発した。昨年度行った実験では、標準的な環境(20dB程度の雑音環境)において、本手法は有効であることがわかったが、高雑音環境では十分な性能が得られていない。耐雑音性能(10dB程度まで)を高めたより有効な方式を開発した。 (2)極低消費電力型超高速認識LSIの開発・試作 (1)超高速認識LSI 汎用性の高い音声認識システムの超高速処理システムを設計・開発した。ここでの汎用性は、チップを複数用いることで、認識単語数を簡単に増大できるような、拡張性のあるシステムとする。またこの実現したシステムのFPGA実現を行い、実際の認識実験により有効性の検証を行った。 (2)極低消費電力型LSI 超並列化とデータ構造の最適化により、より低消費電力なシステムの開発を行った。特に、ロバスト認識処理に適したデータ構造を求め、動的アーキテクチャなどの利用より無駄のない高速処理を低消費で実現するシステムの設計を行い、DSPなどの処理に比べて、1/10程度の消費電力で処理できることがわかった。
|