本研究では、4年間において、2つの環境(劣悪音響環境、サステナビリティ環境)に対して有効な音声認識LSIシステムを設計・開発し、そのフィールド実験を実施することで、実用性の高い音声認識・対話システムの実現を目指した。研究計画の前半2年間では、劣悪条件下における新しい音声認識技術の設計・開発・実現を行った。新しい雑音ロバスト音声認識手法の開発と、同時に、低消費電力化のためのハードウエア・ソフトウエアの協調設計によるシステム設計を進めた。後半の2年間(2020及び2021年度)は、新型コロナウィルス感染症の影響で、当初予定していた、国外でのフィールド実験や国内における類似の研究に関する情報収集などの調査が難しく、一部は、2022年度に繰り越している。2021年度(繰り越しの2022年度研究成果を含む)において、以下の研究成果が得られた。 (1) 雑音に埋もれた音声の分析技術の方式の性能評価:すでに提案している、雑音低減を効果的に行うランニングスペクトルドメイン上でのバンドパスフィルタを用いた、システム全体の性能評価を実施した。 (2) 劣悪条件下での音声認識の方式提案:前半2年間において、劣悪雑音環境条件下での、最適解を得られるような雑音抑制手法の提案を行った。2021年度は、認識精度上、問題のあった、雑音環境下における子供の音声に関して、雑音低減を効果的に行うため、聴覚心理学上のフィルタ設計を行い、最適なフィルタを実現した。 (3) 誤認識動作を抑制する音声棄却の性能評価:すでに提案している、音声棄却方式の性能評価実験を継続実施した。 (4) エナジーハーベストシステム指向認識システムの設計と開発:上記の方式を含む自動音声認識システムを低消費電力化システムで実現するため、ソフトウエア・ハードウエアの協調設計を検討し、計算コストの高い部分のハードウエア化を行った。
|