本研究では、環境や話者の個人性が音声認識システムに与える影響をリアルタイムで推定し、外乱に頑健な音声認識システムを構築することを目指して、科学研究費補助金交付期間内に下記の項目について重点的に検討を行った。 1、雑音成分が音声認識システムに与える影響を頑健に推定できる雑音指標の策定 2、話者の個人性が音声認識システムに与える影響を頑健に推定できる話者依存指標の策定 3、1、と2、と残響指標を統合した音声認識性能の自動推定・検知手法の確立 4、1、~3、を統合した音声認識性能を自動推定・検知するシステムの設計・構築 平成26年度(最終年度)では、上記項目の中でも特に「4、1、~3、を統合した音声認識性能を自動推定・検知するシステムの設計・構築」に取り組んだ。具体的には、利用環境が音声認識システムに与える影響を自動的に推定・検知し、その影響を効果的に取り除くことができる対策を事前にシステムへ反映させて、常に最大性能を発揮できる音声認識システム設計を行った。その結果、これまでに策定した指標(雑音指標・残響指標・話者依存指標)を用いて音環境をリアルタイムで推定できる音声認識システムの構築に成功した。この音声認識システムは、従来の音声認識システムと比較して、利用場所に依存することなく高性能に動作するため、今後はスマートフォンやノートパソコンなどの携帯端末(機器を持ち運びながらの利用)への応用が十分に期待できる。
|