本研究の目的は,ハンズフリー音声認識・視線検出システムによる上肢不自由者のための文書作成支援の確立である.3年間の研究の成果を以下に示す. H28年度は主に音声認識性能が最大となる内部パラメータの導出と倍音復元による音声の品質改善に取り組んだ.実環境で最高の音声認識性能を引き出すためには,内部パラメータを手作業でチューニングすることが多い.そこで,重回帰分析で内部パラメータを推定する手法を提案し,様々な環境下で安定して高い音声認識性能を得ることを確認した.また,雑音抑圧によって失われた倍音成分が倍音復元技術によって復元されることを確認した.さらに,雑音環境下で頑健に動作するリアルタイム音声認識システムを目指して,倍音復元に基づく雑音抑圧がリアルタイムで動作するように実装した. H29年度は視線検出システムの構築,文書修正システムの開発に取り組んだ.身体に何も身につける必要のない据え置き型の視線検出デバイスを使用し,ユーザーはシステムの使用開始時に一度だけキャリブレーションを行うことで,遅延なく視線情報を取得できることを確認した.また,取得した視線情報を用いて音声認識結果の誤認識の修正や句読点の挿入を行うシステムを構築した.さらに,音声認識と視線検出を統合したシステムを開発し,実際に構築したシステムを用いて被験者に「雑音環境下での音声認識による文章の作成」→「視線情報による修正」という一連の流れを確認してもらい,提示した文章が完成するまでの時間を計測することができた. H30年度は音声認識性能の向上を目的として非定常な雑音推定や実環境での音声品質の推定に取り組んだ.音声の存在確率を考慮することで,従来よりも高精度な非定常雑音の推定結果を得ることができた.実環境で推定可能な音声の統計量を用いることで,参照信号を必要としない新たな品質評価尺度を提案した.
|