研究課題/領域番号 |
16K21579
|
研究機関 | 徳山工業高等専門学校 |
研究代表者 |
宮崎 亮一 徳山工業高等専門学校, 情報電子工学科, 助教 (40734728)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
キーワード | 雑音抑圧 / 音声強調 / 倍音復元 / 音声認識 |
研究実績の概要 |
本研究は,ハンズフリー音声認識・視線検出システムによる上肢不自由者のための文書作成支援の確立を目指す.本年度の目標は,雑音・残響下で頑健に動作する音声認識システムの構築であり,主に以下の研究を行った. (1)音声認識性能が最大となる内部パラメータの導出:雑音抑圧や残響抑圧に関しては世界中で研究が行われているが,各環境に応じて最高の音声認識性能を引き出すために,内部パラメータを手作業で調整することが多い.本研究では様々な実験条件,パラメータを用いた音声認識実験を行うことにより,環境ごとで最適な内部パラメータの傾向を得た.また,実験で得られた結果よりパラメータの推定には重回帰分析が有効であることを明らかにした.重回帰分析で推定したパラメータを用いることで,様々な環境下で安定して高い音声認識性能を得ることを確認した. (2)倍音復元による音声の品質改善:雑音環境下での音声認識には雑音抑圧が有効であるが,過剰な雑音抑圧は雑音成分だけではなく真の音声成分まで歪むという問題がある.そこで,倍音復元に基づく雑音抑圧に着目し,雑音抑圧によって失われた倍音成分が復元されることを確認した.また,倍音復元に基づく雑音抑圧はあらゆる古典的な雑音抑圧で有効であることを実験より明らかにした.さらに,雑音環境下で頑健に動作するリアルタイム音声認識システムを目指して,倍音復元に基づく雑音抑圧がリアルタイムで動作するように実装した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
前年度から計画と準備を行っていたため,研究をスムーズに遂行することができた.
|
今後の研究の推進方策 |
今年度は,音声認識性能を最大とするパラメータの推定,倍音復元に基づく雑音抑圧のリアルタイム処理に着手した.今後は,上記の二つを組み合わせることで雑音環境下で頑健に動作する音声認識システムの構築を目指す.また,当初の予定通り,視線検出システムの構築および文書修正システムの開発を行う.
|
次年度使用額が生じた理由 |
次年度使用額は549円少額であり,ほとんど当初の予定通り経費を執行することができた.
|
次年度使用額の使用計画 |
平成29年度は視線検出に関する研究に取り組むため,研究を遂行するための図書やデバイスの購入を予定している.
|