2018 Fiscal Year Research-status Report
Towards a Real-Time Speech Intelligibility Measurement Meter
Project/Area Number |
17K00223
|
Research Institution | Yamagata University |
Principal Investigator |
近藤 和弘 山形大学, 大学院理工学研究科, 教授 (10312753)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | 音声信号処理 / 音声了解度 / 了解度推定 / 深層学習 / 雑音除去 / 残響除去 |
Outline of Annual Research Achievements |
原音を用いずに劣化音声のみから音声信号を推定するには、劣化音声から原音声をまず推定する必要がある。劣化として加算雑音と残響を扱うことにし、前年度は別々に各々の劣化を含む音声から原音を推定することを検討した。このためDeep Neural Net(DNN)を用いて劣化音声から原音声を推定することを試みた。今年度は新たに以下が明らかとなった。 (1)加算雑音に対しては比較的高い推定精度で原音を再現できた。この推定原音を用いて劣化音声のみから了解度を推定することを試みた。了解度推定用のDNNを学習し、了解度の推定を試みたところ、未知雑音に対しても真の了解度に対して推定了解度は二乗誤差0.12、相関値0.94程度の高い精度の推定が可能であることを示した。 (2)残響に対しては、一定以上の精度で推定はできるが、了解度を推定するには不十分であった。そこで今まで用いていた単純な密結合ネットワークに対し、Convolutional Networkを利用して精度向上を試みた。しかしこれを用いてもなお密結合ネットワークを用いた場合と同程度の精度しか達成できていない。 (3)加算雑音、残響いずれの劣化に対しても位相が正確に再現できることで推定精度が向上できることが期待できる。そこで今年度はやはりDNNを用いて位相成分の推定を試み、これにより推定精度の向上を狙う。 (4)残響劣化音声に対しては、他のネットワークトポロジーの導入を試みる。また、残響に相当する時間ー周波数成分に対してマスクを適用する方式も導入を試みる。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
加算雑音劣化音声に対しては、十分な精度で了解度が推定できている。 残響に対してはまだ満足な原音推定精度を達成できていないが、位相成分の推定高精度化で品質向上が図れる見通し得ている。
|
Strategy for Future Research Activity |
加算雑音劣化音に対しては十分な了解度推定精度を示すことができたので、今後はより多様な加算雑音に対する性能評価を行うとともに、学習量を増やしてさらなる推定精度向上を図る。 残響劣化音声に対しては位相推定精度の向上を図るとともに、他のネットワーク・トポロジーを試して、原音推定精度の向上をまず図る。そのうえ、了解度推定を試みる。 最後に加算雑音、残響双方を含む音声信号に対し、学習したDNNを用いて原音声を推定し、この推定原音声と推定劣化成分から、両劣化を含む音声信号の了解度の推定を試みる。
|
Causes of Carryover |
前年度国際学会が国内開催となったため生じた剰余金がまだ残った。 次年度は主に国内旅費と国際学会旅費として支出予定。
|