研究課題/領域番号 |
17K00223
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
研究分野 |
知覚情報処理
|
研究機関 | 山形大学 |
研究代表者 |
近藤 和弘 山形大学, 大学院理工学研究科, 教授 (10312753)
|
研究期間 (年度) |
2017-04-01 – 2020-03-31
|
研究課題ステータス |
完了 (2019年度)
|
配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2019年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2018年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2017年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
|
キーワード | 音声了解度推定 / 加算雑音劣化 / 残響 / 深層学習 / DNN / 音声了解度 / 音声信号処理 / 了解度推定 / 雑音除去 / 残響除去 / 音声情報処理 / 音質推定 / 実時間推定 |
研究成果の概要 |
原音を用いずに加算雑音及び残響劣化音声のみから音声了解度を推定するため、劣化音声からDNNを用いて原音声を推定し劣化音声との差を算出し、これから別のDNNを用いて主観音声了解度を推定する。 (1)加算雑音に対しては、推定了解度と主観了解度間の相関は0.93程度、平均二乗誤差は0.11まで抑えることができた。 (2)残響に対しては、まず残響の影響を測ることができる音声サンプルを準備し、この主観音声了解度を測定した。この結果、残響は実環境でみられる程度の劣化範囲では加算雑音ほど了解度に影響しないことが分かった。残響劣化音声に対しても相関は0.94程度、平均二乗誤差は0.06まで抑えることができた。
|
研究成果の学術的意義や社会的意義 |
音声通信等における受話者側の基本的品質尺度の一つに、どの程度正確に聞き取れる音声を伝送できたかを測る音声了解度が挙げられる。音声了解度は複数の聴取者が正確に聞き取れる発話単位数で評価される。一般に多数の聴取者が多数の発話を用いて評価する必要があるため、高価であり時間も多く必要とされる評価となる。このため、受話音声の物理量などのみより音声了解度を推定する。 本研究では、実時間通信でも通話品質が推定できるように、原音を必要としない、メータのように簡単に利用できる音声了解度推定方法の確立を検討した。その結果、深層学習を用いて原音を用いなくても了解度が高精度で推定できることを示した。
|