• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2018 Fiscal Year Research-status Report

Towards a Real-Time Speech Intelligibility Measurement Meter

Research Project

Project/Area Number 17K00223
Research InstitutionYamagata University

Principal Investigator

近藤 和弘  山形大学, 大学院理工学研究科, 教授 (10312753)

Project Period (FY) 2017-04-01 – 2020-03-31
Keywords音声信号処理 / 音声了解度 / 了解度推定 / 深層学習 / 雑音除去 / 残響除去
Outline of Annual Research Achievements

原音を用いずに劣化音声のみから音声信号を推定するには、劣化音声から原音声をまず推定する必要がある。劣化として加算雑音と残響を扱うことにし、前年度は別々に各々の劣化を含む音声から原音を推定することを検討した。このためDeep Neural Net(DNN)を用いて劣化音声から原音声を推定することを試みた。今年度は新たに以下が明らかとなった。
(1)加算雑音に対しては比較的高い推定精度で原音を再現できた。この推定原音を用いて劣化音声のみから了解度を推定することを試みた。了解度推定用のDNNを学習し、了解度の推定を試みたところ、未知雑音に対しても真の了解度に対して推定了解度は二乗誤差0.12、相関値0.94程度の高い精度の推定が可能であることを示した。
(2)残響に対しては、一定以上の精度で推定はできるが、了解度を推定するには不十分であった。そこで今まで用いていた単純な密結合ネットワークに対し、Convolutional Networkを利用して精度向上を試みた。しかしこれを用いてもなお密結合ネットワークを用いた場合と同程度の精度しか達成できていない。
(3)加算雑音、残響いずれの劣化に対しても位相が正確に再現できることで推定精度が向上できることが期待できる。そこで今年度はやはりDNNを用いて位相成分の推定を試み、これにより推定精度の向上を狙う。
(4)残響劣化音声に対しては、他のネットワークトポロジーの導入を試みる。また、残響に相当する時間ー周波数成分に対してマスクを適用する方式も導入を試みる。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

加算雑音劣化音声に対しては、十分な精度で了解度が推定できている。
残響に対してはまだ満足な原音推定精度を達成できていないが、位相成分の推定高精度化で品質向上が図れる見通し得ている。

Strategy for Future Research Activity

加算雑音劣化音に対しては十分な了解度推定精度を示すことができたので、今後はより多様な加算雑音に対する性能評価を行うとともに、学習量を増やしてさらなる推定精度向上を図る。
残響劣化音声に対しては位相推定精度の向上を図るとともに、他のネットワーク・トポロジーを試して、原音推定精度の向上をまず図る。そのうえ、了解度推定を試みる。
最後に加算雑音、残響双方を含む音声信号に対し、学習したDNNを用いて原音声を推定し、この推定原音声と推定劣化成分から、両劣化を含む音声信号の了解度の推定を試みる。

Causes of Carryover

前年度国際学会が国内開催となったため生じた剰余金がまだ残った。
次年度は主に国内旅費と国際学会旅費として支出予定。

  • Research Products

    (6 results)

All 2019 2018

All Presentation (6 results) (of which Int'l Joint Research: 3 results)

  • [Presentation] 雑音除去を用いたノンレファレンス単語音声了解度推定法の検討2019

    • Author(s)
      高橋 宙人、近藤 和弘
    • Organizer
      日本音響学会春季研究発表会
  • [Presentation] CNNを用いた残響除去の検討2019

    • Author(s)
      中澤 和司、近藤 和弘
    • Organizer
      日本音響学会春季研究発表会
  • [Presentation] Binaural Speech Intelligibility Estimation Using Deep Neural Networks2018

    • Author(s)
      Kondo Kazuhiro, Taira Kazuya, Kobayashi Yosuke
    • Organizer
      Interspeech
    • Int'l Joint Research
  • [Presentation] 加算雑音のある単語音声了解度推定のための深層学習を用いた雑音低減手法の検討2018

    • Author(s)
      高橋宙人、近藤和弘
    • Organizer
      電気関係学会東北支部連合大会
  • [Presentation] On a Reference Signal Estimation from Noisy Speech Using Deep Learning for Intelligibility Estimation2018

    • Author(s)
      Takahashi Hiroto, Kondo Kazuhiro
    • Organizer
      Global Conference on Consumer Electronics
    • Int'l Joint Research
  • [Presentation] De-reverberation Using DNN for Non-reference Reverberant Speech Intelligibility Estimation2018

    • Author(s)
      Nakazawa Kazushi, Kondo Kazuhiro
    • Organizer
      Global Conference on Consumer Electronics
    • Int'l Joint Research

URL: 

Published: 2019-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi