• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2018 Fiscal Year Annual Research Report

Development of speech intelligibility evaluation index applicable to hearing impaired listeners

Research Project

Project/Area Number 17J04227
Research InstitutionWakayama University

Principal Investigator

山本 克彦  和歌山大学, システム工学研究科, 特別研究員(DC2)

Project Period (FY) 2017-04-26 – 2019-03-31
Keywords音声了解度 / 客観評価指標 / 聴覚モデル / 音声強調処理 / 主観評価
Outline of Annual Research Achievements

本研究の目的は、高い予測精度と利便性を持った音声明瞭度(了解度)予測法を確立することである。前年度に提案したGEDIに関する研究を進めていく上で、「非定常な雑音下では音声了解度の予測精度が低下する」という新たな問題が明らかになった。そのため、本研究では「実環境を想定した非定常なバブル雑音下に対応した音声了解度予測法の開発」を追加課題として,以下の研究を進めた。
(1) バブル雑音下に対応した音声了解度予測法の開発:昨年度に提案したGEDIを多重時間解像度版に拡張した mr-GEDIを提案した。mr-GEDIでは、振幅包絡領域における信号対歪み比 (SDRenv)を計算するという方式はそのままに、変調フィルタバンクの出力を時間波形として抽出し、変調フィルタのチャンネルに依存した時間長の短時間フレームで振幅包絡パワーを計算することでSDRenvを算出する。
(2)提案手法の評価:前年度のピンク雑音環境下に加えて、バブル雑音環境下での主観評価の結果を得るために聴取実験を実施した。また、前年度と同様に古典的なスペクトル減算法や最新のウィナーフィルタ型の雑音抑圧法を適用した強調音声を使用して実験を行った。その後、提案手法と既存の客観評価指標であるGEDI、 STOIやHASPIで客観評価を実施した。結果として、提案手法であるmr-GEDIは、GEDI、STOIやHASPIよりも精度良く聴取実験結果を説明できることを示した。
(3)提案法の評価用パッケージの公開:前年度に提案したGEDIに加えて、今年度に提案したmr-GEDIに関して特許を出願した。その上で、国内外の研究活動を推進することを目的として、GEDIとmr-GEDIをGitHub上にオープンソースソフトウェアとして公開した。
以上の一連の研究成果に加えて、現状での問題点や残された研究課題について自身の博士論文に詳細に記載した。

Research Progress Status

平成30年度が最終年度であるため、記入しない。

Strategy for Future Research Activity

平成30年度が最終年度であるため、記入しない。

  • Research Products

    (8 results)

All 2019 2018 Other

All Journal Article (1 results) (of which Peer Reviewed: 1 results,  Open Access: 1 results) Presentation (4 results) (of which Int'l Joint Research: 2 results,  Invited: 1 results) Remarks (2 results) Patent(Industrial Property Rights) (1 results) (of which Overseas: 1 results)

  • [Journal Article] Speech intelligibility prediction with the dynamic compressive gammachirp filterbank and modulation power spectrum2019

    • Author(s)
      Yamamoto Katsuhiko、Irino Toshio、Matsui Toshie、Araki Shoko、Kinoshita Keisuke、Nakatani Tomohiro
    • Journal Title

      Acoustical Science and Technology

      Volume: 40 Pages: 84~92

    • DOI

      https://doi.org/10.1250/ast.40.84

    • Peer Reviewed / Open Access
  • [Presentation] 研究をはじめてから国際会議と学術論文に採択されるまで2019

    • Author(s)
      山本克彦
    • Organizer
      日本音響学会2019年春季研究発表会
    • Invited
  • [Presentation] Multi-resolution Gammachirp Envelope Distortion Index for Intelligibility Prediction of Noisy Speech2018

    • Author(s)
      Yamamoto Katsuhiko、Irino Toshio、Ohashi Narumi、Araki Shoko、Kinoshita Keisuke、Nakatani Tomohiro
    • Organizer
      Interspeech 2018
    • Int'l Joint Research
  • [Presentation] Speech intelligibility prediction using a multi-resolution gammachirp envelope distortion index with common parameters for different noise conditions2018

    • Author(s)
      Yamamoto Katsuhiko、Irino Toshio、Araki Shoko、Kinoshita Keisuke、Nakatani Tomohiro
    • Organizer
      Universal Symposium on Universal Acoustical Communication 2018 (UAC2018)
    • Int'l Joint Research
  • [Presentation] 複数の雑音条件下における共通パラメータを用いた音声了解度予測2018

    • Author(s)
      山本克彦, 入野俊夫, 荒木章子, 木下慶介, 中谷智広
    • Organizer
      日本音響学会2018年秋季研究発表会
  • [Remarks] 研究者ページ

    • URL

      https://sites.google.com/site/kyama0321/

  • [Remarks] 研究成果公開用のGitHubページ

    • URL

      https://github.com/AMLAB-Wakayama

  • [Patent(Industrial Property Rights)] 音声明瞭度計算方法、音声明瞭度計算装置及び音声明瞭度計算プログラム2018

    • Inventor(s)
      荒木章子,木下慶介,中谷智広,山本克彦,入野俊夫,松井淑恵
    • Industrial Property Rights Holder
      荒木章子,木下慶介,中谷智広,山本克彦,入野俊夫,松井淑恵
    • Industrial Property Rights Type
      特許
    • Industrial Property Number
      PCT/JP2018/029317
    • Overseas

URL: 

Published: 2019-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi