• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2018 Fiscal Year Annual Research Report

Development of speech intelligibility index and assistive techniques based on auditory characteristics

Research Project

Project/Area Number 16H01734
Research InstitutionWakayama University

Principal Investigator

入野 俊夫  和歌山大学, システム工学部, 教授 (20346331)

Co-Investigator(Kenkyū-buntansha) 吐師 道子  県立広島大学, 保健福祉学部(三原キャンパス), 教授 (40347779)
岡本 康秀  慶應義塾大学, 医学部(信濃町), 客員講師 (10317224)
津崎 実  京都市立芸術大学, 音楽学部, 教授 (60155356)
松井 淑恵  豊橋技術科学大学, 工学(系)研究科(研究院), 准教授 (10510034)
戸田 智基  名古屋大学, 情報基盤センター, 教授 (90403328)
河原 英紀  和歌山大学, 学内共同利用施設等, 名誉教授 (40294300)
坂野 秀樹  名城大学, 理工学部, 准教授 (20335003)
森勢 将雅  山梨大学, 大学院総合研究部, 准教授 (60510013)
西村 竜一  和歌山大学, システム工学部, 助教 (00379611)
榊原 健一  北海道医療大学, リハビリテーション科学部, 准教授 (80396168)
水町 光徳  九州工業大学, 大学院工学研究院, 准教授 (90380740)
Project Period (FY) 2016-04-01 – 2020-03-31
Keywords明瞭音声 / 音声了解度客観指標 / 模擬難聴 / 補聴器処方式 / 音声分析合成 / 実時間音声信号処理 / 言語聴覚士養成課程 / 発話訓練
Outline of Annual Research Achievements

目標達成のための4研究項目を推進し、以下の成果を得た。 【1】聴覚信号処理: 新客観音声了解度指標"GEDI"(ジェダイ)を用いると、2種類の雑音下の強調音声において従来手法よりも精度良く推定ができることを示した。外国特許申請を完了し、H31年4月初旬に論文投稿とソフトウェア公開もした。また、模擬難聴条件下で補聴器を用いた場合の了解度試験も実施してデータを得た。 【2】難聴/健聴特性解明・主観評価: 聴覚末梢系特性の高精度推定のための蝸牛雑音フロアを導入した新手法について国際会議で発表し論文化した。音声からの寸法知覚に関して、通常発声とささやき声を直接比較する心理実験をさらに追加し、国際会議に投稿した。チャープ信号を用いた聴性脳幹反応 (ABR)特性の強調手法の有効性が確認でき、論文化した。模擬難聴者実験のパラダイムを音声明瞭性実験から寸法知覚実験や楽器演奏実験にも展開し、従来にない知見を得た。【3】音声音響信号処理: 模擬難聴システムの背景となる信号処理に関してまとめ、国際会議で招待講演を行った。また、この実時間処理手法と特性に関しても国際会議で発表し論文化した。高品質音声分析合成系において新規駆動音源を開発し、品質を向上させた。8chマイクロホンアレー出力をDNNによりチューニングすることにより、補聴器使用時の選択的聴取及び空間定位を支援する枠組みを提案した。音声合成処理の品質改善に向けて、DNNに基づく波形生成モデルであるニューラルボコーダの改良を行い国際会議で発表した。【4】教育評価・明瞭音声データ: 模擬難聴システムを用いた発話の明瞭化訓練の音声の評価実験をさらに進めた。分析とデータベース化のためのアノテーションを進めた。模擬難聴を用いた訓練により発話速度が有意に遅くなり、3ヶ月後でも効果が持続することを発見した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

研究が順調に進んでいる。いずれも新しい知見獲得等の大きな成果が得られた。【1】聴覚信号処理:新音声了解度客観評価指標"GEDI"に関して論文化を進め、ソフトウェア公開を現時点ではたした。今後モデルの構築や性能評価に供するための、模擬難聴者+補聴器の音声了解度実験等でも順調にデータ収集できた。【2】難聴/健聴特性解明・主観評価: 聴覚末梢系特性を推定する新手法や寸法知覚実験に関して大きな前進をみた。聴性脳幹反応(ABR)特性の強調処理は、聴神経系疾患であるシナプトパシーの推定をするために重要なステップである。さらに模擬難聴者実験を、寸法知覚・音声合成品質評価・楽器演奏研究へと展開し、適用範囲を大きく広げた。これは、今後の難聴者にとっての明瞭な音声や音知覚特性研究に対して、パラダイムシフトをもたらす枠組みになると考える。【3】音声音響信号処理: 模擬難聴システムを様々な手段で実装するとともに、国際会議等で広めることができた。また、明瞭音声合成系に向けた研究や、補聴器処理にも組み込める選択的聴取実現への基盤の研究が推進できた。【4】教育評価・明瞭音声データ: 言語聴覚士養成課程における演習を毎年おこなってきた結果、教育プログラムが成熟してきて外部の養成機関に展開できる状況になった。また、発話訓練に模擬難聴システムが貢献しうることも示すことができた。

Strategy for Future Research Activity

【1】聴覚信号処理: "GEDI"のデファクトスタンダード化を目指すとともに、DNNを用いた音声了解度客観評価手法の研究を進める。 【2】難聴/健聴特性解明・主観評価:蝸牛雑音フロアを導入した聴覚末梢系特性推定手法を、高齢難聴者データにも適用して有効性を検証する。音声からの寸法知覚に関して、知らない言語音を用いた実験や、高齢者/難聴者を対象とした実験を進めるとともに、適確に予測できる計算モデルを構築する。チャープ信号を用いた聴性脳幹反応 (ABR)の強調処理に関して条件を増やして最適解を探る。【3】音声音響信号処理:明瞭音声の動的特徴量(例:GEDIの特徴量)/高次統計量/音声生成特徴量の解明を進め、合成音声の明瞭化を試みるとともに評価を行う。このためにも高品質音声分析合成系の精度をさらに向上させる。さらにテキスト音声合成に適用し、明瞭音声の合成-評価-改善のサイクルを確立するための枠組みを整備する。【4】教育評価・明瞭音声データ:模擬難聴システムGUIをMATLAB実行形式とC言語ベースで構築して広く配布できるようにする。模擬難聴による演習のデモを行って国内外でアピールし、様々な養成機関において教育プログラムの展開を図る。明瞭音声の特性を探るため収録したデータにさらにアノテーションを付与し、データベース構築を着実に進める。

  • Research Products

    (47 results)

All 2019 2018 Other

All Int'l Joint Research (2 results) Journal Article (8 results) (of which Int'l Joint Research: 2 results,  Peer Reviewed: 7 results,  Open Access: 3 results) Presentation (35 results) (of which Int'l Joint Research: 12 results,  Invited: 1 results) Remarks (1 results) Patent(Industrial Property Rights) (1 results) (of which Overseas: 1 results)

  • [Int'l Joint Research] Cambridge University(英国)

    • Country Name
      UNITED KINGDOM
    • Counterpart Institution
      Cambridge University
  • [Int'l Joint Research] University Lyon / CNRS(フランス)

    • Country Name
      FRANCE
    • Counterpart Institution
      University Lyon / CNRS
  • [Journal Article] Two-Point Method for Measuring the Temporal Modulation Transfer Function2019

    • Author(s)
      Morimoto Takashi、Irino Toshio、Harada Kouta、Nakaichi Takeshi、Okamoto Yasuhide、Kanno Ayako、Kanzaki Sho、Ogawa Kaoru
    • Journal Title

      Ear and Hearing

      Volume: 40 Pages: 55~62

    • DOI

      http://dx.doi.org/10.1097/AUD.0000000000000590

    • Peer Reviewed
  • [Journal Article] Speech intelligibility prediction with the dynamic compressive gammachirp filterbank and modulation power spectrum2019

    • Author(s)
      Yamamoto Katsuhiko、Irino Toshio、Matsui Toshie、Araki Shoko、Kinoshita Keisuke、Nakatani Tomohiro
    • Journal Title

      Acoustical Science and Technology

      Volume: 40 Pages: 84~92

    • DOI

      https://doi.org/10.1250/ast.40.84

    • Peer Reviewed / Open Access
  • [Journal Article] Rising-frequency chirp stimulus to effectively enhance wave-I amplitude of auditory brainstem response2019

    • Author(s)
      Morimoto Takashi、Fujisaka Yoh-ichi、Okamoto Yasuhide、Irino Toshio
    • Journal Title

      Hearing Research

      Volume: 377 Pages: 104~108

    • DOI

      https://doi.org/10.1016/j.heares.2019.03.016

    • Peer Reviewed
  • [Journal Article] Modification of Velvet Noise for Speech Waveform Generation by Using Vocoder-Based Speech Synthesizer2019

    • Author(s)
      Morise Masanori
    • Journal Title

      IEICE Transactions on Information and Systems

      Volume: E102.D Pages: 663~665

    • DOI

      10.1587/transinf.2018EDL8179

    • Peer Reviewed
  • [Journal Article] Auditory Filter Derivation at Low Levels where Masked Threshold Interacts with Absolute Threshold2018

    • Author(s)
      Irino Toshio、Yokota Kenji、Matsui Toshie、Patterson Roy D.
    • Journal Title

      Acta Acustica united with Acustica

      Volume: 104 Pages: 887~890

    • DOI

      https://doi.org/10.3813/AAA.919247

    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Journal Article] A Real Time Hearing Loss Simulator2018

    • Author(s)
      Grimault Nicolas、Irino Toshio、Dimachki Samar、Corneyllie Alexandra、Patterson Roy D.、Garcia Samuel
    • Journal Title

      Acta Acustica united with Acustica

      Volume: 104 Pages: 904~908

    • DOI

      https://doi.org/10.3813/AAA.919252

    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Journal Article] 高齢難聴者の文聴取における文節休止の効果 - 模擬難聴システムを用いたシミュレーションによる検討 -2018

    • Author(s)
      畑山春菜, 長谷川純, 吐師道子, 松井淑恵, 入野俊夫
    • Journal Title

      「人間と科学」, 県立広島大学保健福祉学部誌

      Volume: 18 Pages: 19~26

  • [Journal Article] Sound quality comparison among high-quality vocoders by using re-synthesized speech2018

    • Author(s)
      Morise Masanori、Watanabe Yusuke
    • Journal Title

      Acoustical Science and Technology

      Volume: 39 Pages: 263~265

    • DOI

      https://doi.org/10.1250/ast.39.263

    • Peer Reviewed
  • [Presentation] 模擬難聴システムを用いた発声訓練が発話長に与える効果とその持続性2019

    • Author(s)
      東山宗一, 入野俊夫, 山内悠記
    • Organizer
      日本音響学会:春季研究発表会
  • [Presentation] 模擬難聴を使った聴力低下による音声寸法弁別特性への影響2019

    • Author(s)
      米満麻弥, 入野俊夫, 上村怜央, Roy D. Patterson
    • Organizer
      日本音響学会:春季研究発表会
  • [Presentation] 通常発声とささやき声を対比した場合の寸法知覚2019

    • Author(s)
      上村怜央, 入野俊夫 , Roy D. Patterson
    • Organizer
      日本音響学会:春季研究発表会
  • [Presentation] ノッチ雑音レベルに依存した蝸牛雑音を考慮した聴覚フィルタ特性推2019

    • Author(s)
      横田健治, 入野俊夫 , 松浦弘樹, Roy D. Patterson
    • Organizer
      日本音響学会:春季研究発表会
  • [Presentation] Baseline design of a VOCODER based on an interference-free spectral representation and a generalized excitation source representation2019

    • Author(s)
      H. Kawahara, K.-I. Sakakibara, and M. Morise,
    • Organizer
      日本音響学会春季研究発表会
  • [Presentation] 内側オリーブ蝸牛反射に対する音楽経験の影響:専攻楽器の影響はあるか?2019

    • Author(s)
      津崎実, 松浦佑美, 大塚翔, 古川茂人
    • Organizer
      日本音響学会聴覚研究会
  • [Presentation] 2純音の同時性判断課題における融合・分離判断の混入割合2019

    • Author(s)
      岡崎聡, 津崎実
    • Organizer
      日本音響学会春季研究発表会
  • [Presentation] 調波複合音と純音によるビブラートの聞こえ方の違い2019

    • Author(s)
      鈴木颯, 平山亮, 田中敏文, 津崎実, 河原英紀
    • Organizer
      日本音響学会春季研究発表会
  • [Presentation] 遅延を伴って両耳呈示した同じ周期を持つふたつのパルス列のオクターブ・シフト2019

    • Author(s)
      渡邉栞, 津崎実
    • Organizer
      日本音響学会春季研究発表会
  • [Presentation] Multi-resolution Gammachirp Envelope Distortion Index for Intelligibility Prediction of Noisy Speech2018

    • Author(s)
      Katsuhiko Yamamoto, Toshio Irino, Narumi Ohashi, Shoko Araki, Keisuke Kinoshita, Tomohiro Nakatani
    • Organizer
      Interspeech 2018
    • Int'l Joint Research
  • [Presentation] Frequency Domain Variants of Velvet Noise and Their Application to Speech Processing and Synthesis2018

    • Author(s)
      Hideki Kawahara and Ken-Ichi Sakakibara and Masanori Morise and Hideki Banno and Tomoki Toda and Toshio Irino
    • Organizer
      Interspeech 2018
    • Int'l Joint Research
  • [Presentation] Speech intelligibility prediction using a multi-resolution gammachirp envelope distortion index with common parameters for different noise conditions2018

    • Author(s)
      Katsuhiko Yamamoto, Toshio Irino, Shoko Araki, Keisuke Kinoshita, and Tomohiro Nakatani
    • Organizer
      Seminar on brain, hearing and speech sciences for universal speech communication
    • Int'l Joint Research
  • [Presentation] Effet differencie d’un simulateur de perte auditive sur la compression cocheaire et la selectivite frequentielle2018

    • Author(s)
      Nicolas Grimault, Toshio Irino, Samar Dimachki, Alexandra Corneyllie, Roy D. Patterson, Samuel Garcia
    • Organizer
      CFA 18 - French Acoustical Congress of Acoustic
    • Int'l Joint Research
  • [Presentation] The gammachirp auditory filter and its application to speech perception2018

    • Author(s)
      Toshio Irino, Roy D. Patterson
    • Organizer
      International Symposium on Universal Acoustical Communication 2018
    • Int'l Joint Research / Invited
  • [Presentation] 模擬難聴システムを用いた発話訓練による音声の 明瞭性向上の評価2018

    • Author(s)
      東山宗一,入野俊夫
    • Organizer
      情報処理学会, 音学シンポジウム2018
  • [Presentation] 通常発声とささやき声を比較した時の寸法知覚-どちらが小さい話者に聞こえる?2018

    • Author(s)
      上村 怜央 , 入野 俊夫 , Roy D. Patterson
    • Organizer
      情報処理学会, 音学シンポジウム2018
  • [Presentation] 蝸牛雑音を導入した絶対閾値と聴覚フィルタ特性の同時推定2018

    • Author(s)
      横田 健治, 入野 俊夫 , 松井 淑恵 , Roy D. Patterson
    • Organizer
      情報処理学会, 音学シンポジウム2018
  • [Presentation] 複数の雑音条件下における共通パラメータを用いた音声了解度予測2018

    • Author(s)
      山本克彦,入野俊夫,荒木章子,木下慶介,中谷智広
    • Organizer
      日本音響学会:秋季研究発表会
  • [Presentation] ガンマチャープ聴覚フィルタバンクに基づく模擬難聴システムの実装と教育応用2018

    • Author(s)
      松井淑恵,坂野秀樹,西村竜一,入野俊夫
    • Organizer
      電子情報通信学会, 音声研究会/福祉工学研究会
  • [Presentation] レベル依存性のある蝸牛雑音フロアを考慮した聴覚フィルタ特性の推定2018

    • Author(s)
      横田 健治, 入野 俊夫 , 松浦 弘樹, Roy D. Patterson
    • Organizer
      日本音響学会 聴覚研究会
  • [Presentation] 発話の好感度改善を目的とした音声加工技術の検討2018

    • Author(s)
      堀池梓哉,森勢将雅
    • Organizer
      情報処理学会音楽情報科学研究会
  • [Presentation] Frequency domain variants of velvet noise and their application to speech processing and synthesis2018

    • Author(s)
      H. Kawahara, K.-I. Sakakibara, M. Morise, H. Banno, T. Toda, and T. Irino
    • Organizer
      Interspeech 2018
    • Int'l Joint Research
  • [Presentation] Revisiting spectral envelope recovery from speech sounds generated by periodic excitation2018

    • Author(s)
      Hideki Kawahara, Masanori Morise, and Kanru Hua
    • Organizer
      2018 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC)
    • Int'l Joint Research
  • [Presentation] Neural network-based beamformer with dual cost functions2018

    • Author(s)
      M. Mizumachi and K. Eguchi
    • Organizer
      WESPAC 2018
    • Int'l Joint Research
  • [Presentation] Noise Reduction using Neural Network Trained with Amplitude Spectra2018

    • Author(s)
      M. Mizumachi and R. Otani
    • Organizer
      Inter-noise 2018
    • Int'l Joint Research
  • [Presentation] 交互学習と多層化によるニューラルネットワークビームフォーマの音声歪み低減の検討2018

    • Author(s)
      江口 航平, 水町 光徳
    • Organizer
      電子情報通信学会 応用音響研究会
  • [Presentation] スペクトル歪み評価関数と指向特性評価関数を用いた交互学習による非線形ビームフォーマ2018

    • Author(s)
      江口 航平, 水町 光徳
    • Organizer
      日本音響学会 秋季研究発表会
  • [Presentation] Collapsed Speech Segment Detection and Suppression for WaveNet Vocoder2018

    • Author(s)
      Yi-Chiao Wu, Kazuhiro Kobayashi, Tomoki Hayashi, Patrick Lumban Tobing, Tomoki Toda
    • Organizer
      Interspeech 2018
    • Int'l Joint Research
  • [Presentation] 歯茎破裂音調音における舌先運動スピードの経時変化パタンと発話の明瞭さの関係2018

    • Author(s)
      立川渉, 吐師道子, 北村達也, 能田由紀子
    • Organizer
      日本音響学会秋季研究発表会
  • [Presentation] 模擬難聴聴覚フィードバック下でのピアノ演奏の変容:鍵間変動の検討2018

    • Author(s)
      津崎実, 前川典子, 大澤智恵
    • Organizer
      日本音響学会秋季研究発表会
  • [Presentation] Piano performance under a simulated hearing impairment: Effects of compression on the key velocity and the output power2018

    • Author(s)
      M. Tsuzaki , N. Maegawa, and C. Osawa
    • Organizer
      International Symposium on Universal Acoustical Communication 2018
    • Int'l Joint Research
  • [Presentation] 模擬難聴聴覚フィードバック下 でのピアノ演奏の変容について2018

    • Author(s)
      津崎実,前川典子,大澤智恵
    • Organizer
      日本音楽知覚認知学会
  • [Presentation] A pitch encoding model based on the intrinsic oscillation circuit: Effects of the time constant and input stimulus types2018

    • Author(s)
      Tsuzaki, M., Maki, K.
    • Organizer
      Meeting of the Journal of the Acoustical Society of America
    • Int'l Joint Research
  • [Presentation] 半周期の位相差を持つ2つのパルス列の両耳間差がピッチに与える影響2018

    • Author(s)
      渡邉栞, 津崎実
    • Organizer
      日本音響学会秋季研究発表会
  • [Presentation] 純音の知覚検出時点でのばらつきと周波数の関係2018

    • Author(s)
      岡崎聡, 津崎実
    • Organizer
      日本音響学会秋季研究発表会
  • [Remarks] 入野俊夫home page

    • URL

      https://web.wakayama-u.ac.jp/~irino/

  • [Patent(Industrial Property Rights)] 音声明瞭度計算方法、音声明瞭度計算装置及び音声明瞭度計算プログラム2018

    • Inventor(s)
      Araki, Yamamoto, Irino, et al.
    • Industrial Property Rights Holder
      Araki, Yamamoto, Irino, et al.
    • Industrial Property Rights Type
      特許
    • Industrial Property Number
      PCT/JP2018/029317
    • Overseas

URL: 

Published: 2019-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi