• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2022 Fiscal Year Annual Research Report

Auditory Enrichment based on perception of amplitude modulation: Study on speech signal processing for Cochlear Implant

Research Project

Project/Area Number 21H03463
Allocation TypeSingle-year Grants
Research InstitutionJapan Advanced Institute of Science and Technology

Principal Investigator

鵜木 祐史  北陸先端科学技術大学院大学, 先端科学技術研究科, 教授 (00343187)

Co-Investigator(Kenkyū-buntansha) 荒木 友希子  金沢大学, 人間科学系, 准教授 (30334741)
木谷 俊介  北陸先端科学技術大学院大学, 先端科学技術研究科, 講師 (70635367)
Project Period (FY) 2021-04-01 – 2025-03-31
Keywords振幅変調知覚 / 人工内耳用音声信号処理 / 非言語情報 / 聴覚エンリッチメント
Outline of Annual Research Achievements

本研究では,人工内耳用音声信号処理(雑音駆動型音声合成)技術に非言語情報を獲得・付与・強調する仕組み,ならびに騒音抑圧機能を持たせることで,聴覚エンリッチメントを実現する.そのため,次のような四つのワークプランに沿って研究を実施する.まず,①聴覚特性を考慮した雑音駆動音声合成系を構築し,②この処理体系で,音声言語の知覚に影響を与えないような騒音抑圧法を提案する.次に,③この処理体系で,音声の非言語情報が時間的な振幅包絡線にどのように含まれているか,さらにはどのように強調できるかを変調スペクトル分析と聴取実験により検討する.最後に,④人工内耳用音声信号処理技術に転化する「補償処理」について総合的に検討する.
本年度(2022年度)は,課題②と課題③に取り組んだ.まず,課題②では,騒音が音声の振幅包絡線情報でどのように表現されるか調べ,その抑圧法を検討した.特に,ここではスペクトル変調・時間変調(STM)分析を利用して様々な種類の雑音を分析し,そのSTM情報表現における雑音除去法を検討した.その結果,聴感上,抑圧効果の高い雑音除去を実現できた.次に課題③では,音声の非言語情報,特に感情と緊迫感が時間的な振幅包絡線にどのように含まれているか,あるいはどのような変調周波数成分に含まれているかを,変調フィルタバンクから得られる変調スペクトログラムならびにSTM分析を利用して調査した.その結果,変調スペクトル歪度と変調スペクトル傾斜が感情認識において共通で重要な特徴であることと,雑音・残響に頑健な特徴であることを明らかにした.これらが個人性ならびに緊迫感に関して重要であるかは未検討であり,今後の課題として検討する.最後に,変調スペクトルに現れる特徴が緊迫感にどのようにかかわるかを再調査した.その結果,音声の振幅包絡線情報に含まれる4~16 Hzの変調情報が重要であることを確認した.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

今年度(2年次)は,課題②と課題③に取り組んだ.課題②では,帯域分割型雑音駆動音声合成法における変調スペクトログラムの操作法を検討した.特に,この処理の延長にあるスペクトル変調・時間変調(STM)分析を検討し,音声の振幅包絡線の情報表現について再考した.課題②では,騒音がSTMにおいてどのように表現されるかを調べ,その抑圧法について検討した.課題③では,音声の非言語情報(感情や緊迫感)が時間的な振幅包絡線にどのように含まれているか,さらにSTMにおいてどのように表現されるかを先取りして検討を進めることができた.これらの進捗状況から,順調に進んでいると判断できる.

Strategy for Future Research Activity

研究メンバー間で定期的にオンラインミーティングを開き,研究議論を深めていく.現在,学内においては,計画通りに聴覚心理実験を実施できているが,人工内耳装用者を対象とした実験を実施する場合,今以上に感染症対策を十分に練って実施する必要がある.実施時期など状況をみながら先取りするような形で研究を実施できるように努める.

  • Research Products

    (20 results)

All 2023 2022

All Journal Article (6 results) (of which Int'l Joint Research: 2 results,  Peer Reviewed: 6 results,  Open Access: 1 results) Presentation (14 results) (of which Int'l Joint Research: 5 results,  Invited: 2 results)

  • [Journal Article] Contribution of Common Modulation Spectral Features to Vocal-Emotion Recognition of Noise-Vocoded Speech in Noisy Reverberant Environments2022

    • Author(s)
      Guo Taiyang、Zhu Zhi、Kidani Shunsuke、Unoki Masashi
    • Journal Title

      Applied Sciences

      Volume: 12 Pages: 9979~9979

    • DOI

      10.3390/app12199979

    • Peer Reviewed / Open Access
  • [Journal Article] Reconstruction of speech spectrogram based on non-invasive EEG signal2022

    • Author(s)
      Zhou Di、Unoki Masashi、Zhang Gaoyan、Dang Jianwu
    • Journal Title

      Proc. ISCSLP2022

      Volume: ー Pages: 275-279

    • DOI

      10.1109/ISCSLP57327.2022.10038234

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] Dialogue scenario classification based on social factors2022

    • Author(s)
      Liu Yuning、Zhou Di、Unoki Masashi、Dang Jianwu、Li Aijun
    • Journal Title

      Proc. ISCSLP2022

      Volume: ー Pages: 379~383

    • DOI

      10.1109/ISCSLP57327.2022.10037880

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] Learning Emotion Information for Expressive Speech Synthesis Using Multi-resolution Modulation-filtered Cochleagram2022

    • Author(s)
      Zhang Kaili、Unoki Masashi
    • Journal Title

      Proc. APSIPA2022

      Volume: ー Pages: 227~233

    • DOI

      10.23919/APSIPAASC55919.2022.9979810

    • Peer Reviewed
  • [Journal Article] Investigation of noise-reverberation-robustness of modulation spectral features for speech-emotion recognition2022

    • Author(s)
      Guo Taiyang、Li Sixia、Unoki Masashi、Okada Shogo
    • Journal Title

      Proc. APSIPA2022

      Volume: ー Pages: 39~46

    • DOI

      10.23919/APSIPAASC55919.2022.9980032

    • Peer Reviewed
  • [Journal Article] Speech Intelligibility Prediction for Hearing Aids Using an Auditory Model and Acoustic Parameters2022

    • Author(s)
      Titalim Benita Angela、Mawalim Candy Olivia、Okada Shogo、Unoki Masashi
    • Journal Title

      Proc. APSIPA2022

      Volume: ー Pages: 1077~1085

    • DOI

      10.23919/APSIPAASC55919.2022.9980000

    • Peer Reviewed
  • [Presentation] 感情音声認識における変調スペクトル特徴の雑音残響に対する頑健性の分析2023

    • Author(s)
      郭 太陽, 李 思侠, 鵜木祐史, 岡田将吾
    • Organizer
      日本音響学会2023年度春季研究発表会
  • [Presentation] 骨導提示音による気導提示音の抑圧効果2023

    • Author(s)
      井上隼輔, 鳥谷輝樹, 上江洲 安史, 鵜木祐史
    • Organizer
      日本音響学会2023年度春季研究発表会
  • [Presentation] 子音強調処理の改良による骨導提示音声の了解度改善2023

    • Author(s)
      王 思成, 上江洲安史, 鳥谷輝樹, 鵜木祐史
    • Organizer
      日本音響学会2023年度春季研究発表会
  • [Presentation] 残響音声からの変調伝達関数・音声伝送指標・室内音響パラメータのブラインド推定法2023

    • Author(s)
      鵜木祐史
    • Organizer
      日本音響学会音声研究会
  • [Presentation] 音声に含まれる緊迫感の変調周波数帯域の検討2023

    • Author(s)
      木谷俊介,劉小テイ,郭太陽,磯山拓都,李軍鋒,赤木正人,鵜木祐史
    • Organizer
      日本音響学会音声研究会
  • [Presentation] Automatic Mean Opinion Score Estimation with Temporal Modulation Features on Gammatone Filterbank for Speech Assessment2022

    • Author(s)
      Quoc-Huy Nguyen, Kai Li, Masashi Unoki
    • Organizer
      Interspeech2022
    • Int'l Joint Research
  • [Presentation] Method for improving the word intelligibility of presented speech using bone-conduction headphones2022

    • Author(s)
      Teruki Toya, Wenyu Zhu, Maori Kobayashi, Kenichi Nakamura and Masashi Unoki
    • Organizer
      Interspeech2022
    • Int'l Joint Research
  • [Presentation] OBISHI: Objective Binaural Intelligibility Score for the Hearing Impaired2022

    • Author(s)
      Candy Olivia Mawalim, Benita Angela Titalim, Masashi Unoki, and Shogo Okada
    • Organizer
      The 18th Australasian International Conference on Speech Science and Technology
    • Int'l Joint Research
  • [Presentation] Study on the modulation frequency range that contributes to the perception of urgency2022

    • Author(s)
      Shunsuke Kidani, Xiaoting Liu, Taiyang Guo, Takuto Isoyama, Junfeng Li, Masashi Unoki
    • Organizer
      International Congress of Acoustics 2022 (ICA2022)
    • Int'l Joint Research
  • [Presentation] Subjective evaluation regarding mixing ratio of bone-conducted to air-conducted speech for own-voice perception2022

    • Author(s)
      Teruki Toya, Peter Birkholz, and Masashi Unoki
    • Organizer
      International Congress of Acoustics 2022 (ICA2022)
    • Int'l Joint Research
  • [Presentation] 周波数帯域のパワー比に基づいた子音区間検出法の検討2022

    • Author(s)
      王思成,上江洲安史,鵜木祐史
    • Organizer
      第37回信号処理シンポジウム
  • [Presentation] 骨導提示音声の了解度改善のための子音強調処理の改良2022

    • Author(s)
      王 思成,上江洲安史,鳥谷輝樹,鵜木祐史
    • Organizer
      日本音響学会聴覚研究会
  • [Presentation] 骨導音の考え方とその応用事例2022

    • Author(s)
      鵜木祐史
    • Organizer
      日本騒音制御工学会研究発表会
    • Invited
  • [Presentation] 骨導ヘッドホンによる提示音声の単語了解度改善法2022

    • Author(s)
      鳥谷輝樹, ZHU Wenyu, 小林 まおり, 中村 健一, 鵜木 祐史
    • Organizer
      日本騒音制御工学会研究発表会
    • Invited

URL: 

Published: 2023-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi