• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2023 Fiscal Year Annual Research Report

Auditory Enrichment based on perception of amplitude modulation: Study on speech signal processing for Cochlear Implant

Research Project

Project/Area Number 21H03463
Allocation TypeSingle-year Grants
Research InstitutionJapan Advanced Institute of Science and Technology

Principal Investigator

鵜木 祐史  北陸先端科学技術大学院大学, 先端科学技術研究科, 教授 (00343187)

Co-Investigator(Kenkyū-buntansha) 荒木 友希子  金沢大学, 人文学系, 教授 (30334741)
木谷 俊介  北陸先端科学技術大学院大学, 先端科学技術研究科, 講師 (70635367)
Project Period (FY) 2021-04-01 – 2025-03-31
Keywords振幅変調知覚 / 人工内耳用音声信号処理 / 非言語情報 / 聴覚エンリッチメント
Outline of Annual Research Achievements

本研究では,人工内耳用音声信号処理(雑音駆動型音声合成)技術に非言語情報を獲得・付与・強調する仕組み,ならびに騒音抑圧機能を持たせることで,聴覚エンリッチメントを実現する.そのため,次のような四つのワークプランに沿って研究を実施する.まず,①聴覚特性を考慮した雑音駆動音声合成系を構築し,②この処理体系で,音声言語の知覚に影響を与えないような騒音抑圧法を提案する.次に,③この処理体系で,音声の非言語情報が時間的な振幅包絡線にどのように含まれているか,さらにはどのように強調できるかを変調スペクトル分析と聴取実験により検討する.最後に,④人工内耳用音声信号処理技術に転化する「補償処理」について総合的に検討する.
本年度(2023年度)は,課題③に取り組んだ.課題③では,まず音声の非言語情報,特に感情と緊迫感に関わる情報が音声の時間的な振幅包絡線にどのように含まれているか,あるいはどのような変調周波数成分に含まれているかを,変調フィルタバンクから得られる変調スペクトログラムならびにスペクトル変調・時間変調(STM)分析を利用して調査した.その結果,変調スペクトル歪度と変調スペクトル傾斜が感情認識において共通で重要な特徴であることを明らかにした.また,これらが雑音・残響に頑健であることを明らかにした.次に,感情と緊迫感に関して,音声の時間的な振幅包絡線に含まれる変調周波数成分を調査したところ,感情知覚では,振幅包絡線情報に含まれる0~16 Hzの変調情報が,緊迫感知覚では,振幅包絡線情報に含まれる4~16 Hzの変調情報が,重要であることを確認した.最後に,瞬時変調周波数の時間変化の傾きを制御することで,感情知覚と緊迫感知覚でそれらの知覚の消失が起こることが明らかになった.このことから瞬時変調周波数の時間変化の効果的な制御が感情・緊迫感知覚の補償処理として有効であると考えられる.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

今年度(3年次)は,音声の非言語情報,特に感情と緊迫感が時間的な振幅包絡線にどのように含まれているか,あるいはどのような変調周波数成分に含まれているかを,変調フィルタバンクを利用した時間・変調周波数分析(変調スペクトログラム)ならびにSTM分析から調査した.さらに,これらの結果から,感情や緊迫感をどのように強調できるかを変調スペクトログラムとSTMスペクトログラムでの情報表現と聴取実験により検討した.今年度の計画どおり,実施することができたため,予定通りの進捗が得られた.その中でも,音声の振幅包絡線情報に含まれる瞬時変調周波数の時間変化を操作することが非言語・パラ言語情報の補償処理に直結していることを明らかにした.このことから,瞬時変調周波数の時間変化を操作することで,非言語・パラ言語情報を補償できることが容易に予想できる.次年度には,感情知覚や緊迫感知覚の向上を目指した最終検討に入ることができることから,区分(2)の進捗状況であると判断した.

Strategy for Future Research Activity

研究メンバー間で定期的にオンラインミーティングを開き,研究議論を深めていく.現在,学内においては,計画通りに聴覚心理実験を実施できている.次年度は人工内耳装用者を対象とした実験を実施する予定であり,感染症対策を十分に練って実施する必要がある.実施時期など状況をみながら先取りするような形で研究を実施できるように努める.

  • Research Products

    (20 results)

All 2024 2023

All Journal Article (9 results) (of which Int'l Joint Research: 2 results,  Peer Reviewed: 9 results,  Open Access: 5 results) Presentation (11 results) (of which Int'l Joint Research: 5 results)

  • [Journal Article] Phase-Aware Speech Enhancement With Complex Wiener Filter2023

    • Author(s)
      Nguyen Huy、Ho Tuan Vu、Akagi Masato、Unoki Masashi
    • Journal Title

      IEEE Access

      Volume: 11 Pages: 141573~141584

    • DOI

      10.1109/ACCESS.2023.3341919

    • Peer Reviewed / Open Access
  • [Journal Article] Non-intrusive speech intelligibility prediction using an auditory periphery model with hearing loss2023

    • Author(s)
      Mawalim Candy Olivia、Titalim Benita Angela、Okada Shogo、Unoki Masashi
    • Journal Title

      Applied Acoustics

      Volume: 214 Pages: 109663~109663

    • DOI

      10.1016/j.apacoust.2023.109663

    • Peer Reviewed / Open Access
  • [Journal Article] Music Theory-Inspired Acoustic Representation for Speech Emotion Recognition2023

    • Author(s)
      Li Xingfeng、Shi Xiaohan、Hu Desheng、Li Yongwei、Zhang Qingchen、Wang Zhengxia、Unoki Masashi、Akagi Masato
    • Journal Title

      IEEE/ACM Transactions on Audio, Speech, and Language Processing

      Volume: 31 Pages: 2534~2547

    • DOI

      10.1109/TASLP.2023.3289312

    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Journal Article] Contributions of Temporal Modulation Cues in Temporal Amplitude Envelope of Speech to Urgency Perception2023

    • Author(s)
      Unoki Masashi、Kawamura Miho、Kobayashi Maori、Kidani Shunsuke、Li Junfeng、Akagi Masato
    • Journal Title

      Applied Sciences

      Volume: 13 Pages: 6239~6239

    • DOI

      10.3390/app13106239

    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Journal Article] Methods for improving word intelligibility of bone-conducted speech by using bone-conduction headphones2023

    • Author(s)
      Toya Teruki、Kobayashi Maori、Nakamura Kenichi、Unoki Masashi
    • Journal Title

      Applied Acoustics

      Volume: 207 Pages: 109337~109337

    • DOI

      10.1016/j.apacoust.2023.109337

    • Peer Reviewed / Open Access
  • [Journal Article] Incorporating the Digit Triplet Test in A Lightweight Speech Intelligibility Prediction for Hearing Aids2023

    • Author(s)
      Zhou Xiajie、Mawalim Candy Olivia、Angela Titalim Benita、Unoki Masashi
    • Journal Title

      Proc. APSIPA2023

      Volume: - Pages: 1593-1600

    • DOI

      10.1109/APSIPAASC58517.2023.10317260

    • Peer Reviewed
  • [Journal Article] Contribution of modulation spectral features for cross-lingual speech emotion recognition under noisy reverberant conditions2023

    • Author(s)
      Guo Taiyang、Li Sixia、Kidani Shunsuke、Okada Shogo、Unoki Masashi
    • Journal Title

      Proc. APSIPA2023

      Volume: - Pages: 2221-2227

    • DOI

      10.1109/APSIPAASC58517.2023.10317449

    • Peer Reviewed
  • [Journal Article] Auditory Model Optimization with Wavegram-CNN and Acoustic Parameter Models for Nonintrusive Speech Intelligibility Prediction in Hearing Aids2023

    • Author(s)
      Mawalim Candy Olivia、Titalim Benita Angela、Okada Shogo、Unoki Masashi
    • Journal Title

      Proc. EUSIPCO2023 (Helsink, Finland)

      Volume: - Pages: 211-215

    • DOI

      10.23919/EUSIPCO58844.2023.10289742

    • Peer Reviewed
  • [Journal Article] An Improved Optimal Transport Kernel Embedding Method with Gating Mechanism for Singing Voice Separation and Speaker Identification2023

    • Author(s)
      Yuan Weitao、Bian Yuren、Wang Shengbei、Unoki Masashi、Wang Wenwu
    • Journal Title

      Proc. ICASSP2023

      Volume: - Pages: -

    • DOI

      10.1109/ICASSP49357.2023.10096651

    • Peer Reviewed
  • [Presentation] Linear Model Approach to Investigate the Comprehensive Entrainment in Conversation,”, “Linear Model Approach to Investigate the Comprehensive Entrainment in Conversation2024

    • Author(s)
      Yuning Liu, Masashi Unoki
    • Organizer
      2024 RISP International Workshop on Nonlinear Circuits, Communications and Signal Processing (Hawaii)
    • Int'l Joint Research
  • [Presentation] Contributions of Instantaneous Modulation Components in Temporal Amplitude Envelope to Vocal Emotion Perception2024

    • Author(s)
      Taiyang Guo, Takuto Isoyama, Shunsuke Kidani, Masashi Unoki
    • Organizer
      日本音響学会2024年度春季研究発表会(拓殖大)
  • [Presentation] Conversation Scenario Classification Based on Conversation Entrainment2024

    • Author(s)
      Yuning Liu, Di Zhou, Jianwu Dang, Aijun Li, Masashi Unoki
    • Organizer
      日本音響学会2024年度春季研究発表会(拓殖大)
  • [Presentation] Leveraging Equalization-Cancellation Model in Speech Intelligibility Prediction for Hearing Aids2024

    • Author(s)
      Xiajie Zhou, Candy Olivia Mawalim, Masashi Unoki
    • Organizer
      日本音響学会2024年度春季研究発表会(拓殖大)
  • [Presentation] 変調フィルタバンクを用いた感情音声知覚に影響を与える変調周波数帯域の分析2023

    • Author(s)
      郭 太陽, 木谷俊介, 鵜木祐史
    • Organizer
      日本音響学会2023年度秋季研究発表会(名工大)
  • [Presentation] 聴覚フィルタバンクを用いた時変動音のラウドネス計算法の検討2023

    • Author(s)
      磯山拓都, 木谷俊介, 鵜木祐史
    • Organizer
      日本音響学会聴覚研究会
  • [Presentation] 感情音声知覚に寄与する変調周波数帯域の検討2023

    • Author(s)
      郭太陽, 木谷俊介, 鵜木祐史
    • Organizer
      日本音響学会聴覚研究会
  • [Presentation] Incorporating the Digit Triplet Test in A Lightweight Speech Intelligibility Prediction for Hearing Aids2023

    • Author(s)
      Zhou Xiajie、Mawalim Candy Olivia、Angela Titalim Benita、Unoki Masashi
    • Organizer
      15th annual conference organized by Asia-Pacific Signal and Information Processing Association (Taipei)
    • Int'l Joint Research
  • [Presentation] Contribution of modulation spectral features for cross-lingual speech emotion recognition under noisy reverberant conditions2023

    • Author(s)
      Guo Taiyang、Li Sixia、Kidani Shunsuke、Okada Shogo、Unoki Masashi
    • Organizer
      15th annual conference organized by Asia-Pacific Signal and Information Processing Association (Taipei)
    • Int'l Joint Research
  • [Presentation] Auditory Model Optimization with Wavegram-CNN and Acoustic Parameter Models for Nonintrusive Speech Intelligibility Prediction in Hearing Aids2023

    • Author(s)
      Mawalim Candy Olivia、Titalim Benita Angela、Okada Shogo、Unoki Masashi
    • Organizer
      31st European Signal Processing Conference (Helsinki, Finland)
    • Int'l Joint Research
  • [Presentation] An Improved Optimal Transport Kernel Embedding Method with Gating Mechanism for Singing Voice Separation and Speaker Identification2023

    • Author(s)
      Yuan Weitao、Bian Yuren、Wang Shengbei、Unoki Masashi、Wang Wenwu
    • Organizer
      2023 IEEE International Conference on Acoustics, Speech, and Signal Processing (Greek, island of Rhodes)
    • Int'l Joint Research

URL: 

Published: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi