• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2023 年度 実施状況報告書

VOICE 2.0:音声コミュニケーションのエンリッチメント拡張

研究課題

研究課題/領域番号 20KK0233
研究機関北陸先端科学技術大学院大学

研究代表者

鵜木 祐史  北陸先端科学技術大学院大学, 先端科学技術研究科, 教授 (00343187)

研究分担者 赤木 正人  北陸先端科学技術大学院大学, 先端科学技術研究科, 名誉教授 (20242571) [辞退]
木谷 俊介  北陸先端科学技術大学院大学, 先端科学技術研究科, 講師 (70635367)
森田 翔太  福山大学, 工学部, 講師 (70780378)
研究期間 (年度) 2020-10-27 – 2025-03-31
キーワード音声コミュニケーション / エンリッチメント / 非言語情報知覚 / 音声了解度 / voice 2.0
研究実績の概要

本課題では,表現豊かな音声コミュニケーションを実現するために,音声の数理工学的な情報表現において,音声のエンリッチな情報を言語・非言語・パラ言語情報にそれぞれ分離し,それらを個別に制御することで,次の5点に関する音声エンリッチメント(VOICE 2.0)を実現する.課題① 言語情報におけるエンリッチメント,課題② 非言語情報(話者性)のエンリッチメント,課題③ 非言語情報(感情)のエンリッチメント,課題④ 非言語情報(声の質感)のエンリッチメント,課題⑤ パラ言語情報(緊迫感など)のエンリッチメント.本研究の期待するところは,音声の明瞭さや,感情,個人性,発話スタイルの変化といった声質をヒトのように高低・強弱の程度を制御して,音声コミュニケーションの付加価値を高めることにある.
2023年度は,前年度課題で検討した課題③~課題⑤について継続して実施した.まず課題③では,感情知覚と変調スペクトルに含まれる変調成分の関係を調査した.その結果,振幅包絡線に含まれる変調成分(0~16 Hz)が感情知覚に重要であることを明らかにした.さらに,この中に含まれる瞬時変調周波数の時間変化の傾きが感情知覚に関わることも明らかにした.次に課題④では,声の質感と音色属性に関わる特徴(音質評価指標)(シャープネス,ラフネス,変動強度)ならびに基本周波数成分の時間特徴(ジッターとシマー)の関係を検討した.その結果,音質評価指標ならびにジッター・シマーが声の自然さの評価に使えることがわかった.最後に課題⑤では,緊迫感知覚と変調スペクトルに含まれる変調成分の関係を調査した.その結果,課題③と同様に音声の振幅包絡線に含まれる瞬時変調周波数成分の時間変化の傾きを調整することで緊迫感を低下できることが可能であることがわかった.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

2023年度は,計画どおり,前年度課題で検討した,音声の非言語・パラ言語情報と変調知覚の関係を調査した.その結果,前述したように,瞬時変調周波数の時間変化を操作することが非言語・パラ言語情報のエンリッチメントに直結していることを明らかにした.このことから,瞬時変調周波数の時間変化を操作することで,非言語・パラ言語情報をエンリッチできることが容易に予想できる.次年度には,感情知覚や緊迫感知覚の向上を目指した最終検討に入ることができる.以上から区分(2)の進捗状況であると判断した.

今後の研究の推進方策

コロナ禍が明けてから,はじめて研究代表者のみドレスデン工科大学を訪問することができた.この3年間の互いの研究機関での研究進捗について,対面で報告し,今後の研究展開についても議論した.研究自体には,大きな進展があったことから,今後はオンラインの利用も含め,研究交流を一層深めていく予定である.研究分担者による長期滞在は,現在もなお難しいところではあるが,最終年度は,研究分担者も含め,全員でドレスデン工科大を訪問し,深く議論をして研究ゴールに到着できるようにしていきたい.

次年度使用額が生じた理由

コロナ禍が明けたものの,計画通りに一部執行できなかったため.
繰り越し分については,当初計画案に沿って対応する予定であり,ドレスデン工科大への旅費に利用する.

  • 研究成果

    (34件)

すべて 2024 2023

すべて 雑誌論文 (15件) (うち国際共著 1件、 査読あり 15件、 オープンアクセス 5件) 学会発表 (19件) (うち国際学会 10件)

  • [雑誌論文] Computational models of auditory sensation important for sound quality on basis of either gammatone or gammachirp auditory filterbank2024

    • 著者名/発表者名
      Isoyama Takuto、Kidani Shunsuke、Unoki Masashi
    • 雑誌名

      Applied Acoustics

      巻: 218 ページ: 109914~109914

    • DOI

      10.1016/j.apacoust.2024.109914

    • 査読あり / オープンアクセス
  • [雑誌論文] Linear Model Approach to Investigate the Comprehensive Entrainment in Conversation2024

    • 著者名/発表者名
      Yuning Liu, Masashi Unoki
    • 雑誌名

      Proc. NCSP24

      巻: - ページ: 51-54

    • 査読あり
  • [雑誌論文] Phase-Aware Speech Enhancement With Complex Wiener Filter2023

    • 著者名/発表者名
      Nguyen Huy、Ho Tuan Vu、Akagi Masato、Unoki Masashi
    • 雑誌名

      IEEE Access

      巻: 11 ページ: 141573~141584

    • DOI

      10.1109/ACCESS.2023.3341919

    • 査読あり / オープンアクセス
  • [雑誌論文] Contributions of Jitter and Shimmer in the Voice for Fake Audio Detection2023

    • 著者名/発表者名
      Li Kai、Lu Xugang、Akagi Masato、Unoki Masashi
    • 雑誌名

      IEEE Access

      巻: 11 ページ: 84689~84698

    • DOI

      10.1109/ACCESS.2023.3301616

    • 査読あり / オープンアクセス
  • [雑誌論文] Anomalous Sound Detection for Industrial Machines Using Acoustical Features Related to Timbral Metrics2023

    • 著者名/発表者名
      Ota Yasuji、Unoki Masashi
    • 雑誌名

      IEEE Access

      巻: 11 ページ: 70884~70897

    • DOI

      10.1109/ACCESS.2023.3294334

    • 査読あり / オープンアクセス
  • [雑誌論文] Contributions of Temporal Modulation Cues in Temporal Amplitude Envelope of Speech to Urgency Perception2023

    • 著者名/発表者名
      Unoki Masashi、Kawamura Miho、Kobayashi Maori、Kidani Shunsuke、Li Junfeng、Akagi Masato
    • 雑誌名

      Applied Sciences

      巻: 13 ページ: 6239~6239

    • DOI

      10.3390/app13106239

    • 査読あり / オープンアクセス
  • [雑誌論文] Analysis of Spectro-Temporal Modulation Representation for Deep-Fake Speech Detection2023

    • 著者名/発表者名
      Cheng Haowei、Mawalim Candy Olivia、Li Kai、Wang Lijun、Unoki Masashi
    • 雑誌名

      Proc. APSIPA2023

      巻: - ページ: 1822-1829

    • DOI

      10.1109/APSIPAASC58517.2023.10317309

    • 査読あり
  • [雑誌論文] Deepfake-speech Detection with Pathological Features and Multilayer Perceptron Neural Network2023

    • 著者名/発表者名
      Chaiwongyen Anuwat、Duangpummet Suradej、Karnjana Jessada、Kongprawechnon Waree、Unoki Masashi
    • 雑誌名

      Proc. APSIPA2023

      巻: - ページ: 2182-2188

    • DOI

      10.1109/APSIPAASC58517.2023.10317331

    • 査読あり / 国際共著
  • [雑誌論文] Contribution of modulation spectral features for cross-lingual speech emotion recognition under noisy reverberant conditions2023

    • 著者名/発表者名
      Guo Taiyang、Li Sixia、Kidani Shunsuke、Okada Shogo、Unoki Masashi
    • 雑誌名

      Proc. APSIPA2023

      巻: - ページ: 2221-2227

    • DOI

      10.1109/APSIPAASC58517.2023.10317449

    • 査読あり
  • [雑誌論文] Data-driven Non-uniform Filterbanks Based on F-ratio for Machine Anomalous Sound Detection2023

    • 著者名/発表者名
      Li Kai、Tran Dung Kim、Lu Xugang、Akagi Masato、Unoki Masashi
    • 雑誌名

      Proc. EUSIPCO2023

      巻: - ページ: 201-205

    • DOI

      10.23919/EUSIPCO58844.2023.10289922

    • 査読あり
  • [雑誌論文] Computational model for predicting sound quality metrics using loudness model based on gammatone/gammachirp auditory filterbank and its applications2023

    • 著者名/発表者名
      Isoyama Takuto、Kidani Shunsuke、Unoki Masashi
    • 雑誌名

      Proc. INTER-NOISE2023

      巻: 268 ページ: 5955~5964

    • DOI

      10.3397/in_2023_0861

    • 査読あり
  • [雑誌論文] Study on suppression effect of air-conducted sound by bone-conducted sound2023

    • 著者名/発表者名
      Inoue Shunsuke、Toya Teruki、Uezu Yasufumi、Unoki Masashi
    • 雑誌名

      Proc. INTER-NOISE

      巻: 268 ページ: 5479~5489

    • DOI

      10.3397/IN_2023_0778

    • 査読あり
  • [雑誌論文] Consonant-emphasis Method Incorporating Robust Consonant-section Detection to Improve Intelligibility of Bone-conducted speech2023

    • 著者名/発表者名
      Uezu Yasufumi、Wang Sicheng、Toya Teruki、Unoki Masashi
    • 雑誌名

      Proc. Interspeech2023

      巻: - ページ: 849-853

    • DOI

      10.21437/Interspeech.2023-2568

    • 査読あり
  • [雑誌論文] Vowel production changes under noise with consideration of low-order formant masking2023

    • 著者名/発表者名
      Yasufumi Uezu, Masato Akagi, Masashi Unoki
    • 雑誌名

      Proc. 20th International Congress of Phonetic Sciences

      巻: - ページ: 673-677

    • 査読あり
  • [雑誌論文] An Improved Optimal Transport Kernel Embedding Method with Gating Mechanism for Singing Voice Separation and Speaker Identification2023

    • 著者名/発表者名
      Yuan Weitao、Bian Yuren、Wang Shengbei、Unoki Masashi、Wang Wenwu
    • 雑誌名

      Proc. ICASSP2023

      巻: - ページ: 849-853

    • DOI

      10.1109/ICASSP49357.2023.10096651

    • 査読あり
  • [学会発表] Contributions of Instantaneous Modulation Components in Temporal Amplitude Envelope to Vocal Emotion Perception2024

    • 著者名/発表者名
      Taiyang Guo, Takuto Isoyama, Shunsuke Kidani, Masashi Unoki
    • 学会等名
      日本音響学会2024年度春季研究発表会(拓殖大学)
  • [学会発表] Conversation Scenario Classification Based on Conversation Entrainment2024

    • 著者名/発表者名
      Yuning Liu, Di Zhou, Jianwu Dang, Aijun Li, Masashi Unoki
    • 学会等名
      日本音響学会2024年度春季研究発表会(拓殖大学)
  • [学会発表] Leveraging Equalization-Cancellation Model in Speech Intelligibility Prediction for Hearing Aids2024

    • 著者名/発表者名
      Xiajie Zhou, Candy Olivia Mawalim, Masashi Unoki
    • 学会等名
      日本音響学会2024年度春季研究発表会(拓殖大学)
  • [学会発表] Linear Model Approach to Investigate the Comprehensive Entrainment in Conversation2024

    • 著者名/発表者名
      Yuning Liu, Masashi Unoki
    • 学会等名
      2024 RISP International Workshop on Nonlinear Circuits, Communications and Signal Processing (Hawaii)
    • 国際学会
  • [学会発表] 聴覚フィルタバンクを用いた時変動音のラウドネス計算法の構築2023

    • 著者名/発表者名
      磯山拓都, 木谷俊介, 鵜木祐史
    • 学会等名
      日本音響学会2023年度秋季研究発表会(名古屋工業大学)
  • [学会発表] 産業機器の異常音検知に向けた音色関連特徴量の検討2023

    • 著者名/発表者名
      大田恭士, 鵜木祐史
    • 学会等名
      日本音響学会2023年度秋季研究発表会(名古屋工業大学)
  • [学会発表] 音色に関連づけた信号処理手法による異常音検知の一検討2023

    • 著者名/発表者名
      大田 恭士, 鵜木 祐史
    • 学会等名
      第38回信号処理シンポジウム(京都テルサ)
  • [学会発表] 謡曲の良さに寄与するスペクトル・時間変調情報の検討2023

    • 著者名/発表者名
      木谷俊介,磯山拓人,鵜木祐史
    • 学会等名
      日本音響学会2023年度秋季研究発表会(名古屋工業大学)
  • [学会発表] Emotion Prediction based on Conversation Entrainments2023

    • 著者名/発表者名
      Liu Yuning, Unoki Masashi
    • 学会等名
      2023年度電気・情報関係学会北陸支部連合大会(金沢工大,オンライン)
  • [学会発表] 聴覚フィルタバンクを用いた時変動音のラウドネス計算法の検討2023

    • 著者名/発表者名
      磯山拓都, 木谷俊介, 鵜木祐史
    • 学会等名
      日本音響学会聴覚研究会(東北学院大学)
  • [学会発表] Study on suppression effect of air-conducted sound by bone-conducted sound2023

    • 著者名/発表者名
      Inoue Shunsuke、Toya Teruki、Uezu Yasufumi、Unoki Masashi
    • 学会等名
      InterNoise2023 (Makuhari)
    • 国際学会
  • [学会発表] Computational model for predicting sound quality metrics using loudness model based on gammatone/gammachirp auditory filterbank and its applications2023

    • 著者名/発表者名
      Isoyama Takuto、Kidani Shunsuke、Unoki Masashi
    • 学会等名
      InterNoise2023 (Makuhari)
    • 国際学会
  • [学会発表] Vowel production changes under noise with consideration of low-order formant masking2023

    • 著者名/発表者名
      Yasufumi Uezu, Masato Akagi, Masashi Unoki
    • 学会等名
      20th International Congress of Phonetic Sciences
    • 国際学会
  • [学会発表] Consonant-emphasis Method Incorporating Robust Consonant-section Detection to Improve Intelligibility of Bone-conducted speech2023

    • 著者名/発表者名
      Uezu Yasufumi、Wang Sicheng、Toya Teruki、Unoki Masashi
    • 学会等名
      24th INTERSPEECH Conference
    • 国際学会
  • [学会発表] An Improved Optimal Transport Kernel Embedding Method with Gating Mechanism for Singing Voice Separation and Speaker Identification2023

    • 著者名/発表者名
      Yuan Weitao、Bian Yuren、Wang Shengbei、Unoki Masashi、Wang Wenwu
    • 学会等名
      2023 IEEE International Conference on Acoustics, Speech, and Signal Processing (Greek island of Rhodes)
    • 国際学会
  • [学会発表] Analysis of Spectro-Temporal Modulation Representation for Deep-Fake Speech Detection2023

    • 著者名/発表者名
      Cheng Haowei、Mawalim Candy Olivia、Li Kai、Wang Lijun、Unoki Masashi
    • 学会等名
      15th annual conference organized by Asia-Pacific Signal and Information Processing Association (Taipei)
    • 国際学会
  • [学会発表] Deepfake-speech Detection with Pathological Features and Multilayer Perceptron Neural Network2023

    • 著者名/発表者名
      Chaiwongyen Anuwat、Duangpummet Suradej、Karnjana Jessada、Kongprawechnon Waree、Unoki Masashi
    • 学会等名
      15th annual conference organized by Asia-Pacific Signal and Information Processing Association (Taipei)
    • 国際学会
  • [学会発表] Contribution of modulation spectral features for cross-lingual speech emotion recognition under noisy reverberant conditions2023

    • 著者名/発表者名
      Guo Taiyang、Li Sixia、Kidani Shunsuke、Okada Shogo、Unoki Masashi
    • 学会等名
      15th annual conference organized by Asia-Pacific Signal and Information Processing Association (Taipei)
    • 国際学会
  • [学会発表] Data-driven Non-uniform Filterbanks Based on F-ratio for Machine Anomalous Sound Detection2023

    • 著者名/発表者名
      Li Kai、Tran Dung Kim、Lu Xugang、Akagi Masato、Unoki Masashi
    • 学会等名
      31st European Signal Processing Conference (Helsinki, Finland)
    • 国際学会

URL: 

公開日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi