• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2021 年度 実施状況報告書

VOICE 2.0:音声コミュニケーションのエンリッチメント拡張

研究課題

研究課題/領域番号 20KK0233
研究機関北陸先端科学技術大学院大学

研究代表者

鵜木 祐史  北陸先端科学技術大学院大学, 先端科学技術研究科, 教授 (00343187)

研究分担者 赤木 正人  北陸先端科学技術大学院大学, 先端科学技術研究科, 教授 (20242571)
木谷 俊介  北陸先端科学技術大学院大学, 先端科学技術研究科, 助教 (70635367)
森田 翔太  福山大学, 工学部, 講師 (70780378)
研究期間 (年度) 2020-10-27 – 2025-03-31
キーワード音声コミュニケーション / エンリッチメント / 非言語情報 / 聴覚エンリッチメント / voice 2.0 / 音声了解度
研究実績の概要

現在,Society 5.0を目指した音声情報処理は,AI技術革新の恩恵を受け,飛躍的に進歩している.合成音声の音質は人間のものに肉薄しているが,音声コミュニケーションの本質である,話し手の情動や意図,態度といった表現豊かな音声合成には至っていない.本研究では,ヒトの音声知覚・生成メカニズムに着目し,データサイエンスとの有機的結合を図ることで,エンリッチな音声コミュニケーションの拡張(VOICE 2.0)を目指す.本研究の期待するところは,音声の明瞭さや,感情,個人性,発話スタイルの変化といった声質をヒトのように高低・強弱の程度を制御して,音声コミュニケーションの付加価値を高めることにある.
本研究では,表現豊かな音声コミュニケーションを実現するために,音声の数理工学的な情報表現において,音声のエンリッチな情報を言語・非言語・パラ言語情報にそれぞれ分離し,それらを個別に制御することで,次の5点に関する音声エンリッチメントを実現する.課題① 言語情報におけるエンリッチメント,課題② 非言語情報(話者性)のエンリッチメント,課題③ 非言語情報(感情)のエンリッチメント,課題④ 非言語情報(声の質感)のエンリッチメント,課題⑤ パラ言語情報(緊迫感など)のエンリッチメント.
2021年度は,前年度課題で検討した課題①について,音声の明瞭性と変調知覚の関係ならびに明瞭性と音声生成の関係に基づき,音声明瞭化といったエンリッチメントを検討した.ここでは,テキスト音声合成方式において,変調スペクトル特徴を加えることにより明瞭性の向上や表現豊かな音声合成の実現性を検討した.課題②では,音声の個人性と変調知覚の関係ならびに個人性と音声生成の関係を調査し,話者変換といったエンリッチメントを検討した.ここでは,話者の個人性情報を制御することで話者秘匿化やプライバシー保護ができるか検討した.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

2021年度は,計画どおり,前年度課題で検討した,音声の明瞭性と変調知覚の関係ならびに明瞭性と音声生成の関係に基づき,音声明瞭化といったエンリッチメントを検討した.また,音声の個人性と変調知覚の関係ならびに個人性と音声生成の関係を調査し,話者秘匿や音声プライバシーの保護といったエンリッチメントも検討した.今年度もコロナ禍でドレスデン工科大を訪問して実施できない課題もあるが,他の三つの課題(感情や声の質感,情動など)についても先取りして検討に取りかかった.

今後の研究の推進方策

今年度もコロナ禍のため協働研究先であるドレスデン工科大を訪問して研究することができなかった.そのため,メールやオンラインミーティングを活用するなど,訪問できなくても協働研究を進められるところから手をつけた.次年度もコロナ禍の影響から,今後いつ頃に共同研究先であるドレスデン工科大を訪問できるか不明であるため,オンラインミーティングを活用して研究を継続していく.

次年度使用額が生じた理由

コロナ禍により計画通りに一部執行できなかったため.
繰り越し分については,当初計画案に沿って対応する予定である.

  • 研究成果

    (13件)

すべて 2022 2021

すべて 雑誌論文 (2件) (うち国際共著 1件、 査読あり 2件、 オープンアクセス 2件) 学会発表 (11件) (うち国際学会 7件)

  • [雑誌論文] Speaker anonymization by modifying fundamental frequency and x-vector singular value2022

    • 著者名/発表者名
      Mawalim Candy Olivia、Galajit Kasorn、Karnjana Jessada、Kidani Shunsuke、Unoki Masashi
    • 雑誌名

      Computer Speech and Language

      巻: 73 ページ: 101326~101326

    • DOI

      10.1016/j.csl.2021.101326

    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Speech Watermarking Method Using McAdams Coefficient Based on Random Forest Learning2021

    • 著者名/発表者名
      Mawalim Candy Olivia、Unoki Masashi
    • 雑誌名

      Entropy

      巻: 23 ページ: 1246~1246

    • DOI

      10.3390/e23101246

    • 査読あり / オープンアクセス
  • [学会発表] Study on Expressiveness of Speech Synthesis Using Multi-resolution Modulation-filtered Cochleagram2022

    • 著者名/発表者名
      Kaili Zhang, Masashi Unoki
    • 学会等名
      NCSP22
    • 国際学会
  • [学会発表] Replay Attack Detection using MFCC and ResNeWt18 for Automatic Speaker Verification2022

    • 著者名/発表者名
      Anuwat Chaiwongyen, Waree Kongprawechnon, Suradej Duangpummet, Jessada Karnjana, Masashi Unoki
    • 学会等名
      NCSP22
    • 国際学会
  • [学会発表] Improving Security in McAdams Coefficient‐Based Speaker Anonymization by Watermarking Method2021

    • 著者名/発表者名
      Candy Olivia Mawalim, Masashi Unoki
    • 学会等名
      APSIPA2021
    • 国際学会
  • [学会発表] Tampering Detection for Speech Signals Using Synchronization Code and LSF based Watermarks2021

    • 著者名/発表者名
      Shengbei Wang, Weitao Yuan, Zhen Zhang, Jianming Wang, Masashi Unoki
    • 学会等名
      APSIPA2021
    • 国際学会
  • [学会発表] Hybridization of Speech Information Hiding and Encryption for Double-layer Security in Speech Communication2021

    • 著者名/発表者名
      Kasorn Galajit, Jessada Karnjana, Pakinee Aimmanee, Masashi Unoki
    • 学会等名
      APSIPA2021
    • 国際学会
  • [学会発表] Crossfire Conditional Generative Adversarial Networks for Singing Voice Extraction2021

    • 著者名/発表者名
      Weitao Yuan, Shengbei Wang, Xiangrui Li, Masashi Unoki and Wenwu Wang
    • 学会等名
      Interspeech2021
    • 国際学会
  • [学会発表] Synchronous multi-bit audio watermarking based on phase shifting2021

    • 著者名/発表者名
      Shengbei Wang, Weitao Yuan, Zhen Zhang, Jianming Wang, Masashi Unoki
    • 学会等名
      ICASSP2021
    • 国際学会
  • [学会発表] Speech Watermarking Approach for Securing Speaker Anonymization using McAdams Coefficients2021

    • 著者名/発表者名
      Candy Olivia Mawalim and Masashi Unoki
    • 学会等名
      電子情報通信学会EMM研究会
  • [学会発表] 発話のしにくさの自覚と音読潜時,音節反復との関連の予備検討2021

    • 著者名/発表者名
      古田尚久,北村達也,林良子,能田由紀子,鵜木祐史
    • 学会等名
      日本音響学会音声研究会
  • [学会発表] 発話時の骨導伝達特性の測定における気導音遮断の検討2021

    • 著者名/発表者名
      鳥谷輝樹,Peter Birkholz,鵜木祐史
    • 学会等名
      日本音響学会秋季研究発表会
  • [学会発表] 遮音壁による気導音遮断の下での骨導音声の伝達特性の測定2021

    • 著者名/発表者名
      鳥谷輝樹,Peter Birkholz,鵜木祐史
    • 学会等名
      日本音響学会聴覚研究会

URL: 

公開日: 2022-12-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi