• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

対面コミュニケーションと同等に感情を伝えるための音声強調処理法の開発

研究課題

研究課題/領域番号 19K20618
研究種目

若手研究

配分区分基金
審査区分 小区分90010:デザイン学関連
研究機関電気通信大学

研究代表者

岸田 拓也  電気通信大学, 大学院情報理工学研究科, 研究員 (80827907)

研究期間 (年度) 2019-04-01 – 2023-03-31
研究課題ステータス 完了 (2022年度)
配分額 *注記
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2021年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2020年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2019年度: 2,600千円 (直接経費: 2,000千円、間接経費: 600千円)
キーワード音声信号処理 / 機械学習 / 声質変換 / 感情音声変換 / 音声印象変換 / ボルツマンマシン / 拡散確率モデル / 音響特徴量生成 / エネルギーベースモデル / マルチモーダル / 話者・音韻相互作用 / 系列表現 / 感情音声 / 感情知覚 / 対面コミュニケーション / 視聴覚相互作用 / 音声強調
研究開始時の研究の概要

感情が様々な強度で表出した発話を撮影・録音し、心理実験によって感情知覚における視聴覚相互作用と音声符号化の影響を調べる。さらに心理実験の結果と音声の音響特徴量を合わせた多変量解析を行い、話者の感情知覚に結びつく音響特徴量を見出す。見出された音響特徴量を操作する音声信号処理によって、「感情が音声の音響的特徴とどのように結びつくのかを明らかにし、対面コミュニケーションと同等に感情を伝えるための音声の強調処理法を開発する」という目的を達する。

研究成果の概要

音声符号化技術と通信技術を利用した音声のみによるコミュニケーションでは、視覚情報等の利用ができないために、感情・意図・態度・個人性などの非言語情報を正確に伝えることが困難となる。本研究では、非言語情報と音声の音響特徴量との関係をモデル化できるようなニューラルネットワークを考案し、音声の非言語情報における個人性や感情をを変換・強調する手法について検討した。ボルツマンマシンやその関連手法を利用して、モデルの学習に用いていない話者間で個人性の変換が可能な手法や、個人性と感情を同時に変換する手法、声質を因子に分解して因子の操作によって声質の印象を変換する手法などを提案することができた。

研究成果の学術的意義や社会的意義

本研究で得られた実験結果は、ボルツマンマシンやその関連手法が音声の音響特徴量と非言語情報との関係を表現するのに有効であることを示している。また、画像生成分野で目覚ましい成功を挙げている拡散確率モデルを声質変換課題に適用することに関する研究成果や調査結果は、音声コミュニケーションで声質変換技術をより柔軟に利用するための新たな手法の着想や知見につながった。

報告書

(5件)
  • 2022 実績報告書   研究成果報告書 ( PDF )
  • 2021 実施状況報告書
  • 2020 実施状況報告書
  • 2019 実施状況報告書
  • 研究成果

    (31件)

すべて 2023 2022 2021 2020 2019 その他

すべて 雑誌論文 (1件) (うち査読あり 1件、 オープンアクセス 1件) 学会発表 (29件) (うち国際学会 4件) 備考 (1件)

  • [雑誌論文] Speech Chain VC: Linking Linguistic and Acoustic Levels via Latent Distinctive Features for RBM-Based Voice Conversion2020

    • 著者名/発表者名
      KISHIDA Takuya、NAKASHIKA Toru
    • 雑誌名

      IEICE Transactions on Information and Systems

      巻: E103.D 号: 11 ページ: 2340-2350

    • DOI

      10.1587/transinf.2020EDP7032

    • NAID

      130007933848

    • ISSN
      0916-8532, 1745-1361
    • 年月日
      2020-11-01
    • 関連する報告書
      2020 実施状況報告書
    • 査読あり / オープンアクセス
  • [学会発表] 入力特徴量で条件づけた拡散確率モデルによるパラレル声質変換2023

    • 著者名/発表者名
      岸田拓也, 中鹿亘
    • 学会等名
      日本音響学会音声研究会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 振幅重み付けエネルギー関数を用いたボルツマンマシンによる位相復元2023

    • 著者名/発表者名
      羽賀洋克, 矢田部浩平, 岸田拓也, 中鹿亘
    • 学会等名
      日本音響学会2023年春季研究発表会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] Dual Diffusion Implicit Bridgesを用いた話者間の匿名性を担保した声質変換2023

    • 著者名/発表者名
      奥田耕平 岸田拓也, 中鹿
    • 学会等名
      日本音響学会2023年春季研究発表会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] Speechsplit を用いたイントネーション・リズム・発音の矯正による 外国語アクセント変換2023

    • 著者名/発表者名
      許誠, 岸田拓也, 中鹿亘
    • 学会等名
      日本音響学会2023年春季研究発表会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] Non-parallel voice conversion based on free-energy minimization of speaker-conditional restricted boltzmann machine.2023

    • 著者名/発表者名
      Kishida, T., & Nakashika, T.
    • 学会等名
      Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC) IEEE
    • 関連する報告書
      2022 実績報告書
    • 国際学会
  • [学会発表] Controllable voice conversion based on quantization of voice factor scores.2023

    • 著者名/発表者名
      Isako, T., Onishi, K., Kishida, T., & Nakashika, T.
    • 学会等名
      Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC) IEEE
    • 関連する報告書
      2022 実績報告書
    • 国際学会
  • [学会発表] 条件付き制限ボルツマンマシンの平衡化傾向を利用したノンパラレル声質変換2022

    • 著者名/発表者名
      岸田拓也, 中鹿亘
    • 学会等名
      日本音響学会2022年秋季研究発表会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 話者因子係数の量子化に基づく声色制御可能な話者変換2022

    • 著者名/発表者名
      井硲巧, 大西弘太郎, 岸田拓也, 中鹿亘
    • 学会等名
      日本音響学会2022年秋季研究発表会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] F0適応ラグ窓を用いた音声分析系の精緻化2022

    • 著者名/発表者名
      越森道貴, 嵯峨山茂樹, 岸田拓也, 中鹿亘
    • 学会等名
      音学シンポジウム2022
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 制限ボルツマンマシンを用いた独立低ランク行列分析に基づくブラインド音源分離2022

    • 著者名/発表者名
      古田翔太郎, 岸田拓也, 中鹿亘
    • 学会等名
      音学シンポジウム2022
    • 関連する報告書
      2022 実績報告書
  • [学会発表] LSP周波数間隔のクロスエントロピー誤差最小化に基づくVAE声質変換2022

    • 著者名/発表者名
      平本佳弘, 嵯峨山茂樹, 岸田拓也, 中鹿亘
    • 学会等名
      音学シンポジウム2022
    • 関連する報告書
      2022 実績報告書
  • [学会発表] リズムスタイルを考慮したFader Networksに基づく外国語学習者の発音変換2022

    • 著者名/発表者名
      王庭輝, 岸田拓也, 中鹿亘
    • 学会等名
      日本音響学会2022年春季研究発表会
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] TTSモデルにおけるアラインメントロバスト性向上のための非停滞化制約付きForward Attention2022

    • 著者名/発表者名
      Zhou Yujin, 岸田拓也, 中鹿亘
    • 学会等名
      日本音響学会2022年春季研究発表会
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] 印象表現語ラベルを用いたFaderNetworksに基づく音声印象変換2022

    • 著者名/発表者名
      岡留有希, 大西弘太郎, 岸田拓也, 中鹿亘
    • 学会等名
      日本音響学会2022年春季研究発表会
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] 時系列条件付きボルツマンマシンによる位相復元2022

    • 著者名/発表者名
      羽賀洋克, 矢田部浩平, 岸田拓也, 中鹿亘
    • 学会等名
      日本音響学会2022年春季研究発表会
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] マルチモーダルVAEを用いた顔画像に基づく目標話者音声不要な声質変換2022

    • 著者名/発表者名
      飯田紘崇, 岸田拓也, 中鹿亘
    • 学会等名
      日本音響学会2022年春季研究発表会
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] 深層エネルギーベースモデルによる音声の音響特徴量の生成2021

    • 著者名/発表者名
      岸田拓也, 中鹿亘
    • 学会等名
      日本音響学会2021年秋季研究発表会
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] 話者依存度に応じた特徴抽出器によるdisentagleな声質変換2021

    • 著者名/発表者名
      井硲巧, 岸田拓也, 中鹿亘
    • 学会等名
      日本音響学会2021年秋季研究発表会
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] 話者特徴抽出器を加えたFaderNetVCによる未知話者声質変換2021

    • 著者名/発表者名
      井硲巧,岸田拓也,中鹿亘
    • 学会等名
      音学シンポジウム2021
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] Attention RBMによる音声特徴量系列の符号化と生成2021

    • 著者名/発表者名
      岸田 拓也,中鹿 亘
    • 学会等名
      日本音響学会2020年秋季研究発表会
    • 関連する報告書
      2020 実施状況報告書
  • [学会発表] Simultaneous Conversion of Speaker Identity and Emotion Based on Multiple-Domain Adaptive RBM2020

    • 著者名/発表者名
      Kishida, T., Tsukamoto, S., Nakashika, T.
    • 学会等名
      Interspeech 2020
    • 関連する報告書
      2020 実施状況報告書
    • 国際学会
  • [学会発表] Cluster ARBM を用いた話者・音韻相互作用分類による声質変換2020

    • 著者名/発表者名
      岸田 拓也,中鹿 亘
    • 学会等名
      日本音響学会2020年秋季研究発表会
    • 関連する報告書
      2020 実施状況報告書
  • [学会発表] Speech chain を模倣したボルツマンマシンによるワンショット多対多声質変換の検討2020

    • 著者名/発表者名
      岸田拓也、中鹿亘
    • 学会等名
      日本音響学会2020年春季研究発表会
    • 関連する報告書
      2019 実施状況報告書
  • [学会発表] マルチタスクモデルを用いたdisentangleな学習による楽器音変換2020

    • 著者名/発表者名
      荒川 賢也、岸田 拓也、中鹿 亘
    • 学会等名
      日本音響学会2020年春季研究発表会
    • 関連する報告書
      2019 実施状況報告書
  • [学会発表] 適応型 RBM を用いた音声情報の分離による話者と感情の同時変換2020

    • 著者名/発表者名
      塚本 伸、岸田 拓也、中鹿 亘
    • 学会等名
      日本音響学会2020年春季研究発表会
    • 関連する報告書
      2019 実施状況報告書
  • [学会発表] Speech chain VC: 音声コミュニケーションの言語-生理-音響連鎖を考慮する声質変換2019

    • 著者名/発表者名
      岸田拓也、中鹿亘
    • 学会等名
      日本音響学会2019年秋季研究発表会
    • 関連する報告書
      2019 実施状況報告書
  • [学会発表] Fader Networks を用いた楽器音変換2019

    • 著者名/発表者名
      荒川 賢也、岸田 拓也、中鹿 亘
    • 学会等名
      日本音響学会2019年秋季研究発表会
    • 関連する報告書
      2019 実施状況報告書
  • [学会発表] 適応型 RBM を用いたノンパラレル感情音声変換2019

    • 著者名/発表者名
      塚本 伸、岸田 拓也、中鹿 亘
    • 学会等名
      日本音響学会2019年秋季研究発表会
    • 関連する報告書
      2019 実施状況報告書
  • [学会発表] Acoustic analysis of word-initial consonant clusters: a perceptual basis of English syllables2019

    • 著者名/発表者名
      Zhang, Y., Nakajima, Y., Yu, X., Remijn, G. B., Ueda, K., Kishida, T., & Elliott M. A.
    • 学会等名
      The 35th Annual Meeting of the International Society for Psychophysics
    • 関連する報告書
      2019 実施状況報告書
    • 国際学会
  • [備考] 岸田拓也 Takuya Kishida

    • URL

      https://kishidatakuya0119.wixsite.com/mysite

    • 関連する報告書
      2019 実施状況報告書

URL: 

公開日: 2019-04-18   更新日: 2024-01-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi