2022 年度実績報告書

対面コミュニケーションと同等に感情を伝えるための音声強調処理法の開発

研究課題

研究課題/領域番号	19K20618
研究機関	電気通信大学
研究代表者	岸田拓也電気通信大学, 大学院情報理工学研究科, 研究員 (80827907)
研究期間 (年度)	2019-04-01 – 2023-03-31
キーワード	音声信号処理 / 声質変換 / 音声印象変換 / ボルツマンマシン / 拡散確率モデル
研究実績の概要	最終年度は、これまでの音声の非言語情報のモデル化とモデルによる非言語情報の変換と強調に関する研究をまとめ、今後の研究発展のための調査や学外発表をおこなった。具体的には、２件の国際学会発表および８件の国内学会・研究会で研究の成果を発表した。昨年度までの研究で声質変換手法として用いてきたボルツマンマシンについて、これまでとは異なる考え方に基づく方法として、ボルツマンマシンの自由エネルギーの最小化による声質変換手法を新たに提案し、国際学会にて発表した。この手法によって、変換元の話者が誰であっても、目標とする話者の声質に変換可能なモデルをボルツマンマシンで実現できるようになった。また、声質における個人性の情報はそれを構成するいくつかの因子からなるという仮定のもと、それらの因子に個人性の情報を分解し、再構築することで、因子による操作が可能な声質変換手法も新たに提案した。この研究成果も国際学会にて発表した。この研究によって、音声の音響特徴量を多変量解析によって多次元空間上で表現し、その空間上の位置と音声の印象との関係を心理実験によって明らかにすることで、特定の印象が想起されやすい音声強調処理法を開発する、という当初の研究計画で想定していたものを、ひとつの深層生成モデルである程度まで実現できることを示せたと言える。これらの代表的な研究成果のほかにも、近年高精細な画像を生成することが可能なモデルとして注目されている、拡散確率モデルを声質変換に利用することを検討し、一定の効果があることを確認できた。声質変換課題に拡散確率モデルを適用することに関する研究成果や調査結果は、音声コミュニケーションで声質変換技術をより柔軟に利用するための新たな手法の着想や知見につながった。

研究成果
(11件)

すべて 2023 2022

すべて学会発表 (11件) (うち国際学会 2件)

[学会発表] 入力特徴量で条件づけた拡散確率モデルによるパラレル声質変換2023
- 著者名/発表者名
  岸田拓也, 中鹿亘
- 学会等名
  日本音響学会音声研究会
[学会発表] 振幅重み付けエネルギー関数を用いたボルツマンマシンによる位相復元2023
- 著者名/発表者名
  羽賀洋克, 矢田部浩平, 岸田拓也, 中鹿亘
- 学会等名
  日本音響学会2023年春季研究発表会
[学会発表] Dual Diffusion Implicit Bridgesを用いた話者間の匿名性を担保した声質変換2023
- 著者名/発表者名
  奥田耕平岸田拓也, 中鹿
- 学会等名
  日本音響学会2023年春季研究発表会
[学会発表] Speechsplit を用いたイントネーション・リズム・発音の矯正による外国語アクセント変換2023
- 著者名/発表者名
  許誠, 岸田拓也, 中鹿亘
- 学会等名
  日本音響学会2023年春季研究発表会
[学会発表] Non-parallel voice conversion based on free-energy minimization of speaker-conditional restricted boltzmann machine.2023
- 著者名/発表者名
  Kishida, T., & Nakashika, T.
- 学会等名
  Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC) IEEE
- 国際学会
[学会発表] Controllable voice conversion based on quantization of voice factor scores.2023
- 著者名/発表者名
  Isako, T., Onishi, K., Kishida, T., & Nakashika, T.
- 学会等名
  Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC) IEEE
- 国際学会
[学会発表] 条件付き制限ボルツマンマシンの平衡化傾向を利用したノンパラレル声質変換2022
- 著者名/発表者名
  岸田拓也, 中鹿亘
- 学会等名
  日本音響学会2022年秋季研究発表会
[学会発表] 話者因子係数の量子化に基づく声色制御可能な話者変換2022
- 著者名/発表者名
  井硲巧, 大西弘太郎, 岸田拓也, 中鹿亘
- 学会等名
  日本音響学会2022年秋季研究発表会
[学会発表] F0適応ラグ窓を用いた音声分析系の精緻化2022
- 著者名/発表者名
  越森道貴, 嵯峨山茂樹, 岸田拓也, 中鹿亘
- 学会等名
  音学シンポジウム2022
[学会発表] 制限ボルツマンマシンを用いた独立低ランク行列分析に基づくブラインド音源分離2022
- 著者名/発表者名
  古田翔太郎, 岸田拓也, 中鹿亘
- 学会等名
  音学シンポジウム2022
[学会発表] LSP周波数間隔のクロスエントロピー誤差最小化に基づくVAE声質変換2022
- 著者名/発表者名
  平本佳弘, 嵯峨山茂樹, 岸田拓也, 中鹿亘
- 学会等名
  音学シンポジウム2022

2022 年度 実績報告書

対面コミュニケーションと同等に感情を伝えるための音声強調処理法の開発

研究代表者

岸田 拓也 電気通信大学, 大学院情報理工学研究科, 研究員 (80827907)

研究成果

[学会発表] 入力特徴量で条件づけた拡散確率モデルによるパラレル声質変換2023

著者名/発表者名

学会等名

[学会発表] 振幅重み付けエネルギー関数を用いたボルツマンマシンによる位相復元2023

著者名/発表者名

学会等名

[学会発表] Dual Diffusion Implicit Bridgesを用いた話者間の匿名性を担保した声質変換2023

著者名/発表者名

学会等名

[学会発表] Speechsplit を用いたイントネーション・リズム・発音の矯正による 外国語アクセント変換2023

著者名/発表者名

学会等名

[学会発表] Non-parallel voice conversion based on free-energy minimization of speaker-conditional restricted boltzmann machine.2023

著者名/発表者名

学会等名

[学会発表] Controllable voice conversion based on quantization of voice factor scores.2023

著者名/発表者名

学会等名

[学会発表] 条件付き制限ボルツマンマシンの平衡化傾向を利用したノンパラレル声質変換2022

著者名/発表者名

学会等名

[学会発表] 話者因子係数の量子化に基づく声色制御可能な話者変換2022

著者名/発表者名

学会等名

[学会発表] F0適応ラグ窓を用いた音声分析系の精緻化2022

著者名/発表者名

学会等名

[学会発表] 制限ボルツマンマシンを用いた独立低ランク行列分析に基づくブラインド音源分離2022

著者名/発表者名

学会等名

[学会発表] LSP周波数間隔のクロスエントロピー誤差最小化に基づくVAE声質変換2022

著者名/発表者名

学会等名

2022 年度実績報告書

岸田拓也電気通信大学, 大学院情報理工学研究科, 研究員 (80827907)

[学会発表] Speechsplit を用いたイントネーション・リズム・発音の矯正による外国語アクセント変換2023