• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2022 Fiscal Year Annual Research Report

対面コミュニケーションと同等に感情を伝えるための音声強調処理法の開発

Research Project

Project/Area Number 19K20618
Research InstitutionThe University of Electro-Communications

Principal Investigator

岸田 拓也  電気通信大学, 大学院情報理工学研究科, 研究員 (80827907)

Project Period (FY) 2019-04-01 – 2023-03-31
Keywords音声信号処理 / 声質変換 / 音声印象変換 / ボルツマンマシン / 拡散確率モデル
Outline of Annual Research Achievements

最終年度は、これまでの音声の非言語情報のモデル化とモデルによる非言語情報の変換と強調に関する研究をまとめ、今後の研究発展のための調査や学外発表をおこなった。具体的には、2件の国際学会発表および8件の国内学会・研究会で研究の成果を発表した。
昨年度までの研究で声質変換手法として用いてきたボルツマンマシンについて、これまでとは異なる考え方に基づく方法として、ボルツマンマシンの自由エネルギーの最小化による声質変換手法を新たに提案し、国際学会にて発表した。この手法によって、変換元の話者が誰であっても、目標とする話者の声質に変換可能なモデルをボルツマンマシンで実現できるようになった。また、声質における個人性の情報はそれを構成するいくつかの因子からなるという仮定のもと、それらの因子に個人性の情報を分解し、再構築することで、因子による操作が可能な声質変換手法も新たに提案した。この研究成果も国際学会にて発表した。この研究によって、音声の音響特徴量を多変量解析によって多次元空間上で表現し、その空間上の位置と音声の印象との関係を心理実験によって明らかにすることで、特定の印象が想起されやすい音声強調処理法を開発する、という当初の研究計画で想定していたものを、ひとつの深層生成モデルである程度まで実現できることを示せたと言える。
これらの代表的な研究成果のほかにも、近年高精細な画像を生成することが可能なモデルとして注目されている、拡散確率モデルを声質変換に利用することを検討し、一定の効果があることを確認できた。声質変換課題に拡散確率モデルを適用することに関する研究成果や調査結果は、音声コミュニケーションで声質変換技術をより柔軟に利用するための新たな手法の着想や知見につながった。

  • Research Products

    (11 results)

All 2023 2022

All Presentation (11 results) (of which Int'l Joint Research: 2 results)

  • [Presentation] 入力特徴量で条件づけた拡散確率モデルによるパラレル声質変換2023

    • Author(s)
      岸田拓也, 中鹿亘
    • Organizer
      日本音響学会音声研究会
  • [Presentation] 振幅重み付けエネルギー関数を用いたボルツマンマシンによる位相復元2023

    • Author(s)
      羽賀洋克, 矢田部浩平, 岸田拓也, 中鹿亘
    • Organizer
      日本音響学会2023年春季研究発表会
  • [Presentation] Dual Diffusion Implicit Bridgesを用いた話者間の匿名性を担保した声質変換2023

    • Author(s)
      奥田耕平 岸田拓也, 中鹿
    • Organizer
      日本音響学会2023年春季研究発表会
  • [Presentation] Speechsplit を用いたイントネーション・リズム・発音の矯正による 外国語アクセント変換2023

    • Author(s)
      許誠, 岸田拓也, 中鹿亘
    • Organizer
      日本音響学会2023年春季研究発表会
  • [Presentation] Non-parallel voice conversion based on free-energy minimization of speaker-conditional restricted boltzmann machine.2023

    • Author(s)
      Kishida, T., & Nakashika, T.
    • Organizer
      Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC) IEEE
    • Int'l Joint Research
  • [Presentation] Controllable voice conversion based on quantization of voice factor scores.2023

    • Author(s)
      Isako, T., Onishi, K., Kishida, T., & Nakashika, T.
    • Organizer
      Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC) IEEE
    • Int'l Joint Research
  • [Presentation] 条件付き制限ボルツマンマシンの平衡化傾向を利用したノンパラレル声質変換2022

    • Author(s)
      岸田拓也, 中鹿亘
    • Organizer
      日本音響学会2022年秋季研究発表会
  • [Presentation] 話者因子係数の量子化に基づく声色制御可能な話者変換2022

    • Author(s)
      井硲巧, 大西弘太郎, 岸田拓也, 中鹿亘
    • Organizer
      日本音響学会2022年秋季研究発表会
  • [Presentation] F0適応ラグ窓を用いた音声分析系の精緻化2022

    • Author(s)
      越森道貴, 嵯峨山茂樹, 岸田拓也, 中鹿亘
    • Organizer
      音学シンポジウム2022
  • [Presentation] 制限ボルツマンマシンを用いた独立低ランク行列分析に基づくブラインド音源分離2022

    • Author(s)
      古田翔太郎, 岸田拓也, 中鹿亘
    • Organizer
      音学シンポジウム2022
  • [Presentation] LSP周波数間隔のクロスエントロピー誤差最小化に基づくVAE声質変換2022

    • Author(s)
      平本佳弘, 嵯峨山茂樹, 岸田拓也, 中鹿亘
    • Organizer
      音学シンポジウム2022

URL: 

Published: 2023-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi