• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

調音運動データベースの構築とデータベース間の正規化および調音運動ベースの音声合成

研究課題

研究課題/領域番号 19K12024
研究種目

基盤研究(C)

配分区分基金
応募区分一般
審査区分 小区分61010:知覚情報処理関連
研究機関東京理科大学

研究代表者

桂田 浩一  東京理科大学, 理工学部情報科学科, 教授 (80324490)

研究分担者 牧野 武彦  中央大学, 経済学部, 教授 (00269482)
若宮 幸平  九州大学, 芸術工学研究院, 助教 (70294999)
研究期間 (年度) 2019-04-01 – 2023-03-31
研究課題ステータス 完了 (2022年度)
配分額 *注記
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2021年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2020年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2019年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
キーワードEMA / 調音運動 / 音声合成 / rtMRI / IPA / データベース構築 / 深層学習 / データベース
研究開始時の研究の概要

人間の発声メカニズムに近い音声合成を実現するため,次の3項目の研究を実施する.
(I)人間の発話時の舌や唇の動作を収録しデータベースを作成する.
(II)既存の外国語のこうしたデータベースとの相互変換を可能にする.
(III)データベースを用いて音声合成の研究を行う.
これまで日本語のこのようなデータベースは公開された物が存在しなかった.したがってこうしたデータベースを公開することの意義は大きい.

研究成果の概要

(1)EMAデータからの音声合成,(2)rtMRIデータからの音声合成,(3)調音運動データの収録,についてそれぞれ研究を実施した.(1)については,LSTMとD-vectorによる話者識別器を用いた多人数話者用の音声合成器を構築し,特に話者closeの合成については十分な合成音が生成できることを確認した.(2)はtransposed convolutionによる時系列データの補間を用いた合成器を構築し,ストライドサイズを大きくして補間強度を強くしたときに合成音の品質が向上することを確認した.(3)については7名分の調音運動データの収録を終えており,そのうち1名についてIPAの付与が完了した.

研究成果の学術的意義や社会的意義

本研究によって,舌や唇の動きを表す調音運動から音声が良好に生成できることが確認できた.収録方法の異なる2種類の調音運動データ(EMA,rtMRI)の双方で生成できることを確認しており,当該分野の研究進展に微力ながら貢献できたと考えている.調音運動のデータは一般的に収録が困難ではあるが,本研究で日本語用の調音運動データを収録することによって,音声学や音声情報処理の研究分野において調音運動データを利用することが可能になった.これにより,音声学および音声情報処理の発展に多少なりとも寄与できたと考えている.

報告書

(5件)
  • 2022 実績報告書   研究成果報告書 ( PDF )
  • 2021 実施状況報告書
  • 2020 実施状況報告書
  • 2019 実施状況報告書
  • 研究成果

    (22件)

すべて 2023 2022 2021 2020 2019

すべて 学会発表 (22件) (うち国際学会 4件)

  • [学会発表] real-time MRIで収録した調音運動に基づくend-to-end音声合成2023

    • 著者名/発表者名
      大谷 祐人,澤田 隼,大村 英史,桂田 浩一
    • 学会等名
      電子情報通信学会技術報告SP2022-41
    • 関連する報告書
      2022 実績報告書
  • [学会発表] real-time MRI 調音運動データからの end-to-end 音声合成2023

    • 著者名/発表者名
      大谷 祐人,澤田 隼,大村 英史,桂田 浩一
    • 学会等名
      日本音響学会2023年春季研究発表会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] Vision Transformerの係数付き1bit化2023

    • 著者名/発表者名
      佐藤 駿,澤田 隼,大村 英史,桂田 浩一
    • 学会等名
      電子情報通信学会技術報告IBISML2022-90
    • 関連する報告書
      2022 実績報告書
  • [学会発表] RtMRIデータからの調音-音響変換における転置畳み込みニューラルネットワークの利用2022

    • 著者名/発表者名
      丹治 涼,澤田 隼,大村 英史,桂田 浩一
    • 学会等名
      日本音響学会音声研究会,電子情報通信学会技術報告EA2022-27
    • 関連する報告書
      2022 実績報告書
  • [学会発表] Conformerを用いた早期結合型マルチモーダル音声認識モデルの提案2022

    • 著者名/発表者名
      青木 伸和,澤田 隼,大村 英史,桂田 浩一
    • 学会等名
      電子情報通信学会技術報告SP2022-28
    • 関連する報告書
      2022 実績報告書
  • [学会発表] Fine-tuning pre-trained voice conversion model for adding new target speakers with limited data2021

    • 著者名/発表者名
      Takeshi Koshizuka, Hidefumi Ohmura, Kouichi Katsurada
    • 学会等名
      InterSpeech2021
    • 関連する報告書
      2021 実施状況報告書
    • 国際学会
  • [学会発表] Using Transposed Convolution for Articulatory-to-Acoustic Conversion from Real-Time MRI Data2021

    • 著者名/発表者名
      Ryo Tanji, Hidehumi Ohmura, Kouichi Katsurada
    • 学会等名
      InterSpeech2021
    • 関連する報告書
      2021 実施状況報告書
    • 国際学会
  • [学会発表] 転置畳み込みニューラルネットワークを用いたrtMRIデータからの調音-音響変換2021

    • 著者名/発表者名
      丹治 涼,澤田 隼,大村 英史,桂田 浩一
    • 学会等名
      言語資源活用ワークショップ発表論文集,vol.6
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] IPA を介した音素-調音データ変換のためのIPA 継続長推定手法の検討2021

    • 著者名/発表者名
      飯山 智晴,澤田 隼,大村 英史,桂田 浩一
    • 学会等名
      日本音響学会2021年秋季研究発表会
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] 事前学習したvq-wav2vecの音声特徴表現を用いたボコーダフリーのAny-to-Many音声変換2021

    • 著者名/発表者名
      越塚 毅,大村 英史,桂田 浩一
    • 学会等名
      電子情報通信学会技術報告
    • 関連する報告書
      2020 実施状況報告書
  • [学会発表] real-time MRI 動画像を用いた音声合成システムの作成2021

    • 著者名/発表者名
      丹治 涼,大村 英史,桂田 浩一
    • 学会等名
      日本音響学会2021年春季研究発表会
    • 関連する報告書
      2020 実施状況報告書
  • [学会発表] IPA を介した音素-調音データ変換のための音素-IPA 変換手法の検討2021

    • 著者名/発表者名
      飯山 智晴,大村 英史,桂田 浩一
    • 学会等名
      日本音響学会2021年春季研究発表会
    • 関連する報告書
      2020 実施状況報告書
  • [学会発表] Speaker-Independent Mel-Cepstrum Estimation from Articulator Movements Using D-Vector Input2020

    • 著者名/発表者名
      Kouichi Katsurada, Korin Richmond
    • 学会等名
      InterSpeech2020
    • 関連する報告書
      2020 実施状況報告書
    • 国際学会
  • [学会発表] Expectation-based parsing for Jazz Chord sequences2020

    • 著者名/発表者名
      Yuta Ogura, Hidefumi Ohmura, Yui Uehara, Satoshi Tojo, Kouichi Katsurada
    • 学会等名
      SMC2020
    • 関連する報告書
      2020 実施状況報告書
    • 国際学会
  • [学会発表] Cycle-Consistency を利用したマルチモーダル音声強調システムの各種ノイズに対する効果の検証2020

    • 著者名/発表者名
      池上 凌,大村 英史,桂田 浩一
    • 学会等名
      日本音響学会2020年秋季研究発表会
    • 関連する報告書
      2020 実施状況報告書
  • [学会発表] BLSTM を用いた音素-調音変換2020

    • 著者名/発表者名
      飯山 智晴,大村 英史,桂田 浩一
    • 学会等名
      日本音響学会2020年秋季研究発表会
    • 関連する報告書
      2020 実施状況報告書
  • [学会発表] マルチモーダル音声強調に対するCycle-Consistencyの導入の検討2020

    • 著者名/発表者名
      池上 凌,大村 英史,桂田 浩一
    • 学会等名
      日本音響学会2020年春季研究発表会,3-P-3 (2020-3)
    • 関連する報告書
      2019 実施状況報告書
  • [学会発表] StarGAN-VCモデルにおける潜在表現への制約の有効性について2020

    • 著者名/発表者名
      柴宮 怜,大村 英史,桂田 浩一
    • 学会等名
      日本音響学会2020年春季研究発表会,3-P-39 (2020-3)
    • 関連する報告書
      2019 実施状況報告書
  • [学会発表] 大規模日本語調音・音声パラレルデータの収集2019

    • 著者名/発表者名
      若宮幸平,田口史朗,渡辺莉子,桂田浩一,牧野武彦,鏑木時彦
    • 学会等名
      電子情報通信学会技術報告vol. 119, no. 80, SP2019-2, pp. 7-12
    • 関連する報告書
      2019 実施状況報告書
  • [学会発表] 音声想起脳波からの言語表象抽出と音節認識2019

    • 著者名/発表者名
      深井 健大郎,大村 英史,桂田 浩一,平田 里佳,入部 百合絵,付 明川,田口 亮,新田 恒雄
    • 学会等名
      電子情報通信学会技術研究報告,SP2019-28 (2019-10)
    • 関連する報告書
      2019 実施状況報告書
  • [学会発表] 音声想起時脳波中の音節識別について2019

    • 著者名/発表者名
      深井 健大郎,大村 英史,桂田 浩一,新田 恒雄
    • 学会等名
      人工知能学会第33回全国大会,3P3-OS-20-04 (2019-6)
    • 関連する報告書
      2019 実施状況報告書
  • [学会発表] Universal Transformerを使用した対話破綻検出2019

    • 著者名/発表者名
      桑原 健太,大村 英史,桂田 浩一
    • 学会等名
      人工知能学会第33回全国大会,4J3-J-13-01 (2019-6)
    • 関連する報告書
      2019 実施状況報告書

URL: 

公開日: 2019-04-18   更新日: 2025-11-20  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi