• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2021 年度 実績報告書

異種言語感情音声コーパスの統合による多言語感情認識システムの開発

研究課題

研究課題/領域番号 19K12059
研究機関国立研究開発法人産業技術総合研究所

研究代表者

李 時旭  国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (50415642)

研究期間 (年度) 2019-04-01 – 2022-03-31
キーワード音声感情認識 / 音声信号処理 / 機械学習 / パターン認識 / 深層学習
研究実績の概要

本研究では、音声による人間と機械のより共感的なコミュニケーションを実現するため、異種言語の感情音声を用いて、特徴空間の最適化と汎化性能の高度化を図ってきた。音声に基づく感情認識タスクでは、人間の感情表現と受容が主観的であるとともに、言語・文化・世代などの環境的な要因によって変動しやすい問題を抱えている。この問題は機械学習におけるドメイン間の相違問題(domain shift)として知られている。本研究では、複数の異種言語から感情音声の普遍かつ汎用的な特徴空間の構築による問題解決を目指してきた。
今年度は、日本語感情音声コーパスと英語感情音声コーパスを対象とする多言語音声感情認識において、ドメイン敵対的ニューラルネットワーク(domain adversarial neural network; DANN)をアンサンブルする手法を提案し、性能向上の成果が得られた。これは、個別システムではドメインへの依存性を低く抑えたDANNの認識性能が、補助タスクのない普通システム及びドメインへの依存性を強化したマルチタスク学習(multi-task learning; MTL)の性能より低い性能を示すが、複数システムを融合するアンサンブルによる性能は逆転的に高くなることである。即ち、特定タスクである感情以外の言語や性別などの情報を除去するDANNによってタスクに関連する情報も毀損されたが、アンサンブルによって複数言語に渡る共通因子が抽出でき、汎化と識別の両方の性能を兼ね備えた特徴空間が構築できたと考えられる。
この研究成果は、google scholarのAcoustics & Sound分野におけるトップクラスの国際会議であるIEEE Automatic Speech Recognition and Understanding Workshop (ASRU2021)で採択され、発表を行った。

  • 研究成果

    (2件)

すべて 2021

すべて 学会発表 (2件) (うち国際学会 2件)

  • [学会発表] ENSEMBLE OF DOMAIN ADVERSARIAL NEURAL NETWORKS FOR SPEECH EMOTION RECOGNITION2021

    • 著者名/発表者名
      Shi-wook Lee
    • 学会等名
      IEEE AUTOMATIC SPEECH RECOGNITION AND UNDERSTANDING WORKSHOP (ASRU2021)
    • 国際学会
  • [学会発表] Multiple Deep Learning Models and Architectures with Different Numbers of States Used to Improve Retrieval Accuracy of Query-by-Example2021

    • 著者名/発表者名
      Kazuki Hatakeyama, Masahiro Nishino, Kazunori Kojima, Shi-wook Lee, Yoshiaki Itoh
    • 学会等名
      13th Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC)
    • 国際学会

URL: 

公開日: 2022-12-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi