• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

音声における感情を表現する特徴量の抽出に基づいた感情音声

研究課題

研究課題/領域番号 20K11898
研究種目

基盤研究(C)

配分区分基金
応募区分一般
審査区分 小区分61010:知覚情報処理関連
研究機関立命館大学

研究代表者

山下 洋一  立命館大学, 情報理工学部, 教授 (80174689)

研究期間 (年度) 2020-04-01 – 2023-03-31
研究課題ステータス 完了 (2022年度)
配分額 *注記
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2022年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2021年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
2020年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
キーワード音声感情認識 / 言語情報 / ソフトラベル / 話題 / 短区間 / CTC / 文字付き感情ラベル / 音声 / 感情認識 / パラ言語情報 / マルチモーダル / 感情音声
研究開始時の研究の概要

音声は人がコミュニケーションを行うための自然かつ容易なチャンネルであり,文字テキストで記述される言語情報だけでなく,感情,意図,年齢,性別といった音声の書き起こしテキストでは記述されないパラ言語・非言語情報も伝達する。本研究では,音声に含まれる話者の感情を自動認識する手法を開発することが目的である。音声から得られる特徴パラメータベクトルは,音韻性,話者性,感情性によって変動する。発話ごとに得られる特徴パラメータベクトルから感情性を抽出する手法を開発し,音声における感情を精度良く自動認識することを目指す。

研究成果の概要

音声は言語情報だけでなく、感情などのパラ言語情報も伝達する。人同士の対話では、そのようなパラ言語情報も自然に利用することでスムーズな対話が実現されている。人と機械の間での音声による円滑な情報交換を実現するには、感情の認識が重要な枠割を果たす。音声における感情認識の性能向上を実現するために、(1) 音響的特徴と言語的特徴を併用した音声感情認識、(2) ソフトラベルを利用した感情認識モデルの学習、(3) 話題を利用した音声感情認識、(4) 音声の短区間を対象とした音声感情認識、の課題に対して、新たな手法を提案し、各手法の有効性を確認した。

研究成果の学術的意義や社会的意義

音声認識技術の急速な進歩によって、音声から文字テキストへの変換は実用化されたと言ってよい状況になっている一方で、音声が伝達する情報のうち、感情など言語情報以外の情報の自動認識はまだ発展途上にある。本研究では、音声における感情認識の性能を向上させるための手法を開発した。また、音声においては、一発話の途中で感情が変化することは一般的に起こりうることであり、音声における短い単位に対して感情を推定する手法の開発が求められており、音声の短区間を対象とする感情認識の手法についても取り組んだ。

報告書

(4件)
  • 2022 実績報告書   研究成果報告書 ( PDF )
  • 2021 実施状況報告書
  • 2020 実施状況報告書
  • 研究成果

    (7件)

すべて 2022 2021 2020

すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (6件) (うち国際学会 1件)

  • [雑誌論文] 音声を用いた感情認識のための学習話者の選択2020

    • 著者名/発表者名
      秋山大知, 石川智希 井本桂右, 新妻雅弘, 山西良典, 山下洋一
    • 雑誌名

      日本音響学会誌

      巻: 76 ページ: 554-561

    • NAID

      130007996165

    • 関連する報告書
      2020 実施状況報告書
    • 査読あり
  • [学会発表] 音声認識とのマルチタスク学習を用いたCTC モデルに基づく短区間音声感情認識2022

    • 著者名/発表者名
      永瀬亮太郎, 福森隆寛, 山下洋一
    • 学会等名
      日本音響学会2022年秋季研究発表会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] Speech Emotion Recognition Using Label Smoothing Based on Neutral and Anger Characteristics2022

    • 著者名/発表者名
      Ryotaro Nagase, Takahiro Fukumori, Yoichi Yamashita
    • 学会等名
      2022 IEEE 4th Global Conference on Life Sciences and Technologies
    • 関連する報告書
      2021 実施状況報告書
    • 国際学会
  • [学会発表] 音響情報と言語情報を利用した短区間の音声感情認識2022

    • 著者名/発表者名
      永瀬亮太郎, 福森隆寛, 山下洋一
    • 学会等名
      日本音響学会2022年春季研究発表会
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] 「平静」と「怒り」の感情の特性を考慮した音声感情認識のための label smoothing2021

    • 著者名/発表者名
      永瀬亮太郎, 福森隆寛, 山下洋一
    • 学会等名
      日本音響学会2021年秋季研究発表会
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] テキスト情報を利用した深層学習に基づく音声感情認識2021

    • 著者名/発表者名
      永瀬 亮太郎, 福森 隆寛, 山下 洋一
    • 学会等名
      日本音響学会2021年春季研究発表会講演論文集
    • 関連する報告書
      2020 実施状況報告書
  • [学会発表] ニュートラル音声の特性を考慮したソフトラベルによる感情分類モデル学習2020

    • 著者名/発表者名
      大澤まゆ子, 井本桂右, 山西良典, 福森隆寛, 山下洋一
    • 学会等名
      日本音響学会2020年秋季研究発表会講演論文集
    • 関連する報告書
      2020 実施状況報告書

URL: 

公開日: 2020-04-28   更新日: 2024-01-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi