• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2016 Fiscal Year Annual Research Report

Affect burst―音声対話における無意識な感情表出の分析および合成

Research Project

Project/Area Number 26280100
Research InstitutionUtsunomiya University

Principal Investigator

森 大毅  宇都宮大学, 工学(系)研究科(研究院), 准教授 (10302184)

Co-Investigator(Kenkyū-buntansha) 有本 泰子  国立研究開発法人理化学研究所, その他部局等, 研究員 (60586957)
能勢 隆  東北大学, 工学(系)研究科(研究院), 准教授 (90550591)
Project Period (FY) 2014-04-01 – 2018-03-31
Keywords笑い声合成 / アノテーション / 知覚
Outline of Annual Research Achievements

(5) Affect burstを含む対話音声の合成
対話中に生じる笑い声の統計モデルを構築するため、UUDBおよびOGVCに含まれる笑い声の詳細なセグメンテーションを行った。笑い声の構造は、音節に対応するcall, 1つ以上のcallから成り1回の呼気に対応するbout, boutおよび吸気の連続からなる1連の笑いエピソードのように、階層的に理解される。本年度は、各笑いエピソードに対してbout/吸気およびcallレベルのセグメンテーションを行った。各boutの特徴は、「ハ」「フ」などの日本語の音節による表記を基本にし、有声/無声、鼻音、引き伸ばしなどのバリエーションを補助記号で記述することにより行った。笑い声の合成方式にはHMM音声合成を採用し、先行/後続セグメントやcallの位置などの情報からなるコンテキストを定義してモデル化を行った。UUDBおよびOGVCに含まれる3名の笑い声109 boutsを用いてモデル学習を行い、笑い声合成を行った。合成された笑い声の品質は9名の学生による自然性評価実験によって確認した。その結果、5段階のMean Opinion Scoreによる評価で2.83が得られた。また、位置の情報を考慮したコンテキストが自然性の向上に有効であることがわかった。
(4) Affect burst音声の知覚実験
笑い声の特徴の違いが笑い声を含む発話に印象に与える影響を調べるため、(5)で実現したHMM笑い声合成のコンテキスト情報を操作した刺激を作成し、そこから知覚されるパラ言語情報の違いを調べる知覚実験を行った。操作したコンテキストは、母音種の違い(/a/ vs /u/)、およびピッチの変化パターン(下降後に低、上昇後に高、高、低)である。実験の結果、/a/系の笑い声は/u/系の笑い声と比べ快寄りかつ覚醒寄りに知覚される傾向が得られた。ピッチの変化パターンについては、/a/系では影響がなく、/u/系では低パターンが他のパターンに比べ不快寄りに知覚される傾向が得られた。

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

以下の計画は、今年度中に十分に達成できなかった。
(i)今年度は27年度計画を繰り越して叫び声コーパスの収録を実施したが、収録および基本的なコーパス整備が遅れている。このため、叫び声の音声学的分析に至らなかった。
(ii)Affect burst音声の知覚実験について、合成笑い声を使った実験は実施したが、自然音声を使った実験の良い方策が見つからなかった。
(iii)感情表出系感動詞の合成については、モデル化の方法に問題があり、高品質な合成音声が得られなかった。

Strategy for Future Research Activity

叫び声コーパスは、分析に必要な整備を急ピッチで進めることとする。
感情表出系感動詞の合成については、言語音とは別個にモデル化すること、および連結学習の工程を経ないで学習することで、高品質な音声を合成できることを確認している。次年度は、少ないデータからでもバリエーションを表現することができるコンテキストを定義し、種々の合成音に対し知覚実験を行う予定である。

Causes of Carryover

叫び声コーパスの収録が遅れ、アノテーション作業が次年度に持ち越しとなったため。

Expenditure Plan for Carryover Budget

最終年度であるので、アノテーション、計算資源の拡充、知覚実験を同時並行的に進め、当初の研究目的を達成するよう努める。

  • Research Products

    (13 results)

All 2017 2016

All Journal Article (5 results) (of which Peer Reviewed: 5 results,  Open Access: 1 results) Presentation (8 results)

  • [Journal Article] Dimensional paralinguistic information control based on multiple-regression HSMM for spontaneous dialogue speech synthesis with robust parameter estimation2017

    • Author(s)
      Nagata Tomohiro、Mori Hiroki、Nose Takashi
    • Journal Title

      Speech Communication

      Volume: 88 Pages: 137~148

    • DOI

      10.1016/j.specom.2017.01.002

    • Peer Reviewed
  • [Journal Article] Voice-quality difference between the vowels in filled pauses and ordinary lexical items2016

    • Author(s)
      Kikuo Maekawa and Hiroki Mori
    • Journal Title

      Proc. Interspeech 2016

      Volume: なし Pages: 3171-3175

    • DOI

      10.21437/Interspeech.2016-1309

    • Peer Reviewed
  • [Journal Article] A study on tailor-made speech synthesis based on deep neural networks2016

    • Author(s)
      Shuhei Yamada, Takashi Nose, and Akinori Ito
    • Journal Title

      Proceeding of the Twelfth International Conference on Intelligent Information Hiding and Multimedia Signal Processing

      Volume: 1 Pages: 159-166

    • DOI

      10.1007/978-3-319-50209-0_20

    • Peer Reviewed
  • [Journal Article] Construction and analysis of phonetically and prosodically balanced emotional speech database2016

    • Author(s)
      Emika Takeishi, Takashi Nose, Yuya Chiba, Akinori Ito
    • Journal Title

      Proc. O-COCOSDA 2016

      Volume: なし Pages: 16-21

    • DOI

      10.1109/ICSDA.2016.7918977

    • Peer Reviewed
  • [Journal Article] Comparison of emotional understanding in modality-controlled environments using multimodal online emotional communication corpus2016

    • Author(s)
      Y. Arimoto and K. Okanoya
    • Journal Title

      Proc. LREC 2016

      Volume: なし Pages: 2162-2167

    • Peer Reviewed / Open Access
  • [Presentation] 対話音声の感情認識における音響的特徴と言語的特徴の効果2017

    • Author(s)
      横山 雅季, 森 大毅, 有本 泰子
    • Organizer
      日本音響学会2017年春季研究発表会
    • Place of Presentation
      明治大学生田キャンパス
    • Year and Date
      2017-03-15 – 2017-03-17
  • [Presentation] 話し言葉音声合成のためのWeb上のテキストデータを用いたコーパス設計の検討2017

    • Author(s)
      花房伸哉, 能勢隆, 伊藤彰則
    • Organizer
      日本音響学会2017年春季研究発表会講演論文集
    • Place of Presentation
      明治大学生田キャンパス
    • Year and Date
      2017-03-15 – 2017-03-17
  • [Presentation] 感情音声データベースJTESの音声合成による評価2017

    • Author(s)
      武石笑歌,能勢隆,山田修平,千葉祐弥,伊藤彰則
    • Organizer
      日本音響学会2017年春季研究発表会講演論文集
    • Place of Presentation
      明治大学生田キャンパス
    • Year and Date
      2017-03-15 – 2017-03-17
  • [Presentation] クロスコーパスラベリングによる感情空間への感情カテゴリのマッピング―音声知覚および音響分析による検討―2016

    • Author(s)
      有本 泰子, 森 大毅
    • Organizer
      HCGシンポジウム2016
    • Place of Presentation
      高知市文化プラザかるぽーと
    • Year and Date
      2016-12-07 – 2016-12-09
  • [Presentation] 話し手の説明戦略に影響する聞き手行動の分析2016

    • Author(s)
      藍原 瞭, 森 大毅
    • Organizer
      HCGシンポジウム2016
    • Place of Presentation
      高知市文化プラザかるぽーと
    • Year and Date
      2016-12-07 – 2016-12-09
  • [Presentation] 音声からの知覚による感情カテゴリと感情次元の関係2016

    • Author(s)
      有本 泰子, 森 大毅
    • Organizer
      日本音響学会2016年秋季研究発表会
    • Place of Presentation
      愛媛大学城北キャンパス
    • Year and Date
      2016-09-25 – 2016-09-27
  • [Presentation] HMM音声合成における複数の自然対話コーパス(UUDB,OGVC)併用の有効性2016

    • Author(s)
      嘉屋 和樹, 森 大毅
    • Organizer
      日本音響学会2016年秋季研究発表会
    • Place of Presentation
      愛媛大学城北キャンパス
    • Year and Date
      2016-09-25 – 2016-09-27
  • [Presentation] ニューラルネットワークを用いた基本周波数パターンのモデル化2016

    • Author(s)
      田中 勇翔, 森 大毅
    • Organizer
      日本音響学会2016年秋季研究発表会
    • Place of Presentation
      愛媛大学城北キャンパス
    • Year and Date
      2016-09-25 – 2016-09-27

URL: 

Published: 2018-01-16  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi