• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2015 Fiscal Year Annual Research Report

状態推定に基づく多様な音声の認識・合成による「人にやさしい」対話システムの研究

Research Project

Project/Area Number 15H02720
Research InstitutionTohoku University

Principal Investigator

能勢 隆  東北大学, 工学研究科, 准教授 (90550591)

Co-Investigator(Kenkyū-buntansha) 伊藤 彰則  東北大学, 工学研究科, 教授 (70232428)
Project Period (FY) 2015-04-01 – 2018-03-31
Keywords音声対話 / 感情音声合成 / 感情認識 / 対話意欲 / 感情音声コーパス / 音韻・韻律バランス文
Outline of Annual Research Achievements

今年度は以下の項目について研究成果が得られた。1. 音声対話において感情を行うことの妥当性、および感情推定法について検討を行なった。具体的にはまずは言語情報から感情を推定し、その感情に対して協調的な応答を返す場合と、ランダムな場合、入力感情とは逆の感情の応答を返した場合について対話の自然性や知的さなどの複数の主観的な評価を行い、協調的な応答が有効であることを示した。2. 音声合成部において自然性の高い音声を生成するため、従来の音韻バランスだけでなく、音韻と韻律(アクセントや文長)の両方のコンテキストを考慮した拡張エントロピーに基づく文選択方を提案し、評価実験を行なった。その結果、ランダムに文を選択した場合に比べ、有意に提案法のほうが自然性や再現性の高い合成音声が得られることがわかった。3. 対話におけるユーザの状態推定として対話意欲を対象として、実際に対話の収録を行い、得られた音声について分析・推定を行なった。その結果、ある程度対話意欲の程度に顕著な差がある場合については、対話意欲の度合いを音響的特徴などから精度よく推定できることがわかった。4. 感情を伴う音声対話における感情音声合成・感情音声認識・感情推定に利用可能な大規模な感情音声コーパスを構築するため、エントロピーを考慮した音韻・韻律バランス感情依存文の設計と予備的な評価を行なった。その後音声の収録を実際に行い、予備的な分析を行ない、音声の特性について調査した。

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

各基盤要素について並列で研究を進めることができ、想定以上の成果が得られた。

Strategy for Future Research Activity

引き続き、感情音声コーパスの大規模化を進め、収録した音声を用いた実験を行う。また、音声対話システムにおける応答についての検討や、音響モデルやアクセントなども含めた音声合成の性能向上、DNNに基づくリアルタイム音声認識の検討などについても研究を進める予定である。

  • Research Products

    (10 results)

All 2016 2015

All Journal Article (5 results) (of which Peer Reviewed: 2 results,  Acknowledgement Compliant: 3 results) Presentation (5 results) (of which Int'l Joint Research: 2 results)

  • [Journal Article] MMDAgentによる雑談対話に適した応答文選択法の評価2016

    • Author(s)
      蔭山友紀子,千葉祐弥,加瀬嵩人,能勢隆,伊藤彰則
    • Journal Title

      日本音響学会2016年春季研究発表会講演論文集

      Volume: - Pages: 93-94

    • Acknowledgement Compliant
  • [Journal Article] On Appropriateness and Estimation of the Emotion of Synthesized Response Speech in a Spoken Dialogue System2015

    • Author(s)
      Taketo Kase, Takashi Nose, Akinori Ito
    • Journal Title

      Proceedings of HCI International 2015

      Volume: - Pages: 588-593

    • DOI

      10.1007/978-3-319-21380-4_126

    • Peer Reviewed
  • [Journal Article] Entropy-based sentence selection for speech synthesis using phonetic and prosodic contexts2015

    • Author(s)
      Takashi Nose, Yusuke Arao, Takao Kobayashi, Komei Sugiura, Yoshinori Shiga, Akinori Ito
    • Journal Title

      Proceedings of 16th Annual Conference of the International Speech Communication Association

      Volume: - Pages: 3491-3495

    • Peer Reviewed
  • [Journal Article] 感情音声データベースの構築に向けた音韻・韻律バランス感情依存文の設計2015

    • Author(s)
      武石笑歌, 能勢隆, 加瀬嵩人, 伊藤彰則
    • Journal Title

      日本音響学会2015年秋季研究発表会講演論文集

      Volume: - Pages: 313-316

    • Acknowledgement Compliant
  • [Journal Article] エントロピーに基づく音韻・韻律バランス感情依存文の設計と評価2015

    • Author(s)
      武石笑歌, 能勢 隆, 加瀬嵩人, 伊藤彰則
    • Journal Title

      電子情報通信学会技術研究報告

      Volume: Vol. 115, No. 253 Pages: 33-38

    • Acknowledgement Compliant
  • [Presentation] MMDAgentによる雑談対話に適した応答文選択法の評価2016

    • Author(s)
      蔭山友紀子
    • Organizer
      日本音響学会2016年春季研究発表会
    • Place of Presentation
      桐蔭横浜大学(横浜市)
    • Year and Date
      2016-03-09 – 2016-03-09
  • [Presentation] (招待講演)表情豊かな音声合成の現状と未来2015

    • Author(s)
      能勢隆
    • Organizer
      日本音響学会2015年秋季研究発表会
    • Place of Presentation
      会津大学(会津若松市)
    • Year and Date
      2015-09-17 – 2015-09-17
  • [Presentation] 感情音声データベースの構築に向けた音韻・韻律バランス感情依存文の設計2015

    • Author(s)
      武石笑歌
    • Organizer
      日本音響学会2015年秋季研究発表会
    • Place of Presentation
      会津大学(会津若松市)
    • Year and Date
      2015-09-16 – 2015-09-16
  • [Presentation] Entropy-based sentence selection for speech synthesis using phonetic and prosodic contexts2015

    • Author(s)
      Takashi Nose
    • Organizer
      16th Annual Conference of the International Speech Communication Association
    • Place of Presentation
      Dresden, Germany
    • Year and Date
      2015-09-10 – 2015-09-10
    • Int'l Joint Research
  • [Presentation] On Appropriateness and Estimation of the Emotion of Synthesized Response Speech in a Spoken Dialogue System2015

    • Author(s)
      Taketo Kase
    • Organizer
      HCI International 2015
    • Place of Presentation
      Los Angeles, USA
    • Year and Date
      2015-08-05 – 2015-08-05
    • Int'l Joint Research

URL: 

Published: 2018-01-16  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi