• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

音声中の感情認識のための新しい認識方略に関する研究

研究課題

研究課題/領域番号 22650032
研究種目

挑戦的萌芽研究

配分区分補助金
研究分野 知覚情報処理・知能ロボティクス
研究機関北陸先端科学技術大学院大学

研究代表者

赤木 正人  北陸先端科学技術大学院大学, 情報科学研究科, 教授 (20242571)

研究分担者 鵜木 祐史  北陸先端科学技術大学院大学, 情報科学研究科, 准教授 (00343187)
宮内 良太  北陸先端科学技術大学院大学, 情報科学研究科, 助教 (30455852)
李 軍鋒  中国科学院, 声学研究所, 教授 (50431466)
研究期間 (年度) 2010 – 2012
研究課題ステータス 完了 (2012年度)
配分額 *注記
3,320千円 (直接経費: 2,900千円、間接経費: 420千円)
2012年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2011年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2010年度: 1,500千円 (直接経費: 1,500千円)
キーワード音声認識 / 感情音声 / 音声知覚モデル / 感情基本因子 / 対話解析
研究概要

本研究では,感情を基本因子ベクトルArousal-Valence-Dominance の合成ベクトルとして表現するという新しい発想のもと,申請者らが提案している音声中の感情知覚モデルを感情音声認識に適用し,感情が複数含まれる音声からそれぞれの感情の程度までを推定する手法を提案した。評価の結果,感情空間へのマッピングについて提案法が最もヒトの特性に近く,認識精度もGMM を用いた手法と比較して本手法が認識率で大きく優れていることが確認できた。

報告書

(4件)
  • 2012 実績報告書   研究成果報告書 ( PDF )
  • 2011 実績報告書
  • 2010 実績報告書
  • 研究成果

    (20件)

すべて 2013 2012 2011 2010 その他

すべて 雑誌論文 (7件) (うち査読あり 5件) 学会発表 (13件)

  • [雑誌論文] Speech Emotion Recognition System Based on a Dimensional Approach Using a Three-Layered Model2012

    • 著者名/発表者名
      Elbarougy, R. and Akagi, M.
    • 雑誌名

      Proc. APSIPA2012

      巻: -

    • NAID

      120006675349

    • 関連する報告書
      2012 実績報告書
    • 査読あり
  • [雑誌論文] Comparison of emotion perception among different cultures2010

    • 著者名/発表者名
      Dang, J., Li, A., Erickson, D., Suemitsu, A., Akagi, M., Sakuraba, K., Mienmatasu, N., and Hirose, K.
    • 雑誌名

      Acoust. Sci. & Tech. 31

      巻: 6 ページ: 394-402

    • NAID

      120006660647

    • 関連する報告書
      2012 研究成果報告書
    • 査読あり
  • [雑誌論文] A hybrid speech emotion recognition system based on spectral and prosodic features2010

    • 著者名/発表者名
      Zhou, Y., Li, J., Sun, Y., Zhang, J., Yan, Y., and Akagi, M.
    • 雑誌名

      IEICE Trans. Info. & Sys.

      巻: E93D (10) ページ: 2813-2821

    • NAID

      10027641285

    • 関連する報告書
      2012 研究成果報告書
    • 査読あり
  • [雑誌論文] 音声に含まれる感情情報の認識 -感情空間をどのように表現するか-2010

    • 著者名/発表者名
      赤木正人
    • 雑誌名

      日本音響学会誌

      巻: 66, 8 ページ: 393-398

    • NAID

      110007681909

    • 関連する報告書
      2012 研究成果報告書
  • [雑誌論文] A hybrid speech emotion recognition system based on spectral and prosodic features2010

    • 著者名/発表者名
      Yu Zhou, Junfeng Li, Yanqing Sun, Jianping Zhang, Yonghong Yan , Masato Akagi
    • 雑誌名

      IEICE Trans on Information and Systems

      巻: Vol.E93-D, No.10 ページ: 2813-2821

    • NAID

      10027641285

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [雑誌論文] Comparison of emotion perception among different cultures2010

    • 著者名/発表者名
      Dang, J., Li, A., Erickson, D., Suemitsu, A., Akagi, M., Sakuraba, K., Mienmatasu, N., Hirose, K.
    • 雑誌名

      Acoustic Science and Technology

      巻: 31, 6 ページ: 394-402

    • NAID

      120006660647

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [雑誌論文] 音声に含まれる感情情報の認識-感情空間をどのように表現するか2010

    • 著者名/発表者名
      赤木正人
    • 雑誌名

      日本音響学会誌

      巻: 66, 8 ページ: 393-398

    • NAID

      110007681909

    • 関連する報告書
      2010 実績報告書
  • [学会発表] Automatic Speech Emotion Recognition Using A Three Layer Model2013

    • 著者名/発表者名
      Elbarougy, R. and Akagi, M.
    • 学会等名
      IEICE Tech. Report
    • 発表場所
      大同大学,名古屋,愛知県
    • 年月日
      2013-03-01
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] Speech Emotion Recognition System Based on a Dimensional Approach Using a Three-Layered Model2012

    • 著者名/発表者名
      Elbarougy, R. and Akagi, M
    • 学会等名
      Proc.APSIPA2012 (CD-ROM)
    • 発表場所
      Hollywood, USA
    • 年月日
      2012-12-04
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] Comparison of methods for emotion dimensions estimation in speech using a three-layered model2012

    • 著者名/発表者名
      Elbarougy, R. and Akagi, M.
    • 学会等名
      IEICE Tech. Report
    • 発表場所
      NTT研究所,厚木,神奈川県
    • 年月日
      2012-06-14
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] A Three-layered model for Automatic Speech Emotion Recognition using a Dimensional Approach2012

    • 著者名/発表者名
      Elbarougy R. and Akagi, M.
    • 学会等名
      JSPS A3 Foresight Workshop
    • 発表場所
      粟津温泉,石川県小松市
    • 年月日
      2012-02-25
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] A Three-layered model for Automatic Speech Emotion Recognition using a Dimensional Approach2012

    • 著者名/発表者名
      Elbarougy Reda, Masato Akagi
    • 学会等名
      JSPS A3 Foresight Workshop, Ishikawa
    • 発表場所
      粟津温泉(石川県小松市)
    • 年月日
      2012-02-25
    • 関連する報告書
      2011 実績報告書
  • [学会発表] 聴覚と音研究2011

    • 著者名/発表者名
      赤木正人
    • 学会等名
      音響学会聴覚研究会資料
    • 発表場所
      牛岳温泉リゾート,富山県富山市
    • 年月日
      2011-10-02
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] 聴覚と音研究2011

    • 著者名/発表者名
      赤木正人
    • 学会等名
      音響学会聴覚研究会
    • 発表場所
      牛岳温泉リゾート(富山県富山市)(招待講演)
    • 年月日
      2011-10-02
    • 関連する報告書
      2011 実績報告書
  • [学会発表] 音声の知覚と認識 -人は脳で音声を聞く.機械は?-2011

    • 著者名/発表者名
      赤木,羽二生
    • 学会等名
      日本音響学会平成23 年春季研究発表会
    • 発表場所
      早稲田大学,東京
    • 年月日
      2011-03-09
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] 音声の知覚と認識-人は脳で音声を聞く.機械は2011

    • 著者名/発表者名
      赤木, 羽二生
    • 学会等名
      日本音響学会平成23年春季研究発表会
    • 発表場所
      早稲田大学(東京)(招待講演)
    • 年月日
      2011-03-09
    • 関連する報告書
      2010 実績報告書
  • [学会発表] Rule-based voice conversion derived from expressive speech perception model: How do computers sing a song joyfully?2010

    • 著者名/発表者名
      Akagi, M.
    • 学会等名
      Tutorial, ISCSLP2010
    • 発表場所
      National Cheng Kung University, Tainan, Taiwan.
    • 年月日
      2010-11-29
    • 関連する報告書
      2012 研究成果報告書
  • [学会発表] Rule based voice conversion derived from expressive speech perception model How do computers sing a song joyfully?2010

    • 著者名/発表者名
      Akagi, M.
    • 学会等名
      International Symposium on Chinese Spoken Language Processing 2010
    • 発表場所
      成功大学(Tainan, Taiwan)(招待講演)
    • 年月日
      2010-11-29
    • 関連する報告書
      2010 実績報告書
  • [学会発表] Comparison of methods for emotion dimensions estimation in speech using a three-layered model

    • 著者名/発表者名
      Elbarougy, R. and Akagi, M.
    • 学会等名
      IEICE Tech. Report, SP2012-36
    • 発表場所
      Atsugi
    • 関連する報告書
      2012 実績報告書
  • [学会発表] Automatic Speech Emotion Recognition Using A Three Layer Model

    • 著者名/発表者名
      Elbarougy, R. and Akagi, M.
    • 学会等名
      IEICE Tech. Report, SP2012-127
    • 発表場所
      Nagoya
    • 関連する報告書
      2012 実績報告書

URL: 

公開日: 2010-08-23   更新日: 2019-07-29  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi