• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

認知モデルと常識ベースに基づく情動を含む音声コミュニケーション

研究課題

研究課題/領域番号 08F08049
研究種目

特別研究員奨励費

配分区分補助金
応募区分外国
研究分野 知覚情報処理・知能ロボティクス
研究機関東京大学

研究代表者

広瀬 啓吉  東京大学, 大学院・情報理工学系研究科, 教授

研究分担者 SHAIKH Mostata Al Masum  東京大学, 大学院・情報理工学系研究科, 外国人特別研究員
SHAIKH Mostafa Al Masum  東京大学, 大学院・情報理工学系研究科, 外国人特別研究員
研究期間 (年度) 2008 – 2009
研究課題ステータス 完了 (2009年度)
配分額 *注記
1,600千円 (直接経費: 1,600千円)
2009年度: 800千円 (直接経費: 800千円)
2008年度: 800千円 (直接経費: 800千円)
キーワード情動・感性 / 認知モデル / 音声合成 / 韻律 / 基本周波数 / 発話速度 / 情動判別 / Life Logging / Support Vector Machine
研究概要

昨年度、文の情動の程度を数値として表し、そこに含まれる感情の指標を抽出することを進めた。本年度は、その手法を高度化するとともに、得られる指標を合成音声に反映させることを中心に研究を進め、下記成果を達成した。
1.ニュース文について、動詞に着目して各句の肯定/否定の程度を評点として数値化した上で、順接、逆節といった句間の関係から、文全体の肯定/否定の程度を評点として与える手法を開発した。評点を用いて、英語音声合成フリーウェアのMARY音声合成システムの韻律を制御することを行った。お祭りのニュースなど、文内容が肯定的な場合は基本周波数/発話速度を上げ、事故のような、否定的な場合は、下げることを基本とする制御を行うことにより、文内容にふさわしい合成音声を得た。
2.認知モデルの立場から、喜び、悲しみなどの感情を、肯定/否定、興奮/抑制といった軸によって定式化し、文内容に含まれる感性情報を抽出する手法を開発した。肯定/否定、興奮/抑制の値によりMARY音声合成システムの韻律を制御することを行い、合成音声の聴取実験により抽出した感情が適切に反映されることを確認した。
3.音声からそこに含まれる情動/感性を抽出する手法について、音響部分の構築として、スペクトルの周波数と時間方向の変化の特徴と韻律的特徴を用い、Support Vector Machine等による判別を行うことで、定型文に限定されているが、肯定と否定の情動の判別率90%を達成した。
4.人間が生活する際に発生する種々の音から、人間の活動を推定する手法(Life Logging)の開発を進めた。音声認識で使われているMFCCを特徴量としたHMMを用いることで良好な音認識が可能なことを示した。

報告書

(2件)
  • 2009 実績報告書
  • 2008 実績報告書
  • 研究成果

    (8件)

すべて 2010 2009 2008

すべて 雑誌論文 (6件) (うち査読あり 6件) 学会発表 (2件)

  • [雑誌論文] Easy Living in the Virtual World : A Noble Approach to Integrate Real World Activities to Virtual Worlds2010

    • 著者名/発表者名
      Mostafa A1 Masum Shaikh
    • 雑誌名

      International Journal of Web Intelligence and Agent Systems 1(印刷中)(掲載確定)

    • 関連する報告書
      2009 実績報告書
    • 査読あり
  • [雑誌論文] Improving TTS Synthesis fbr Emotional Expressivity by a Prosodic Parameterization of Affect based on Linguistic Analysis2010

    • 著者名/発表者名
      Mostafa A1 Masum Shaikh
    • 雑誌名

      Proceedings of INTERSPEECH 2009 1(印刷中)(掲載確定)

    • 関連する報告書
      2009 実績報告書
    • 査読あり
  • [雑誌論文] Emotional Speech Synthesis by Sensing Affective Information from Text2009

    • 著者名/発表者名
      Mostafa A1 Masum Shaikh
    • 雑誌名

      Proc. Int'l Conf. on Affective Computing and Intelligent Interaction 1

      ページ: 466-471

    • 関連する報告書
      2009 実績報告書
    • 査読あり
  • [雑誌論文] Assigning suitable phrasal tones and pitch accents by sensing affective information from text to synthesize human-like speech2008

    • 著者名/発表者名
      Mostafa Al Masum Shaikh
    • 雑誌名

      Proceedings of Interspeech 1(CD-ROM)

      ページ: 326-329

    • 関連する報告書
      2008 実績報告書
    • 査読あり
  • [雑誌論文] An Approach for ambient communication by detecting real-world activities from environmental sound cues2008

    • 著者名/発表者名
      Mostafa Al Masum Shaikh
    • 雑誌名

      Proceedings of Internet/WWW 1(CD-ROM)

      ページ: 504-507

    • 関連する報告書
      2008 実績報告書
    • 査読あり
  • [雑誌論文] Automatic life-logging : A novel approach to sense real-world activities by environmental sound cues and common sense2008

    • 著者名/発表者名
      Mostafa Al Masum Shaikh
    • 雑誌名

      Proceedings of 11th International Conference on Computer and Information Technology 1(CD-ROM)

      ページ: 294-299

    • 関連する報告書
      2008 実績報告書
    • 査読あり
  • [学会発表] How to Improve TTS Systems for Emotional Exprcssivity2009

    • 著者名/発表者名
      Antonio Rui Ferreira Rebordao
    • 学会等名
      INTERSPEECH 2009
    • 発表場所
      Brighton Center, Brighton, U.K.
    • 年月日
      2009-09-07
    • 関連する報告書
      2009 実績報告書
  • [学会発表] Affective speech based interaction in pervasive applications2008

    • 著者名/発表者名
      Mostafa Al Masum Shaikh
    • 学会等名
      日本音響学会
    • 発表場所
      九州大学
    • 年月日
      2008-09-10
    • 関連する報告書
      2008 実績報告書

URL: 

公開日: 2008-04-01   更新日: 2024-03-26  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi