2008 Fiscal Year Annual Research Report

認知モデルと常識ベースに基づく情動を含む音声コミュニケーション

Research Project

Project/Area Number	08F08049
Research Institution	The University of Tokyo
Principal Investigator	広瀬啓吉 The University of Tokyo, 大学院・情報理工学系研究科, 教授
Co-Investigator(Kenkyū-buntansha)	SHAIKH Mostafa Al Masum 東京大学, 大学院・情報理工学系研究科, 外国人特別研究員
Keywords	情動・感性 / 認知モデル / 音声合成 / 韻律 / 基本周波数 / 発話速度 / 情動判別 / Support Vector Machine
Research Abstract	テキストから感情に関する指標を抽出し、それを合成音声に反映させることを行い、下記の成果を達成した。 1.Webから得られる多量の文書について、動詞と共出する語句の組み合わせを抽出し、情動/感性との対応関係を構築し、感性情報抽出の知識ベースとした。特に、動詞に対し、肯定・中立・否定の評点を付与した。 2.認知モデルの立場から、喜び、悲しみなどの感情を、肯定/否定、興奮/抑制といった軸によって定式化し、1の知識ベースをもとに、文内容に含まれる感性情報を抽出する手法を開発し、その性能評価を行った。 3.上記1で得られる動詞の評点と、順接、逆節といった句間の関係から、文の肯定/否定の程度を評点として与える手法を開発した。ニュース文について、得られた評点によって、合成音声の韻律を制御する手法を開発した。お祭りのニュースなど、文内容が肯定的な場合は基本周波数/発話速度を上げ、事故のような、否定的な場合は、下げるという制御を行う。抽出される感性情報に合成エンジンとして既存のものを用いており、単純な韻律制御のみに限定されているが、効果を合成音声の聴取により確認した。現在、自己開発の合成エンジンを用いて、詳細な韻律制御を行うことを進めている。音声からそこに含まれる情動/感性を抽出する手法についても、音響部分の構築として、スペクトルの周波数と時間方向の変化の特徴と韻律的特徴を用い、Support Vector Machineによる判別を行うことで、定型文に限定されているが、肯定と否定の情動の判別率90%を達成した。2の成果を基に文内容に含まれる感性情報を抽出して組み合わせることを進めている。

Research Products
(4 results)

All 2008

All Journal Article (3 results) (of which Peer Reviewed: 3 results) Presentation (1 results)

[Journal Article] Assigning suitable phrasal tones and pitch accents by sensing affective information from text to synthesize human-like speech2008
- Author(s)
  Mostafa Al Masum Shaikh
- Journal Title
  
  Proceedings of Interspeech 1(CD-ROM)
  
  Pages: 326-329
- Peer Reviewed
[Journal Article] An Approach for ambient communication by detecting real-world activities from environmental sound cues2008
- Author(s)
  Mostafa Al Masum Shaikh
- Journal Title
  
  Proceedings of Internet/WWW 1(CD-ROM)
  
  Pages: 504-507
- Peer Reviewed
[Journal Article] Automatic life-logging : A novel approach to sense real-world activities by environmental sound cues and common sense2008
- Author(s)
  Mostafa Al Masum Shaikh
- Journal Title
  
  Proceedings of 11th International Conference on Computer and Information Technology 1(CD-ROM)
  
  Pages: 294-299
- Peer Reviewed
[Presentation] Affective speech based interaction in pervasive applications2008
- Author(s)
  Mostafa Al Masum Shaikh
- Organizer
  日本音響学会
- Place of Presentation
  九州大学
- Year and Date
  2008-09-10

2008 Fiscal Year Annual Research Report

認知モデルと常識ベースに基づく情動を含む音声コミュニケーション

Principal Investigator

広瀬 啓吉 The University of Tokyo, 大学院・情報理工学系研究科, 教授

Research Products

[Journal Article] Assigning suitable phrasal tones and pitch accents by sensing affective information from text to synthesize human-like speech2008

Author(s)

Journal Title

[Journal Article] An Approach for ambient communication by detecting real-world activities from environmental sound cues2008

Author(s)

Journal Title

[Journal Article] Automatic life-logging : A novel approach to sense real-world activities by environmental sound cues and common sense2008

Author(s)

Journal Title

[Presentation] Affective speech based interaction in pervasive applications2008

Author(s)

Organizer

Place of Presentation

Year and Date

広瀬啓吉 The University of Tokyo, 大学院・情報理工学系研究科, 教授