2008 Fiscal Year Annual Research Report
認知モデルと常識ベースに基づく情動を含む音声コミュニケーション
Project/Area Number |
08F08049
|
Research Institution | The University of Tokyo |
Principal Investigator |
広瀬 啓吉 The University of Tokyo, 大学院・情報理工学系研究科, 教授
|
Co-Investigator(Kenkyū-buntansha) |
SHAIKH Mostafa Al Masum 東京大学, 大学院・情報理工学系研究科, 外国人特別研究員
|
Keywords | 情動・感性 / 認知モデル / 音声合成 / 韻律 / 基本周波数 / 発話速度 / 情動判別 / Support Vector Machine |
Research Abstract |
テキストから感情に関する指標を抽出し、それを合成音声に反映させることを行い、下記の成果を達成した。 1.Webから得られる多量の文書について、動詞と共出する語句の組み合わせを抽出し、情動/感性との対応関係を構築し、感性情報抽出の知識ベースとした。特に、動詞に対し、肯定・中立・否定の評点を付与した。 2.認知モデルの立場から、喜び、悲しみなどの感情を、肯定/否定、興奮/抑制といった軸によって定式化し、1の知識ベースをもとに、文内容に含まれる感性情報を抽出する手法を開発し、その性能評価を行った。 3.上記1で得られる動詞の評点と、順接、逆節といった句間の関係から、文の肯定/否定の程度を評点として与える手法を開発した。ニュース文について、得られた評点によって、合成音声の韻律を制御する手法を開発した。お祭りのニュースなど、文内容が肯定的な場合は基本周波数/発話速度を上げ、事故のような、否定的な場合は、下げるという制御を行う。抽出される感性情報に合成エンジンとして既存のものを用いており、単純な韻律制御のみに限定されているが、効果を合成音声の聴取により確認した。現在、自己開発の合成エンジンを用いて、詳細な韻律制御を行うことを進めている。 音声からそこに含まれる情動/感性を抽出する手法についても、音響部分の構築として、スペクトルの周波数と時間方向の変化の特徴と韻律的特徴を用い、Support Vector Machineによる判別を行うことで、定型文に限定されているが、肯定と否定の情動の判別率90%を達成した。2の成果を基に文内容に含まれる感性情報を抽出して組み合わせることを進めている。
|