音声による感情表出に関する韻律的特徴の分析と韻律制御モデルの構築
Project/Area Number |
07J00642
|
Research Category |
Grant-in-Aid for JSPS Fellows
|
Allocation Type | Single-year Grants |
Section | 国内 |
Research Field |
Media informatics/Database
|
Research Institution | The National Institute for Japanese Language (2008) Tokyo University of Technology (2007) |
Principal Investigator |
河津 宏美 The National Institute for Japanese Language, 研究開発部門, 特別研究員(PD)
|
Project Period (FY) |
2007 – 2008
|
Project Status |
Completed (Fiscal Year 2008)
|
Budget Amount *help |
¥1,800,000 (Direct Cost: ¥1,800,000)
Fiscal Year 2008: ¥900,000 (Direct Cost: ¥900,000)
Fiscal Year 2007: ¥900,000 (Direct Cost: ¥900,000)
|
Keywords | 音声合成 / 感情の程度 / 韻律的特徴 / 韻律制御モデル |
Research Abstract |
音声により伝達される感情が、いかなる物理的特徴量として表出するかを明らかにし、感情を込めた表現をどのように認識・生成するかについての知見を得ることを目標として研究を行った。 1.感情が表現された音声資料の収集 感情が表現された自然な発話を収録するために、ゲーム中のプレーヤー同士の対話を収録した。発話単位は400ms以上のポーズにはさまれた音声の範囲とした。また、感情を込めた典型的な音声として、自然発話で集めた音声と同一の言語的内容に対して、異なる程度の感情を込めた発声を話者に行わせ、その音声を収録した。話者が意図したとおりの感情発話を収録するために、劇団に所属する20〜30代の男女それぞれ2名ずつの計4名を話者とした。 2.ラベリング 自然発話で集めた音声に対して、感情の種類および程度の付与を行った。なお、感情の種類としては、感情立体モデルの基本感情である「喜び-悲しみ」「怒り-恐れ」「受容-嫌悪」「驚き-期待」の4次元8感情を取り扱った。また、典型的な感情が表現された音声を対象に、X-JToBIに基づく韻律ラベリングを行った。X-JToBIはJ_ToBIの拡張版であり、多様性のある韻律に対応している。 3.韻律モデル 声の高さ、声の長さ、声の強さ、声質に関する音声特徴量を抽出し、統計的手法によるモデル化を行った。モデルは、感情の種類の推定するためのものと、その程度を推定するためのものとをそれぞれ構築した。これと並行して、2.で付与した韻律ラベルに基づき、感情の程度変化にともなう韻律現象の分析を行った。 4.母音の無声化 より自然な音声を合成するために、無声子音の調音様式が母音の無声化率におよぼす影響について分析を行った。「日本語話し言葉コーパス」のコアの音声を分析の対象として、母音の無声化の生起率を求めた。さらに、ケプストラム距離尺度を利用し、無声化の生じたモーラと直後の無声子音とのスペクトルパターン間の類似性を定量化した。
|
Report
(2 results)
Research Products
(10 results)