研究概要 |
本研究では,討論などの議事録に話者の発話状態を付与するため,音声から音響的特徴を抽出し分析することで,話者の発話状態をモデル化することを目的としている. 話者の発話状態は,議事録に付与することが有効であると考えられるものとして,「強調」「疑問」「驚き」「自信」「迷い」「陽気」の6種類の印象表現と定義した.これらの印象表現は,どのような音響的特徴から推定することができるかを分析した.分析データとしては,初めに討論音声を扱うには話者の数や発話の重なりなどの要因があるため,まず対話音声を対象とした.対話音声には,日本語地図課題対話コーパスを用いた. まず,人間が音声から印象表現をどの程度感じるかを分析するため,聴取実験を行った.対話コーパス中から話者4名の40発話を取り出し,被験者10名により各印象表現をどの程度感じたかを7段階で評定させた.また,音響的特徴としてはF0の発話内平均,F0の発話内レンジ,パワーの発話内レンジ,平均モーラ長といった韻律特徴を用いた. 印象表現の主観評価と音響的特徴との関係を明らかにするために,正準相関分析を行った.その結果,第一正準変数は印象表現において強調との正の相関が高く,音響的特徴においてはパワーとF0のレンジと相関が高かった.これは,声の大きさ・高さの変化により発話における強さを表していると考えられる.また,第二正準変数は印象表現において疑問,迷いと正の相関,自信とは負の相関があり,音響的特徴においてはF0の平均と平均モーラ長との相関が高かった.これは,F0と話速により発話におけるあいまいさを表していると考えられる,以上のように,話者の発話状態と音響的特徴の関係を明らかにすることができた.
|