研究概要 |
統計的F0モデルの妥当性を検証するために,アクセント句F0パターンをクラスタリングに基づき構築からのアクセント,型候補推定を行い,アクセント型推定制度の向上を試みた。CSJコーパスにおける167の講演音声のうち,152の講演音声を学習データとして,残りの15の講演音声を評価データとして用いた。アクセント型候補を使用することにより推定精度が向上することと合わせて,統計的F0モデルの妥当性を示した。 重要文検出に基づいた講演音声の自動要約を実現するためにCSJにおける20講演を用いて17名の作業者による重要文抽出実験を行い,その結果を分析した。抽出された重要文に対する作業者間の一致度,F0の分散と一致度の相関から,抑揚のある講演ほど重要文抽出結果が一致しやすいことが確認できた。CSJに付加されている重要文抽出結果に対しても一致度を算出し,実験結果と比較を行った。 人手による要約実験の結果に基づき,200msのポーズで挟まれた範囲を基本単位とし,人手により決定された重要度と,韻律情報から抽出したパラメータとの関係を分析した。人手により決定された重要度と,韻律パラメータとの間にあまり強い相関は得られなかったものの,パワーに関しては,スムージングを行うとより強い相関が得られる傾向があり,スムージングに用いる発話数は3個よりも5個のほうが強い相関が得られる傾向があったが,重み付けをすると多少相関が弱くなる傾向があった。また発話時間長に関しては他のパラメータよりも多少強い相関が得られた。
|