2006 Fiscal Year Annual Research Report

韻律表現の変化を利用した重要箇所抽出による講演音声要約

Research Project

Project/Area Number	18500143
Research Category	Grant-in-Aid for Scientific Research (C)
Research Institution	Ritsumeikan University
Principal Investigator	山下洋一立命館大学, 情報理工学部, 教授 (80174689)
Keywords	基本周波数 / 統計モデル / 音声要約 / 重要文 / FO / 基本周波数モデル
Research Abstract	講演音声において,通常とは異なる調子で発声している箇所を検出するために,声の高さを表す基本周波数(FO)の変化を利用することを考える。発話内容が既知である状況において,通常の発声におけるFOパターンを音声合成の手法を用いて予測し,実際に発声された音声のFOパターンとを比較することによって,差の大きい区間を検出する。本年度の研究では,FOパターンの予測精度を向上させるため,多数の音声データに基づいた統計的FOモデルの構築を行った。多数の文節基本周波数パターンからクラスタリングによって代表的な文節FOパターンを選択し,各クラスタにおける言語素性の頻度分布に基づいて観測FOパターンの生成確率を算出するモデル化を行った。学習データとして,日本語話し言葉コーパス(CSJ)における180講演の音声データから約15万文節を使用した。FOモデルの評価を行うため,発話内容が既知である音声に対するアクセント型推定の評価実験を行った。評価データとして,学習データとは異なる音韻バランス文503文を用い,クラスタ数を2から1024まで変化させ精度の変化を調べた。評価データに対するアクセント型は視察によりあらかじめ決定されている。FOモデルを利用したアクセント型の推定では,距離により単一クラスタを選択する手法,折れ線近似のパラメータ表現を用いた確率による単一クラスタ選択,藤崎モデルのパラメータ表現を用いた確率による単一クラスタ選択,折れ線近似のパラメータ表現を用いた確率による複数クラスタ利用,藤崎モデルのパラメータ表現を用いた確率による複数クラスタ利用の5つの手法を比較した。評価実験により構築した統計的FOモデル言の妥当性を検証した。

Research Products
(2 results)

All Journal Article (2 results)

[Journal Article] 音声ドキュメント検索評価のためのテストコレクションの試作2006
- Author(s)
  伊藤克亘, 他7名, 山下洋一
- Journal Title
  
  電気情報通信学会技術研究報告 SP2006-108
  
  Pages: 137-142
[Journal Article] 基本周波数モデルに基づいた発話のアクセント型自動推定2006
- Author(s)
  鈴木和博
- Journal Title
  
  第24回関西合同音声ゼミ 3-7