韻律情報と音韻情報の有機的密結合による音声認識の研究

研究課題

研究課題/領域番号	05780283
研究種目	奨励研究(A)
配分区分	補助金
研究分野	知能情報学
研究機関	北陸先端科学技術大学院大学
研究代表者	下平博北陸先端科学技術大学院大学, 情報科学研究科, 助教授 (30206239)
研究期間 (年度)	1993
研究課題ステータス	完了 (1993年度)
配分額 *注記	900千円 (直接経費: 900千円) 1993年度: 900千円 (直接経費: 900千円)
キーワード	句境界検出 / 韻律情報 / ピッチ / 連続音声認識
研究概要	本研究は、アクセントやイントネーションに代表される韻律情報を音韻情報と同格に扱い、両者を有機的に結合することによって、連続音声中の単語や文節の認識精度を向上させる手法の開発を研究目的とした開始された。韻律句を自動抽出する手法として、モデルを仮定せずに実際に大量の音声資料から得らる統計的な特徴を利用したボトモアップ的な手法を取り入れた点に本手法の特徴がある。実験はATR製の連続音声データベ-(セットB、話者10名)を用いて行われた。研究の成果は以下の通りである。 1.ラグ窓法に周波数帯域分割法を施すことによって、ピッチ抽出精度が向上することが分かった。 2.学習データのアクセントパターンのクラスタリングを行い、得られたアクセントテンプレートと、未知入力としての連続音声のピッチパターンとをOne Stage DP法によって連続整合することによって、アクセント句の自動抽出を試みた。実験によって以下の結果を得た。 (1)視察境界の約83%を自動検出することができた。 (2)ピッチテンプレートのテキスト依存性は低く、テキストに依存しない一般的なピッチパターンの特徴がとらえられていることが分かった。これに対し、話者依存性はかなり大きいことが分かった。得られた韻律句の情報と音韻認識を統合する作業は現在進行中である。予備的な実験によると、韻律境界に誤りが多く含まれているため単一の候補では情報量として不足であることが判明した。そこで、複数の候補を選出し、その結果を利用することを検討中である。

報告書

(1件)

1993 実績報告書

研究成果
(3件)

すべてその他

すべて文献書誌 (3件)

[文献書誌] H.Shimodaira: "Accent Phrase Segmentation Using Transition Probabilities between Pitch Pattern Templates" Proc.of International Conference Eurospeech'93. 3. 1767-1770 (1993)
- 関連する報告書
  1993 実績報告書
[文献書誌] 中井満: "ピッチパターンのクラスタリングに基づく不特定話者連続音声の句境界検出" 電子情報通信学会論文詩(A). J77-A,2. 206-214 (1994)
- 関連する報告書
  1993 実績報告書
[文献書誌] Hiroshi SHIMODAIRA: "Prosodic Phrase Segmentation By Pitch Pattern Clustering" Proc.of International Conference ICASSP-94. (発表予定). (1994)
- 関連する報告書
  1993 実績報告書

韻律情報と音韻情報の有機的密結合による音声認識の研究

研究代表者

下平 博 北陸先端科学技術大学院大学, 情報科学研究科, 助教授 (30206239)

900千円 (直接経費: 900千円)

報告書

研究成果

[文献書誌] H.Shimodaira: "Accent Phrase Segmentation Using Transition Probabilities between Pitch Pattern Templates" Proc.of International Conference Eurospeech'93. 3. 1767-1770 (1993)

関連する報告書

[文献書誌] 中井 満: "ピッチパターンのクラスタリングに基づく不特定話者連続音声の句境界検出" 電子情報通信学会論文詩(A). J77-A,2. 206-214 (1994)

関連する報告書

[文献書誌] Hiroshi SHIMODAIRA: "Prosodic Phrase Segmentation By Pitch Pattern Clustering" Proc.of International Conference ICASSP-94. (発表予定). (1994)

関連する報告書

下平博北陸先端科学技術大学院大学, 情報科学研究科, 助教授 (30206239)

[文献書誌] 中井満: "ピッチパターンのクラスタリングに基づく不特定話者連続音声の句境界検出" 電子情報通信学会論文詩(A). J77-A,2. 206-214 (1994)