• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

1998 年度 実績報告書

音声認識における韻律利用のための確率的韻律表現に関する研究

研究課題

研究課題/領域番号 10780222
研究機関北陸先端科学技術大学院大学

研究代表者

中井 満  北陸先端科学技術大学院大学, 情報科学研究科, 助手 (60283149)

キーワードF0信頼場 / F0信頼度 / ピッチパターン / 韻律 / 音声認識 / 韻律句境界検出 / 藤崎モデル
研究概要

本課題では音声確認を支援する特徴量として、音声の了解性に寄与する韻律(アクセント、イントネーション、リズムなど)に着目し、これらを「何如にパターン認識に用い易い特徴量として表現するか」について検討を行なっている。
この韻律特徴量の一つの表現形態として、本年度はF0信頼場を提案した。これは音声波形の自己相関に基づいた「時間-ピッチ周波数(F0)」のマトリクス状の特徴量であり、各点はピッチらしさの指標(F0信頼度)となる。また、この特徴量の有効性について、以下の実験において実証した。
1. アクセント句境界検出…アクセント句のF0テンプレートと入力FO信頼場との累積F0信頼度最大を基準としたパターン整合により句境界を検出。
2. 藤崎モデルの指令推定…F0パターン生成モデルにおけるアクセント指令、およびフレーズ指令をF0信頼度最大を基準とした山登り法によって推定。
これらの実装により、従来のF0パターン整合を用いたアプリケーションは、提案するF0信頼場を用いても、ほぼ等価なアルゴリズムで制御可能であることを示した。同時に良好な検出・推定結果が得られ、従来のF0パターンに見られるようなF0抽出エラーなどの問題に対処しうる特徴量であることを示した。
さらに、音声認識への応用として、1より得られるアクセント句境界情報が文音声認識候補の確からしさの検証に有効であること、また、パターン整合を行わないアプリケーションでも、騒音環境下における音声区間検出のための一つの情報源としてF0信頼度が有効である、などの研究成果を得た。

  • 研究成果

    (1件)

すべて その他

すべて 文献書誌 (1件)

  • [文献書誌] Mitsuru Nakai: "The use of F0 reliability function for prosodic command analysis on F0 contour gen-eration model" The 5th International Conference on Spoken Language Processing. 1. 171-174 (1998)

URL: 

公開日: 1999-12-11   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi