• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

韻律情報と音韻情報の有機的密結合による音声認識の研究

研究課題

研究課題/領域番号 05780283
研究種目

奨励研究(A)

配分区分補助金
研究分野 知能情報学
研究機関北陸先端科学技術大学院大学

研究代表者

下平 博  北陸先端科学技術大学院大学, 情報科学研究科, 助教授 (30206239)

研究期間 (年度) 1993
研究課題ステータス 完了 (1993年度)
配分額 *注記
900千円 (直接経費: 900千円)
1993年度: 900千円 (直接経費: 900千円)
キーワード句境界検出 / 韻律情報 / ピッチ / 連続音声認識
研究概要

本研究は、アクセントやイントネーションに代表される韻律情報を音韻情報と同格に扱い、両者を有機的に結合することによって、連続音声中の単語や文節の認識精度を向上させる手法の開発を研究目的とした開始された。韻律句を自動抽出する手法として、モデルを仮定せずに実際に大量の音声資料から得らる統計的な特徴を利用したボトモアップ的な手法を取り入れた点に本手法の特徴がある。
実験はATR製の連続音声データベ-(セットB、話者10名)を用いて行われた。研究の成果は以下の通りである。
1.ラグ窓法に周波数帯域分割法を施すことによって、ピッチ抽出精度が向上することが分かった。
2.学習データのアクセントパターンのクラスタリングを行い、得られたアクセントテンプレートと、未知入力としての連続音声のピッチパターンとをOne Stage DP法によって連続整合することによって、アクセント句の自動抽出を試みた。実験によって以下の結果を得た。
(1)視察境界の約83%を自動検出することができた。
(2)ピッチテンプレートのテキスト依存性は低く、テキストに依存しない一般的なピッチパターンの特徴がとらえられていることが分かった。これに対し、話者依存性はかなり大きいことが分かった。
得られた韻律句の情報と音韻認識を統合する作業は現在進行中である。予備的な実験によると、韻律境界に誤りが多く含まれているため単一の候補では情報量として不足であることが判明した。そこで、複数の候補を選出し、その結果を利用することを検討中である。

報告書

(1件)
  • 1993 実績報告書
  • 研究成果

    (3件)

すべて その他

すべて 文献書誌 (3件)

  • [文献書誌] H.Shimodaira: "Accent Phrase Segmentation Using Transition Probabilities between Pitch Pattern Templates" Proc.of International Conference Eurospeech'93. 3. 1767-1770 (1993)

    • 関連する報告書
      1993 実績報告書
  • [文献書誌] 中井 満: "ピッチパターンのクラスタリングに基づく不特定話者連続音声の句境界検出" 電子情報通信学会論文詩(A). J77-A,2. 206-214 (1994)

    • 関連する報告書
      1993 実績報告書
  • [文献書誌] Hiroshi SHIMODAIRA: "Prosodic Phrase Segmentation By Pitch Pattern Clustering" Proc.of International Conference ICASSP-94. (発表予定). (1994)

    • 関連する報告書
      1993 実績報告書

URL: 

公開日: 1993-04-01   更新日: 2018-06-07  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi