• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

モデルと事例に基づく韻律特徴の抽出と音韻認識との有機的結合

研究課題

研究課題/領域番号 08680391
研究種目

基盤研究(C)

配分区分補助金
応募区分一般
研究分野 知能情報学
研究機関北陸先端科学技術大学院大学

研究代表者

下平 博  北陸先端科学技術大学院大学, 情報科学研究科, 助教授 (30206239)

研究分担者 中井 満  北陸先端科学技術大学院大学, 情報科学研究科, 助手 (60283149)
研究期間 (年度) 1996 – 1998
研究課題ステータス 完了 (1998年度)
配分額 *注記
2,600千円 (直接経費: 2,600千円)
1998年度: 400千円 (直接経費: 400千円)
1997年度: 900千円 (直接経費: 900千円)
1996年度: 1,300千円 (直接経費: 1,300千円)
キーワード韻律情報 / 句境界推定 / ピッチパターン / 音声認識 / 藤崎モデル
研究概要

本研究は、従来の音韻認識主導型の音声認識手法に代えて、発話音声中に含まれる超文節的特徴である韻律特徴を音韻特徴と同格に扱う新たな音声認識手法の開発を目指した。研究の第1目的として、ピッチパターンの数理モデルを利用することの利点と、大量の音声データからデータ駆動的に特徴を抽出することの利点を共有する高精度な韻律句境界の検出法を開発し、実音声における有効性を示すことを挙げた。また、得られた句境界仮説、句境界の型、およびポーズ情報を基に言語処理における構文仮説の検証による計算量の削減および文認識率の改善を行う手法の開発と評価を研究の第2目的とした。3年にわたる研究によって以下のような成果が得られた。
1. 基本周波数パターンの高精度抽出:韻律生成モデルとして2次の臨界制動モデル採用し、この逆フィルタを用いたピッチパターンの平滑化法を開発した。また、従来の決定的な基本周波数の決定手法に対して、各周波数に対する基本周波数の存在の確からしさを連続量で表わす"Fo信頼場法"を新たに開発した。
2. 韻律情報を用いた音声認識:
(1) 韻律生成モデルによって単語のアクセントピッチパターンを推定し、この結果を用いることによって雑音環境下における単語音声の認識精度が向上することを示した。
(2) 連続発声した文章中のアクセント句間の係り受け関係の有無を基本周波数パタンを特徴量とした最適線形識別関数によって推定する方式を開発した。
(3) 音韻認識結果によって得られる候補文節の境界と韻律情報によって得られるアクセント句境界の相関が高い点に着目し、両者の類似性を利用した音声認識手法、およびその漸次的な処理手法の開発を行った。

報告書

(4件)
  • 1998 実績報告書   研究成果報告書概要
  • 1997 実績報告書
  • 1996 実績報告書
  • 研究成果

    (30件)

すべて その他

すべて 文献書誌 (30件)

  • [文献書誌] 漢野 救泰: "低域スペクトルの予測残差を利用した非定常高騒音環境での有声音区間の検出" 電子情報通信学会 論文誌 D-II. J80-DII,1. 26-35 (1997)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1998 研究成果報告書概要
  • [文献書誌] 中井 満: "F_0 生成モデルを用いたテンプレートに基づく連続音声の句境界検出" 電子情報通信学会 論文誌 D-II. J80-DII,10. 2605-2614 (1997)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1998 研究成果報告書概要
  • [文献書誌] Mitsuru Nakai: "Accent Phrase Segmentation by F_0 Clustering Using Superpositional Modelling" Computing Prosody, Springer. 343-359 (1997)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1998 研究成果報告書概要
  • [文献書誌] Mitsuru Nakai: "On Representation of Fundamental Frequency of Speech for Prosody Analysis Using Reliability Function" Proc.EuroSpeech'97. 243-246 (1997)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1998 研究成果報告書概要
  • [文献書誌] Hiroshi Shimnodaira: "Restoration of Pitch Pattern of Speech Based on a Pitch Generation" Proc.EuroSpeech'97. 521-524 (1997)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1998 研究成果報告書概要
  • [文献書誌] Hiroshi Shimnodaira: "Modified Minimum Classification Error Learning and Its Application to Neural Net-works" Advances in Pattern Recognition. 785-794 (1998)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1998 研究成果報告書概要
  • [文献書誌] Jun Rokui: "Improving the Generalization Performance of the Minimum Classification Error Learning and Its Application to Neural Networks" The Fifth International Conference on Neural Information Process-ing (ICONIP'98). 63-67 (1998)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1998 研究成果報告書概要
  • [文献書誌] Mitsuru Nakai: "The Use of F_0 Reliability Function for Prosodic Command Analysis on F_0 Contour Generation Model" proc.of the 5th International Conference on Spoken Language Pro-cessing (ICSLP98). 998 (1998)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1998 研究成果報告書概要
  • [文献書誌] Hiroshi Shimodaira: "Improving the Generalization Performance of the MCE/GPD Learning" proc.of the 5th International Conference on Spoken Language Pro-cessing (ICSLP98). 795 (1998)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1998 研究成果報告書概要
  • [文献書誌] S.Kanno and H.Shimodaira: "Voiced Sound Detection under Non-stationary and Heavy Noisy Environment Using the Prediction of Low-Frequency Spectrum" IEICE Trans.D-II,Vol.J80-DII,No.1. 26-35 (1997)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1998 研究成果報告書概要
  • [文献書誌] M.Nakai, H.Singer, Y.Sakisaga and H.Shimodaira: "Accent Phrase Segmentation on F_0 Templates Using a Superpositional Prosodic Model" IEICE Trans.D-II,Vol.J80-DII,No.10. 2605-2614 (1997)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1998 研究成果報告書概要
  • [文献書誌] Mitsuru Nakai, Harald Singer, Yoshinori Sagisaka, Hiroshi Shimodaira: "Accent Phrase Segmentation by F_0 Clustering Using Superpositional Modelling" Computing Prosody (Y,Sagisaka, N.Compbell, N.Higuchi Ed.) Springer. 343-359 (1997)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1998 研究成果報告書概要
  • [文献書誌] Mitsuru Nakai and Hiroshi Simodaira: "On Representation of Funadamental Frequency of Speech for Prosody Analysis Using Reliability Function" Proc, EuroSpeech'97. 243-246 (1997)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1998 研究成果報告書概要
  • [文献書誌] Hiroshi Shimodaira, Mitsuru Nakai and Akihiro Kumata: "Restoration of Pitch Pattern of Speech Based on a Pitch Generation Model" Proc, EuroSpeech'97. 521-524 (1997)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1998 研究成果報告書概要
  • [文献書誌] Hiroshi Shimodaira, Jun Rokui and Mitsuru Nakai: "Modified Minimum Classification Error Learning and Its Application to Neural Networks" Advances in Pattern Recognition (Joint IAPR International work-shops SPPR'98 AND SPR'98). 785-794 (1998)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1998 研究成果報告書概要
  • [文献書誌] Jun Rokui and Hiroshi Shimodaira: "Improving the Generalization Performance of the Minimum Classification Error Learning and Its Application to Neural Networks" The Fifth International Conference on Neural Information Processing (ICONIP'98). 63-67 (1998)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1998 研究成果報告書概要
  • [文献書誌] Mitsuru Nakai and Hiroshi Shimodaia: "The Use of F_0 Reliability Function for Prosodic Command Analysis on F_0 Contour Generation Model" The 5th International Conference on Spoken Language Processing (ICSLP98). #998 (1998)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1998 研究成果報告書概要
  • [文献書誌] Hiroshi Shimodaiya and Jun Rokui: "Improving the Generaliazation Performance of the MCE/GPD Learning" The 5th International Conference on Spoken Language Processing (ICSLP98). #795 (1998)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1998 研究成果報告書概要
  • [文献書誌] Mitsuru Nakai: "The Use of F_0 Reliability Function for Prosodic Command Analysis on F_0 Contour Generation Model" Proc.of the 5th International Conference on Spoken Language Pro-cessing(ICSLP98). 998 (1998)

    • 関連する報告書
      1998 実績報告書
  • [文献書誌] Hiroshi Shimodaira: "Improving the Generalization Performance of the MCE/GPD Learning" Proc.of the 5th International Conference on Spoken Language Pro-cessing(ICSLP98). 795 (1998)

    • 関連する報告書
      1998 実績報告書
  • [文献書誌] Mitsuru Nakai: "On Representation of Fundamental Frequency of Speech for Prosody Analysis Using Reliability Function" Proc.Euro Speech ‘97. 243-246 (1997)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] Hiroshi Shimodaira: "Restoration of Pitch Pattern of Speech Based on a Pitch Generation Model" Proc.Euro Speech ‘97. 521-547 (1997)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] 中井満: "Fo生成モデルを用いたテンプレートに基づく連続音声の句境界検出" 電子情報通信学会論文誌DーII. J80-D-IINo.10. 2605-2614 (1997)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] 中井満: "Fo信頼場を用いたFo制御機構の指令推定" 日本音響学会平成10年度春季研究発表会. (1998)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] 川崎真護: "Fo生成モデルに基づくピッチパターン整合を用いた雑音重畳単語音声の認識" 日本音響学会平成10年度春季研究発表会. (1998)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] Paul Taylor: "Using Prosodic Information to Improve Recognition Accuracy for Spoken Dialogue" Proc.of International Conference on Spoken Language Processing 96. 1. 216-219 (1996)

    • 関連する報告書
      1996 実績報告書
  • [文献書誌] 隈田章寛: "Fφ生成過程モデルの指令探索によるピッチパターンの再構成法" 日本音響学会春季研究発表会講演論文集. (1997)

    • 関連する報告書
      1996 実績報告書
  • [文献書誌] 中井満: "Fo決定を要しないFoパターン整合を用いたアクセント句境界の自動推定" 日本音響学会春季研究発表会講演論文集. (1997)

    • 関連する報告書
      1996 実績報告書
  • [文献書誌] 高倉健次: "Foテンプレートbigramを用いた韻律句の係り受け構造推定に関する検討" 日本音響学会春季研究発表会講演論文集. (1997)

    • 関連する報告書
      1996 実績報告書
  • [文献書誌] Yoshinori Sagisaka: "Computing Prosody" Springer, 401 (1997)

    • 関連する報告書
      1996 実績報告書

URL: 

公開日: 1996-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi