• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

モーラ遷移確率モデルによる韻律の表現と音声認識への利用に関する研究

Research Project

Project/Area Number 11878058
Research Category

Grant-in-Aid for Exploratory Research

Allocation TypeSingle-year Grants
Research Field Intelligent informatics
Research InstitutionThe University of Tokyo

Principal Investigator

広瀬 啓吉  東京大学, 大学院・新領域創成科学研究科, 教授 (50111472)

Project Period (FY) 1999 – 2000
Project Status Completed (Fiscal Year 2000)
Budget Amount *help
¥2,000,000 (Direct Cost: ¥2,000,000)
Fiscal Year 2000: ¥1,100,000 (Direct Cost: ¥1,100,000)
Fiscal Year 1999: ¥900,000 (Direct Cost: ¥900,000)
Keywordsモーラ遷移確率モデル / 韻律的特徴 / 基本周波数パターン / アクセント句境界 / 連続音声認識 / 離散型HMM / 連続分布モデル / パターン生成 / アクセント句 / アクセント型識別
Research Abstract

基本周波数パターンを中心とする韻律的特徴をモーラ単位で表現し、その遷移確率モデルにより韻律に関する事項を表現して検出、識別を行い、その結果を音声認識に利用することを目的とし、以下の様に所期の目標を達成した。
1.離散型HMMであるモーラ遷移確率モデルを連続分布モデルとすることの検討を行った。基本周波数パターンをスプライン補間した後、2次曲線で近似し、その係数をパラメータとすることで数%の境界検出率の向上を得た。
2.休止が後続する場合、モーラ持続時間が閾値より大きい場合について個別にモデル化することにより、アクセント句境界検出率の数%程度の向上を得た。
3.入力された連続音声を、まず音素HMMと文章単位のモーラbi-gramで認識し、得られたモーラ境界情報を利用して、モーラ遷移確率モデルによりアクセント句境界を検出する。次に、検出された境界情報を基に、アクセント句単位のモーラbi-gramを用いて再認識を行うことにより認識率の向上を達成する。この様な2段構成の認識アルゴリズムを構築して、ATR連続音声データベースを用いた認識実験で数%のモーラ認識率の向上を確認した。
4.上記の前段認識とアクセント句境界検出において、2ベストを取って認識を進め、最終的なスコアによって確定することを行い、1ポイント程度のモーラ認識率の向上を達成した。さらに、後段の2ndベストを時間情報を考慮して利用することで認識率がさらに向上する可能性を示した。
5.発話内容既知の場合について、開発した手法による韻律の自動ラベリングを行い、7割程度の精度でのラベリングが可能なことを示した。
6.モーラ遷移確率モデルを結合することにより、アクセント型、フレーズ境界位置を入力としてアクセント句の基本周波数パターンを生成することを行った。モーラ境界での不連続を平滑化するこれにより、音声合成に利用可能なことを示した。

Report

(2 results)
  • 2000 Annual Research Report
  • 1999 Annual Research Report
  • Research Products

    (10 results)

All Other

All Publications (10 results)

  • [Publications] 岩野公司: "語彙制約なし音声認識へのアクセント句境界検出の統合"電子情報通信学会論文誌. J83-D-II・10. 1977-1985 (2000)

    • Related Report
      2000 Annual Research Report
  • [Publications] 広瀬啓吉: "Detection of prosodic word boundaries by statistical modeling of mora transitions of fundamental frequency contours and its use for continuous speech recognition"Proc.IEEE International Conf.on Acoustics, Speech, & Signal Processing. 3. 1763-1766 (2000)

    • Related Report
      2000 Annual Research Report
  • [Publications] 桜井淳宏: "Modeling and generation of accentual phrase F0 contours based on discrete HMMs synchronized at mora-unit transitions"Proc.International Conf.on Spoken Language Processing. 3. 259-262 (2000)

    • Related Report
      2000 Annual Research Report
  • [Publications] 岩野公司: "モーラを単位とした基本周波数パターンの確率モデル化とそれによるアクセント句境界の検出"情報処理学会論文誌. 40・4. 1356-1364 (1999)

    • Related Report
      1999 Annual Research Report
  • [Publications] 広瀬啓吉: "Statistical modeling of prosodic features and its use for speech recognition"Proc. International Conf. on Speech Processing. 1. 43-52 (1999)

    • Related Report
      1999 Annual Research Report
  • [Publications] 岩野公司: "Prosodic word boundary detection using mora transition modeling of fundamental frequency contours --Speaker independent experiments--"Proc. European Conf. on Speech Communication and Technology. (1999)

    • Related Report
      1999 Annual Research Report
  • [Publications] 岩野公司: "Speaker-Independent detection of prosodic word boundary using mora transition modeling of fundamental frequency contours"Proc. Japan-China Symposium on Advanced Information Technology. 107-114 (1999)

    • Related Report
      1999 Annual Research Report
  • [Publications] 岩野公司: "タイプライタ型音声認識へのアクセント句境界情報の利用"日本音響学会講演論文集. I. 7-8 (1999)

    • Related Report
      1999 Annual Research Report
  • [Publications] 岩野公司: "語彙制約なし音声認識へのアクセント句境界情報の利用"電子情報通信学会技術研究報告(音声研究会). 73-78 (1999)

    • Related Report
      1999 Annual Research Report
  • [Publications] 広瀬啓吉: "Detection of prosodic word boundaries by statistical modeling of mora transitions of fundamental frequency contours and its use for continuous speech recognition"Proc. IEEE International Conf. on Acoustics, Speech, & Signal Processing. (発表予定). (2000)

    • Related Report
      1999 Annual Research Report

URL: 

Published: 1999-04-01   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi