モーラ遷移確率モデルによる韻律の表現と音声認識への利用に関する研究

研究課題

研究課題/領域番号	11878058
研究種目	萌芽的研究
配分区分	補助金
研究分野	知能情報学
研究機関	東京大学
研究代表者	広瀬啓吉東京大学, 大学院・新領域創成科学研究科, 教授 (50111472)
研究期間 (年度)	1999 – 2000
研究課題ステータス	完了 (2000年度)
配分額 *注記	2,000千円 (直接経費: 2,000千円) 2000年度: 1,100千円 (直接経費: 1,100千円) 1999年度: 900千円 (直接経費: 900千円)
キーワード	モーラ遷移確率モデル / 韻律的特徴 / 基本周波数パターン / アクセント句境界 / 連続音声認識 / 離散型HMM / 連続分布モデル / パターン生成 / アクセント句 / アクセント型識別
研究概要	基本周波数パターンを中心とする韻律的特徴をモーラ単位で表現し、その遷移確率モデルにより韻律に関する事項を表現して検出、識別を行い、その結果を音声認識に利用することを目的とし、以下の様に所期の目標を達成した。 1.離散型HMMであるモーラ遷移確率モデルを連続分布モデルとすることの検討を行った。基本周波数パターンをスプライン補間した後、2次曲線で近似し、その係数をパラメータとすることで数%の境界検出率の向上を得た。 2.休止が後続する場合、モーラ持続時間が閾値より大きい場合について個別にモデル化することにより、アクセント句境界検出率の数%程度の向上を得た。 3.入力された連続音声を、まず音素HMMと文章単位のモーラbi-gramで認識し、得られたモーラ境界情報を利用して、モーラ遷移確率モデルによりアクセント句境界を検出する。次に、検出された境界情報を基に、アクセント句単位のモーラbi-gramを用いて再認識を行うことにより認識率の向上を達成する。この様な2段構成の認識アルゴリズムを構築して、ATR連続音声データベースを用いた認識実験で数%のモーラ認識率の向上を確認した。 4.上記の前段認識とアクセント句境界検出において、2ベストを取って認識を進め、最終的なスコアによって確定することを行い、1ポイント程度のモーラ認識率の向上を達成した。さらに、後段の2ndベストを時間情報を考慮して利用することで認識率がさらに向上する可能性を示した。 5.発話内容既知の場合について、開発した手法による韻律の自動ラベリングを行い、7割程度の精度でのラベリングが可能なことを示した。 6.モーラ遷移確率モデルを結合することにより、アクセント型、フレーズ境界位置を入力としてアクセント句の基本周波数パターンを生成することを行った。モーラ境界での不連続を平滑化するこれにより、音声合成に利用可能なことを示した。

報告書

(2件)

2000 実績報告書
1999 実績報告書

研究成果
(10件)

すべてその他

すべて文献書誌 (10件)

[文献書誌] 岩野公司: "語彙制約なし音声認識へのアクセント句境界検出の統合"電子情報通信学会論文誌. J83-D-II・10. 1977-1985 (2000)
- 関連する報告書
  2000 実績報告書
[文献書誌] 広瀬啓吉: "Detection of prosodic word boundaries by statistical modeling of mora transitions of fundamental frequency contours and its use for continuous speech recognition"Proc.IEEE International Conf.on Acoustics, Speech, & Signal Processing. 3. 1763-1766 (2000)
- 関連する報告書
  2000 実績報告書
[文献書誌] 桜井淳宏: "Modeling and generation of accentual phrase F0 contours based on discrete HMMs synchronized at mora-unit transitions"Proc.International Conf.on Spoken Language Processing. 3. 259-262 (2000)
- 関連する報告書
  2000 実績報告書
[文献書誌] 岩野公司: "モーラを単位とした基本周波数パターンの確率モデル化とそれによるアクセント句境界の検出"情報処理学会論文誌. 40・4. 1356-1364 (1999)
- 関連する報告書
  1999 実績報告書
[文献書誌] 広瀬啓吉: "Statistical modeling of prosodic features and its use for speech recognition"Proc. International Conf. on Speech Processing. 1. 43-52 (1999)
- 関連する報告書
  1999 実績報告書
[文献書誌] 岩野公司: "Prosodic word boundary detection using mora transition modeling of fundamental frequency contours --Speaker independent experiments--"Proc. European Conf. on Speech Communication and Technology. (1999)
- 関連する報告書
  1999 実績報告書
[文献書誌] 岩野公司: "Speaker-Independent detection of prosodic word boundary using mora transition modeling of fundamental frequency contours"Proc. Japan-China Symposium on Advanced Information Technology. 107-114 (1999)
- 関連する報告書
  1999 実績報告書
[文献書誌] 岩野公司: "タイプライタ型音声認識へのアクセント句境界情報の利用"日本音響学会講演論文集. I. 7-8 (1999)
- 関連する報告書
  1999 実績報告書
[文献書誌] 岩野公司: "語彙制約なし音声認識へのアクセント句境界情報の利用"電子情報通信学会技術研究報告(音声研究会). 73-78 (1999)
- 関連する報告書
  1999 実績報告書
[文献書誌] 広瀬啓吉: "Detection of prosodic word boundaries by statistical modeling of mora transitions of fundamental frequency contours and its use for continuous speech recognition"Proc. IEEE International Conf. on Acoustics, Speech, & Signal Processing. (発表予定). (2000)
- 関連する報告書
  1999 実績報告書

モーラ遷移確率モデルによる韻律の表現と音声認識への利用に関する研究

研究代表者

広瀬 啓吉 東京大学, 大学院・新領域創成科学研究科, 教授 (50111472)

2,000千円 (直接経費: 2,000千円)

報告書

研究成果

[文献書誌] 岩野公司: "語彙制約なし音声認識へのアクセント句境界検出の統合"電子情報通信学会論文誌. J83-D-II・10. 1977-1985 (2000)

関連する報告書

[文献書誌] 広瀬啓吉: "Detection of prosodic word boundaries by statistical modeling of mora transitions of fundamental frequency contours and its use for continuous speech recognition"Proc.IEEE International Conf.on Acoustics, Speech, & Signal Processing. 3. 1763-1766 (2000)

関連する報告書

[文献書誌] 桜井淳宏: "Modeling and generation of accentual phrase F0 contours based on discrete HMMs synchronized at mora-unit transitions"Proc.International Conf.on Spoken Language Processing. 3. 259-262 (2000)

関連する報告書

[文献書誌] 岩野公司: "モーラを単位とした基本周波数パターンの確率モデル化とそれによるアクセント句境界の検出"情報処理学会論文誌. 40・4. 1356-1364 (1999)

関連する報告書

[文献書誌] 広瀬啓吉: "Statistical modeling of prosodic features and its use for speech recognition"Proc. International Conf. on Speech Processing. 1. 43-52 (1999)

関連する報告書

[文献書誌] 岩野公司: "Prosodic word boundary detection using mora transition modeling of fundamental frequency contours --Speaker independent experiments--"Proc. European Conf. on Speech Communication and Technology. (1999)

関連する報告書

[文献書誌] 岩野公司: "Speaker-Independent detection of prosodic word boundary using mora transition modeling of fundamental frequency contours"Proc. Japan-China Symposium on Advanced Information Technology. 107-114 (1999)

関連する報告書

[文献書誌] 岩野公司: "タイプライタ型音声認識へのアクセント句境界情報の利用"日本音響学会講演論文集. I. 7-8 (1999)

関連する報告書

[文献書誌] 岩野公司: "語彙制約なし音声認識へのアクセント句境界情報の利用"電子情報通信学会技術研究報告(音声研究会). 73-78 (1999)

関連する報告書

[文献書誌] 広瀬啓吉: "Detection of prosodic word boundaries by statistical modeling of mora transitions of fundamental frequency contours and its use for continuous speech recognition"Proc. IEEE International Conf. on Acoustics, Speech, & Signal Processing. (発表予定). (2000)

関連する報告書

広瀬啓吉東京大学, 大学院・新領域創成科学研究科, 教授 (50111472)