1996 Fiscal Year Annual Research Report
音声の韻律的特徴の定式化とその連続音声認識への利用
Project/Area Number |
06452397
|
Research Institution | University of Tokyo |
Principal Investigator |
広瀬 啓吉 東京大学, 大学院・工学系研究科, 教授 (50111472)
|
Co-Investigator(Kenkyū-buntansha) |
大野 澄雄 東京理科大学, 基礎工学部, 助手 (80256677)
|
Keywords | 基本周波数パターン / フレーズ成分 / アクセント型 / 文節境界 / 韻律的特徴 / 連続音声認識 / 韻律規則 / モ-ラ遷移統計モデル |
Research Abstract |
本研究は、連続音声の韻律的特徴を利用して単語の同定、文法的境界の検出等を行う手法を開発し、これらを連続音声の認識に利用する有効な方策を考案して連続音声認識の性能向上を図ることを目的とする。最終年度の本年度は、統計的手法を利用した韻律的特徴の定式化と認識への利用を中心に研究を進め、連続音声認識手法への組み込みを行って、以下の成果を達成した。 1.基本周波数パターンをモ-ラ単位でコード化し、離散HMMで表現する新しい手法(モ-ラ遷移統計モデル)を提案した。これを用いて文節境界、アクセント型の認識実験を行い、前者については、学習時と異なる話者、トピックの連続音声を対象として、80%を超える境界検出率を達成した。一方、アクセント型に関しては、不特定話者の4モ-ラ単語を対象とした実験を行い、74%を達成した。現在、コード化について改良を加えており、認識率の向上が見込まれる。 2.同一文字言語表現の対話音声と朗読音声の韻律的特徴の異同を分析、対話音声における基本周波数パターンを構成するフレーズ・アクセント成分の大きさが語の役割などの要因によってどの様に変化するかを数量的に示した。結果から、対話音声に対する韻律規則を構築した。 3.基本周波数パターンを時間波形とみなし、低域フィルタリングによりアクセント成分を抑圧してフレーズ成分の立ち上がりを精度良く抽出する手法を、昨年度提案したが、この手法によって得られるフレーズ成分、アクセント成分に関する時点と大きさの値を初期値として重畳モデルに基づくAbS分析を行うことにより、基本周波数パターンの特徴抽出を高精度で自動的に行う手法を開発した。さらに、この手法で得られるアクセント成分の大きさに関する情報と、上記1の韻律規則から、重要語・非重要語の検出を行う手法を作成した。 4.前年度までの成果と上記の成果を、連続音声認識システムに組み込み、効果を確認した。
|
-
[Publications] 広瀬啓吉: "Detection of syntactic boundaries by partial analysis-by-synthesis of fundamental frequency contours" Proc.IEEE International Conference on Acoustics,Speech,& Signal Processing. 2. 809-812 (1996)
-
[Publications] 広瀬啓吉: "音声対話システムの出力音声の韻律的特徴の合成" 人工知能学会全国大会論文集. 399-402 (1996)
-
[Publications] 広瀬啓吉: "Synthesizing dialogue speech of Japanese based on quantitative analysis of prosodic features" Proc.International Conference on Spoken Language Processing. 1. 378-381 (1996)
-
[Publications] 桜井淳宏: "Detection of phrase boundaries in Japanese by low-pass filtering of fundamental frequency contours" Proc.Inetrnational Conference on Spoken Language Processing. 2. 817-820 (1996)
-
[Publications] 張勁松: "Adaptive recognition method based on posterior use of distribution pattern of output probabilities" Proc.Inetrnational Conference on Spoken Language Processing. 2. 1129-1132 (1996)
-
[Publications] 川波弘道: "対話音声の韻律的特徴に影響を与える要因の定量的分析" 日本音響学会秋季研究発表会講演論文集. I. 201-202 (1996)
-
[Publications] 江輝: "A robust speech recognition method based on Bayes classification approach" 日本音響学会秋季研究発表会講演論文集. I. 149-150 (1996)
-
[Publications] 広瀬啓吉: "Use of prosodic features in speech recognition(Invited)" Proc.IEEE Invited Workshop on Pattern Recognition for Multimedia Techniques(IEEE Taegu Section). 99-108 (1996)
-
[Publications] 広瀬啓吉: "Posterior use of prosodic features to aid speech recognition(Invited )" Journal of the Acoustical Society of America. 100・4(Pt.2). 2849- (1996)
-
[Publications] 広瀬啓吉: "対話音声と朗読音声の韻律的特徴の比較" 電子情報通信学会論文誌. J79-DII・12. 2154-2162 (1996)
-
[Publications] 岩野公司: "HMMによる韻律パターン表現の一手法" 日本音響学会秋季研究発表会講演論文集. I(発表予定). (1997)
-
[Publications] 江輝: "Robust speech recognition based on Viterbi Bayesian predictive classification" Proc.IEEE International Conference on Acoustics,Speech,& Signal Processing. (発表予定). (1997)
-
[Publications] 広瀬啓吉: "Disambiguating recognition results by prosodic features(Computing Prosody)" Springer-Verlag, 16 (1997)