1993 Fiscal Year Annual Research Report
音素・単語・フレーズの同時スポッティングによる対話音声の解析
Project/Area Number |
05241213
|
Research Institution | Ryukoku University |
Principal Investigator |
有木 康雄 龍谷大学, 理工学部, 教授 (10135519)
|
Keywords | スポッティング / 対話音声 / 音素 / 単語 / HMM / 既知語 / 未知語 |
Research Abstract |
本研究では、音素・単語の二つの階層が同時に処理を進める音声対話理解の枠組みを研究した。まず音素の抽出では、日本語23音素を連続音声データベースから隠れマルコフモデル(HMM)を用いて学習し、この音素HMMを入力対話音声に適用して、音素スポッティングを行なう方式を研究した。単語の抽出では、対話がいくつかの場面から構成されているとし、その場面毎に出現頻度の高い単語をキーワードとして用意しておき、このキーワードに対するHMMを辞書を用いて構成し、入力対話音声に適用して単語スポッティングを行なう方式を研究した。入力対話文に含まれる全ての単語を予め用意しておくことはできないので、音素と単語を同時にスポッティングすることのできる構文を作成し、入力音声に対して同時にスポッティングすることにより、既知語と未知語を判定しながら既知語のみを抽出することのできる単語スポッティングアルゴリズムを研究した。この結果、音素情報を使わない単語スポッティングでは、単語検出率86.7%、わきだし54.5倍(実際に抽出した正解単語に対するわきだしの倍率)を得た。更に、音素情報を使って既知語と未知語を判定することにより、検出率68.9%、わきだし14.7倍を得た。これにより、未知語に対処することのできる対話音声の解析が可能になると考えられる。この研究を通して、音素HMMの精度が単語スポッティングの精度に大きく影響を及ぼすことが明かとなった。今後音素HMMの精度向上、音素情報の利用方法が研究の中心課題となると考えられる。
|
-
[Publications] Yasuo Ariki: "Mixture density HMMs with two-level transition" 日本音響学会論文誌. Vol.14. 279-280 (1993)
-
[Publications] 土井啓輔 有木康雄: "学習区間を限定した連結学習による音素認識" 電子情報通信学会、音声研究会. SP93-132. 33-38 (1994)
-
[Publications] 川村拓也 有木康雄: "連続音声における音素・単語の同時スポッティング" 日本音響学会春季研究発表会. 2P-13. (1994)