Project/Area Number |
05241213
|
Research Category |
Grant-in-Aid for Scientific Research on Priority Areas
|
Allocation Type | Single-year Grants |
Research Institution | Ryukoku University |
Principal Investigator |
有木 康雄 龍谷大学, 理工学部, 教授 (10135519)
|
Project Period (FY) |
1993
|
Project Status |
Completed (Fiscal Year 1993)
|
Budget Amount *help |
¥2,400,000 (Direct Cost: ¥2,400,000)
Fiscal Year 1993: ¥2,400,000 (Direct Cost: ¥2,400,000)
|
Keywords | スポッティング / 対話音声 / 音素 / 単語 / HMM / 既知語 / 未知語 |
Research Abstract |
本研究では、音素・単語の二つの階層が同時に処理を進める音声対話理解の枠組みを研究した。まず音素の抽出では、日本語23音素を連続音声データベースから隠れマルコフモデル(HMM)を用いて学習し、この音素HMMを入力対話音声に適用して、音素スポッティングを行なう方式を研究した。単語の抽出では、対話がいくつかの場面から構成されているとし、その場面毎に出現頻度の高い単語をキーワードとして用意しておき、このキーワードに対するHMMを辞書を用いて構成し、入力対話音声に適用して単語スポッティングを行なう方式を研究した。入力対話文に含まれる全ての単語を予め用意しておくことはできないので、音素と単語を同時にスポッティングすることのできる構文を作成し、入力音声に対して同時にスポッティングすることにより、既知語と未知語を判定しながら既知語のみを抽出することのできる単語スポッティングアルゴリズムを研究した。この結果、音素情報を使わない単語スポッティングでは、単語検出率86.7%、わきだし54.5倍(実際に抽出した正解単語に対するわきだしの倍率)を得た。更に、音素情報を使って既知語と未知語を判定することにより、検出率68.9%、わきだし14.7倍を得た。これにより、未知語に対処することのできる対話音声の解析が可能になると考えられる。この研究を通して、音素HMMの精度が単語スポッティングの精度に大きく影響を及ぼすことが明かとなった。今後音素HMMの精度向上、音素情報の利用方法が研究の中心課題となると考えられる。
|