研究概要 |
今年度の研究内容としては,(1)文法情報の構築,(2)連想に基づく単語検出法の構築,および(3)単語連想における統計情報の利用,の3つが挙げられる.今回の研究では,当初の研究計画にある「単語から単語,あるいは単語から場面への連想情報の構築」は行っていない. 文法情報は,本研究の基礎となる重要な情報源である.本研究では,自然な発話の認識を目指して,会話音声中の文節構造を表現する有限オートマトンの構築を行った.会話資料としては,日本音響学会の連続音声データベース中の会話音声の書き起こしテキストを用いている.このテキストから間投詞などのいわゆる不用語を除き,残った表現を受理する文節内文法を有限オートマンで表現した.この文法の構築は,筆者の以前構築した文章音声のための文節内文法を改変する形で行われた. 連想に基づく単語検出法の研究として,「拡張RHA法」を提案した.拡張RHA法は,高速な単語認識法に用いられる「RHA(Redundant Hash Addressing)法」を連続音声認識用に拡張したものである.RHA法を連続音声認識に応用する際には,(1)単語向けの手法を連続音声用に変更することと,(2)元のRHA法の精度を改善することの2点が重要であった.(1)として,RHA法に「活性点(activation point)」の概念を導入し,RHAを単語検出に応用した.また(2)として,あらかじめ音素認識誤りを見込んだ「拡張fragment」を導入し,検出の高精度化をはかった.単語検出実験により,従来この用途に用いられてきた「連続DP法」と比較し,検出性能は遜色なく,検出速度は数倍高速であることが確かめられた. 拡張RHA法による単語検出に統計的要素を導入する一手段として,拡張fragmentによる単語検出法を提案した.拡張RHA法において,単語を連想するための単位は,あらかじめ固定された長さの音素組であったが,拡張fragmentを用いる方法では,その単位を統計的に決定する.この手法では,検出対象となる単語集合が与えられたとき,ひとつの連想単位から連想される単語が一定数以下になるように統計的に連想単位を決定する.具体的には,不定長の音素組を使って単語を連想するようになる.これによって無駄な連想が抑えられ,単語の誤検出を少なく抑えることができるようになった.
|