研究課題
文字認識(OCR)の生の出力テキストに対して認識誤りの存在を考慮しながら検索を行う曖昧検索手法を、音声認識(SR)の出力テキストに対して応用する方法について検討および提案した。今年度は、様々な曖昧検索手法について比較検討し、国際会議などにおける現地調査を含む関連研究の幅広い調査を行った。1.音声曖昧検索手法の比較検討英文発話テキストを具体的に曖昧検索する方法について検討した。文字認識と音声認識の結果の大きな違いはその認識率であり、活字文字認識率が95から99%であるのに対し、音声認識率は50から80%程度である。この認識率の差は提案する曖昧検索モデルに大きな影響を与えるため、発話テキスト検索では調整が必要となる。具体的には、認識誤りを含まない元のテキストと認識結果とのアラインメント方法、認識誤りの抽出方法、認識誤りの分類方法、確率オートマトンのパラメータの推定方法などについて、発話テキストの曖昧検索に適用可能な方法を検討した。Soundexのように類似した音節を同一のものとして扱う手法は検索精度の点で不十分で、提案手法のように認識誤りの特性を考慮する必要がある。また曖昧に検索するためのコストは検索精度とトレードオフの関係にあるが、現実的なコストで十分な検索精度を実現する必要がある。2.調査音声曖昧検索の研究は発表事例が少ないため、国内外の論文誌等資料を収集するとともに、最新の研究事例について国際会議などに出席して直接調査した。特にメタ検索エンジンなどのWebアプリケーションに組み込んで利用できれば有効と考えており、このような利用方法について検討した。
すべて 2005 2004
すべて 雑誌論文 (2件)
電子情報通信学会論文誌 Vol.J88-D-I, No.3
ページ: 657-667
Working Notes of the Fourth NTCIR Meeting Supplement volume 1
ページ: 37-44