1993 Fiscal Year Annual Research Report
統計的言語情報を用いた音声認識の精度向上に関する研究
Project/Area Number |
05780292
|
Research Institution | The University of Tokushima |
Principal Investigator |
北 研二 徳島大学, 工学部, 助教授 (10243734)
|
Keywords | 音声認識 / 確率・統計的言語モデル / 確率文脈自由文法 / 生成規則のマルコフ連鎖 / コーパス / 定型表現 / 相互情報量 / 仕事量基準 |
Research Abstract |
音声認識では発声された内容を一義的に決めることはきわめて困難であり、音響的に似通った数多くの認識仮説が生成されてしまう。これらの多くの仮説をランク付けするためには、音響的な尤度だけではなく、言語的な尤度をも考慮する必要がある。本研究では、確率、統計的な言語情報を用いた言語的尤度について研究した。特に、確率文脈自由文法と生成規則適用のマルコフ連鎖を用いたモデルについて、モデルのパラメータ推定、音声認識との統合について研究を行なった。これらの確率・統計的言語モデルを、LRパ-ザとHMM音韻認識を用いた音声認識システムに組み込み、日本語の文認識において評価を行なった。確率・統計的言語情報を用いることにより、文認識率を約20%程度向上させることができ、我々の用いたモデルの有効性を調べることができた。 通常の確率・統計的な言語モデルでは、単語間の連鎖確率等の局所的な制約しか利用していない。定型的な表現や慣用的な表現を言語モデルに組み込むことより、精度の高いモデルが構築できる可能性がある。本研究では、このような言語モデルの研究の第1段階として、コーパスから定型的な表現を自動的に抽出する研究を行なった。定型表現を自動抽出する方法として、相互情報量を用いる方法と仕事量基準を用いる方法を比較し、相互情報量はタスクに依存した複合名詞句の抽出に適し、仕事量基準はタスクに依存しない述語的な表現の抽出に適していることを示した。
|
Research Products
(6 results)
-
[Publications] 北研二: "仕事量基準を用いたコーパスからの定型表現の自動抽出" 情報処理学会論文誌. 34. 1937-1943 (1993)
-
[Publications] 北研二: "逆文法のLR状態遷移表を用いた構文制御One-PassDP連続音声認識アルゴリズム" 平成5年度電気関係学会四国支部連合大会講演論文集. 302 (1993)
-
[Publications] 北研二: "一般化相互情報量を用いた日本語形態素解析の予備検討" 平成5年度電気関係学会四国支部連合大会講演論文集. 303 (1993)
-
[Publications] Kenji Kita: "Corpus-based Language Learning:Towards Practical Language Learning Systems" International Conference on Computers in Education. 355-357 (1993)
-
[Publications] Kenji Kita: "Comparative Study of Automatic Extraction of Collocations from Corpora:Mutual Information vs.Cost Criteria-From a Language Learning Viewpoint-" 電子情報通信学会技術研究報告(ET). (発表予定). (1994)
-
[Publications] Kenji Kita: "Automatically Extracting Collocations from Corpora for Language Learning" International Conference on Teaching and Language Corpora. (発表予定). (1994)