2000 Fiscal Year Annual Research Report
新聞記事読み上げ文を対象とする日本語の大語彙連続音声認識システムの研究
Project/Area Number |
10680368
|
Research Institution | Yamagata University |
Principal Investigator |
好田 正紀 山形大学, 工学部, 教授 (00205337)
|
Co-Investigator(Kenkyū-buntansha) |
加藤 正治 山形大学, 工学部, 助手 (10250953)
伊藤 彰則 山形大学, 工学部, 助教授 (70232428)
|
Keywords | 大語彙連続音声認識 / 言語モデル / N-gram / クラスN-gram / タスク適応 / パープレキシティ / 単語誤り率 / エルゴディックHMM |
Research Abstract |
新聞記事読み上げ文を対象とする日本語の大語彙連続音声認識システムを構築し、今年度は次の研究成果を得た。(1)N-gram言語モデルのタスク適応:大量の一般的な言語資料(タスク独立テキスト)と、少量の特定タスクのサンプル(適応テキスト)から、特定タスク向きのN-gramを作成するタスク適応について検討した。タスク独立テキストと適応テキストを重み付き混合するというタスク適応法を提案し、対話音声認識のシミュレーション実験で、提案法の性能を詳細に解析した。(2)対数尤度差に基づく言語モデルの評価尺度:言語モデルが複雑になると、認識システムの単語誤り率と言語モデルのパープレキシティとの相関が悪いという結果が近年報告されている。パープレキシティが評価テキストの単語の出現確率のみを用いるのに対して、ここでは、評価テキストに出現する単語の言語尤度と、その単語が出現した文脈における最大言語尤度との差に基づく言語モデル評価尺度を提案し、パープレキシティと比べて、認識システムの単語誤り率との高い相関を示すことを確認した。(3)エルゴディックHMM言語モデル:N-gramをHMMに拡張した言語モデルを提案した。提案モデルは、N-gramを決定性有限オートマトンとみなし、各状態を複数の状態に分割することで、これを非決定性有限オートマトンに拡張したもので、一種のエルゴディックHMMになる。bigramおよびtrigramからエルゴディックHMMを生成する実験を行い、提案モデルが元のN-gramよりも低いパープレキシティを与えることを確認した。(4)単語・クラスN-gram作成Toolkit:単語n-gramとクラスn-gramが作成可能なツールキットを作成した。このツールキットは、CMU-Cambridge SLM Toolkitとコマンドレベルで互換性がある。また、n-gram出現回数の混合による言語モデルや、線形結合による言語モデルの組合せをサポートしている。
|
Research Products
(16 results)
-
[Publications] 堀智織: "音声認識のための確率文脈自由文法に基づく言語モデルの構築と評価"電子情報通信学会論文誌(D-II). J83-D-II,11. 2407-2417 (2000)
-
[Publications] 伊藤彰則: "N-gram出現回数の混合によるタスク適応の性能解析"電子情報通信学会論文誌(D-II). J83-D-II,11. 2418-2427 (2000)
-
[Publications] 伊藤彰則: "Language modeling by stochastic dependency grammar for Japanese speech recognition"Proceedings of ICSLP 2000. Vol.1,M1-24. 246-249 (2000)
-
[Publications] 加藤正治: "話者照合におけるMLLRベースの話者モデル作成の検討"電子情報通信学会技術研究報告. SP2000-19. 25-32 (2000)
-
[Publications] 伊藤彰則: "N-gramに基づくエルゴディックHMMによる言語モデル"電子情報通信学会技術研究報告. SP2000-25. 67-74 (2000)
-
[Publications] 斎院俊典: "単語グラフ生成の言語重み・挿入ペナルティ最適化の検討"電子情報通信学会技術研究報告. SP2000-26. 75-82 (2000)
-
[Publications] 加藤正治: "単語グラフ生成におけるパラメータ最適化の検討"電子情報通信学会技術研究報告. SP2000-93. 107-112 (2000)
-
[Publications] 伊藤彰則: "単語およびクラスN-gram作成のためのツールキット"電子情報通信学会技術研究報告. SP2000-106. 67-72 (2000)
-
[Publications] 斎院俊典: "自然発話文の大語彙連続音声認識"情報処理学会東北支部研究会. 2000-4-13. 1-8 (2001)
-
[Publications] 田嶋昇: "HM-Net音響モデルを用いる話者照合"情報処理学会東北支部研究会. 2000-4-14. 1-7 (2001)
-
[Publications] 竹内亜未: "確率文脈自由文法に基づく言語モデル"情報処理学会東北支部研究会. 2000-4-15. 1-8 (2001)
-
[Publications] 竹内亜未: "確率文脈自由文法に基づく言語モデル"電気関係学会東北支部連合大会. 2A-3. 18 (2000)
-
[Publications] 田嶋昇: "HM-Net音響モデルを用いる話者照合"電気関係学会東北支部連合大会. 2A-13. 28 (2000)
-
[Publications] 夏井武雄: "セグメント単位入力HMMに基づく音声認識"電気関係学会東北支部連合大会. 2A-14. 29 (2000)
-
[Publications] 加藤正治: "単語グラフ生成におけるパラメータ最適化の検討"日本音響学会講演論文集. 1-5-17. 33-34 (2000)
-
[Publications] 伊藤彰則: "単語およびクラスN-gram作成のための統計的言語モデルツールキット"日本音響学会講演論文集. 2-3-12. 77-78 (2001)