1995 年度実績報告書

A*探索による自由発話音声の認識アルゴリズム高度化の研究

研究課題

研究課題/領域番号	07680379
研究種目	一般研究(C)
研究機関	山形大学
研究代表者	好田正紀山形大学, 工学部, 教授 (00205337)
研究分担者	加藤正治山形大学, 工学部, 助手 (10250953)
キーワード	音声認識 / サーチ手法 / 音響モデル / HM-Net / 音素決定木 / 単語予備選択 / 言語モデル / N-gram
研究概要	自由発話音声の認識処理を、音声モデル・語彙・言語モデル等の制約を統合したグラフサーチにおける時間非同期のA*探索の問題に定式化し、認識性能を下げないで計算量を大幅に低減することを目指す.今年度は、音響モデル、単語マッチング、言語モデルの要素技術の高度化に重点をおいて研究を進めた. 1.音響モデルの精密化コンテキスト依存モデルとしてHM-Net(隠れマルコフ網)を取り上げ、逐次状態分割法のアルゴリズム中に、音素決定木に基づくコンテキスト分割法を導入した.この手法により、高精度かつあらゆる未知コンテキストも表現可能なHM-Netが生成できるようになり、認識性能の向上を認識した. 2.単語マッチングの高速化簡略な音響モデルと最適音素系列を利用する単語予備選択法を検討した.15000語の単語認識実験で、語彙の1%を候補として予備選択したとき、その中に正解単語が99%以上の確率で含まれて、単語マッチングの計算量は全数探索の4.1%に低減できることを確認した. 3.言語モデルの構築 EDRコーパス(20万文、500万語)を用いてN-gram言語モデル構築し、学習テキストの量とN-gramの性能の間にどのような関係があるかを調べて、高精度なN-gramを構築するために必要な学習テキスト量や語彙数を明らかにした.また、言語モデルのタスク適応化についても見通しを得た.

研究成果
(6件)

すべてその他

すべて文献書誌 (6件)

[文献書誌] 加藤正治: "HMMによるワードスポッティングにおけるViterbi best-firsサーチの検討" 情報処理学会東北支部研究会資料. 94-4-4. 1-6 (1995)
[文献書誌] 大関雅和: "確率文脈自由文法を用いたHMM-LR文節音声認識におけるフレーム同期ビームサーチの検討" 情報処理学会東北支部研究会資料. 94-4-5. 1-8 (1995)
[文献書誌] 伊藤彰則: "文字列パターンのN-gramによる文節モデルの検討" 電子情報通信学会技術研究報告. SP95-96. 19-24 (1995)
[文献書誌] 堀貴明: "音素決定木に基づく逐次状態分割によるHM-Netの検討" 日本音響学会研究発表会講演論文集. 1. 145-146 (1996)
[文献書誌] 加藤正治: "最適音素系列に基づく単語予備選択法の検討" 日本音響学会研究発表会講演論文集. 1. 79-80 (1996)
[文献書誌] 代島直人: "大語彙言語データベースからのN-gram構築とタスク適応の検討" 情報処理学会東北支部研究会資料. 95-5-17. 1-7 (1996)

1995 年度 実績報告書

A*探索による自由発話音声の認識アルゴリズム高度化の研究

研究代表者

好田 正紀 山形大学, 工学部, 教授 (00205337)

研究成果

[文献書誌] 加藤正治: "HMMによるワードスポッティングにおけるViterbi best-firsサーチの検討" 情報処理学会東北支部研究会資料. 94-4-4. 1-6 (1995)

[文献書誌] 大関雅和: "確率文脈自由文法を用いたHMM-LR文節音声認識におけるフレーム同期ビームサーチの検討" 情報処理学会東北支部研究会資料. 94-4-5. 1-8 (1995)

[文献書誌] 伊藤彰則: "文字列パターンのN-gramによる文節モデルの検討" 電子情報通信学会技術研究報告. SP95-96. 19-24 (1995)

[文献書誌] 堀貴明: "音素決定木に基づく逐次状態分割によるHM-Netの検討" 日本音響学会研究発表会講演論文集. 1. 145-146 (1996)

[文献書誌] 加藤正治: "最適音素系列に基づく単語予備選択法の検討" 日本音響学会研究発表会講演論文集. 1. 79-80 (1996)

[文献書誌] 代島直人: "大語彙言語データベースからのN-gram構築とタスク適応の検討" 情報処理学会東北支部研究会資料. 95-5-17. 1-7 (1996)

1995 年度実績報告書

好田正紀山形大学, 工学部, 教授 (00205337)