2002 Fiscal Year Annual Research Report

未登録語を含むタスク外発話を受理する音声認識方式の研究

Research Project

Project/Area Number	14380168
Research Category	Grant-in-Aid for Scientific Research (B)
Research Institution	Waseda University
Principal Investigator	匂坂芳典早稲田大学, 国際情報通信研究科, 教授 (70339737)
Co-Investigator(Kenkyū-buntansha)	小林哲則早稲田大学, 理工学部, 教授 (30162001) 白井克彦早稲田大学, 理工学部, 教授 (10063702)
Keywords	連続音声認識 / 未登録語 / 統計的言語モデル / 階層的言語モデル / 単語クラスモデル / 音韻連接特性
Research Abstract	本年度は、まず、氏名を未登録語として扱った場合に成功した原因を調べるため、統計的音韻連接特性を利用した氏名クラス内モデルに対する単語連鎖生起確率をはじめとした統計量の調査を行った。この結果、Nグラム統計的言語モデルの数値、氏名の音韻連接数の頻度分布が、作成した氏名クラス内モデルによって精度良く近似されていることが確認できた。また、この実験過程で、氏名クラス内モデルに用いる可変長モーラ単位のエントリ数が性能に大きく関わることが判明し、可変長モーラ単位の有効性が再確認できた。さらに、単語頭・単語中・単語尾と分けたモデル表現が氏名の音韻列の特徴を捉えるのに妥当なモデルであることが判明した。次いで、クラス内モデルの未登録語記述可能性を調べるため、未登録語として最頻出する名詞全体を対象に品詞クラス内モデルを作成し、その性能を調べた。各名詞の統計量を全て捨て、名詞全体を未登録語として一つのモデルとしているため音韻認識率は全体として低下するが、名詞クラスと他の単語自体の認識率劣化は小さいことが確認できた。この結果から、文法等の制約を主に表す単語クラス間モデルと音韻間の制約を表すクラス内モデルといった、異なる言語制約の分離がモデルとして可能であることが判り、今後の未登録語の本格的なモデル化に明るい見通しを得た。また、名詞全体を日本語と外来語の二つに大別し、それぞれの単語クラス内モデルを作成して同様の認識実験を行った。この結果、音韻認識率の優位な向上を確認でき、複数の単語内クラスモデルの利用による性能向上への手懸りを得た。以上、当初予定した、未登録語を受理する連続音声認識方式の検討、単語クラスモデルの設計、タスク外発話に対する認識性能劣化の下限測定ができた。さらに、未登録語・タスク外データの分析を行うため、実言語データ収集も開始し、当初計画どおり順調に研究は推移した。

Research Products
(4 results)

All Other

All Publications (4 results)

[Publications] S.Onishi, H.Yamamoto, G.Kikui, Y.Sagisaka: "A statistical word model using word-class specific constraints for handling out-of-vocabulary words in speech recognition"Proceedings of SNLP-Oriental COCOSDA 2002. 37-42 (2002)
[Publications] 匂坂芳典: "認知計算モデルとしての音声技術"電子情報通信学会信学技報. SP2002-29. 31-36 (2002)
[Publications] 山下博史, 大西茂彦, 小窪浩明, 匂坂芳典: "構造化言語モデルとその実装"電子情報通信学会信学技報. SP2003-32. 49-54 (2002)
[Publications] 小川良彦, 磯貝俊太郎, 匂坂芳典, 大西茂彦, 山本博史, 菊井玄一郎: "タスク外語彙を含む音声の認識"日本音響学会2002年秋季研究発表会講演論文集. 3-9-7. 143-144 (2002)

2002 Fiscal Year Annual Research Report

未登録語を含むタスク外発話を受理する音声認識方式の研究

Principal Investigator

匂坂 芳典 早稲田大学, 国際情報通信研究科, 教授 (70339737)

Research Products

[Publications] S.Onishi, H.Yamamoto, G.Kikui, Y.Sagisaka: "A statistical word model using word-class specific constraints for handling out-of-vocabulary words in speech recognition"Proceedings of SNLP-Oriental COCOSDA 2002. 37-42 (2002)

[Publications] 匂坂 芳典: "認知計算モデルとしての音声技術"電子情報通信学会 信学技報. SP2002-29. 31-36 (2002)

[Publications] 山下 博史, 大西 茂彦, 小窪 浩明, 匂坂 芳典: "構造化言語モデルとその実装"電子情報通信学会 信学技報. SP2003-32. 49-54 (2002)

[Publications] 小川 良彦, 磯貝 俊太郎, 匂坂 芳典, 大西 茂彦, 山本 博史, 菊井 玄一郎: "タスク外語彙を含む音声の認識"日本音響学会2002年秋季研究発表会講演論文集. 3-9-7. 143-144 (2002)

匂坂芳典早稲田大学, 国際情報通信研究科, 教授 (70339737)

[Publications] 匂坂芳典: "認知計算モデルとしての音声技術"電子情報通信学会信学技報. SP2002-29. 31-36 (2002)

[Publications] 山下博史, 大西茂彦, 小窪浩明, 匂坂芳典: "構造化言語モデルとその実装"電子情報通信学会信学技報. SP2003-32. 49-54 (2002)

[Publications] 小川良彦, 磯貝俊太郎, 匂坂芳典, 大西茂彦, 山本博史, 菊井玄一郎: "タスク外語彙を含む音声の認識"日本音響学会2002年秋季研究発表会講演論文集. 3-9-7. 143-144 (2002)