未登録語を含むタスク外発話を受理する音声認識方式の研究

研究課題

研究課題/領域番号	14380168
研究種目	基盤研究(B)
配分区分	補助金
応募区分	一般
研究分野	知能情報学
研究機関	早稲田大学
研究代表者	匂坂芳典早稲田大学, 大学院・国際情報通信研究科, 教授 (70339737)
研究分担者	白井克彦早稲田大学, 理工学部, 教授 (10063702) 小林哲則早稲田大学, 理工学部, 教授 (30162001) 山本博史国際電気通信基礎技術研究所, 主任研究員 (00395013)
研究期間 (年度)	2002 – 2005
研究課題ステータス	完了 (2005年度)
配分額 *注記	14,000千円 (直接経費: 14,000千円) 2005年度: 3,300千円 (直接経費: 3,300千円) 2004年度: 3,400千円 (直接経費: 3,400千円) 2003年度: 3,400千円 (直接経費: 3,400千円) 2002年度: 3,900千円 (直接経費: 3,900千円)
キーワード	統計的言語モデル / 未登録語処理 / 階層的言語モデル / 連続音声認識 / タスクフリー音声認識 / 未登録語 / 単語クラスモデル / 音韻連接特性
研究概要	辞書中にない単語を含む音声を受理する認識機構として、階層化言語モデルを提案し、種々の認識実験を行った。この統計的言語モデルでは、未登録語が有する単語連接特性や構成音素連接特性を単語クラスタとしてモデル化することにより、辞書中にない単語を含む音声の認識を可能とした。このモデルは文法等に関連した単語間の接続制約を与える上位の層と、クラスタ内の単語の発音をサブワード系列で表す下位の層からなる。異なった言語制約を表す上位層、下位層の統計的言語モデルはそれぞれ独立に構築でき、一つの言語モデルとして統合できることが種々の音声認識実験によって確認された。このモデルを語彙連接からなる未登録表現に拡張することにより、これまで階層化言語モデルで扱ってきた従来の未登録語対象である人名・地名と言った特定の単語クラスだけでなく、より一般的な名詞クラスの未登録語への対処、異なるタスク間での語彙レベルでの適応を可能にした。このような、異種の統計的言語特徴量を調和した一つの言語モデルとしての構築するモデル化の成功は、現在の音声認識が直面しているタスク依存性の課題を、独立した種々の統計的言語制約の複合体により、タスクフリーモデルとして実現できる大きな可能性を示唆している。具体的なモデルとしては、映画タイトル、書名等の、既知の単語の連接によって生ずる長い未登録固有表現に対処するため、複数の単語列からなる未登録固有表現に対して独立した単語連接特性を表した下位層モデルを従来の上位層のモデルと併用した階層的モデルを用いた。提案したモデルは、未登録表現を既知として辞書に入れた上限モデルの性能に肉薄する性能を示すことが音声認識実験により判明した。この実験によりモデルの妥当性が確認でき、未登録表現のクラスが規定可能な場合に対する階層化言語モデル作成法を確立できた。また、新出種類商品名や新規概念のように、あらかじめ言語モデルで取り扱うべきカテゴリを定めておくことが出来ないものに対処するため、一般的な未登録表現出現傾向を基に複数のマルコフモデルで表現したモデルも提案した。各既知クラスに対するモデルとこのモデルの複合により、一般的な未登録表現に対しても対処可能な統計的言語モデルを確立することができ、モデル作成に使用できるデータの量と質に応じた統計的言語モデル作成法を確立できた。

報告書

(5件)

研究成果
(30件)

すべて 2005 2004 2003 2002 その他

すべて雑誌論文 (26件) 文献書誌 (4件)

[雑誌論文] Speech recognition of a named entity2005
- 著者名/発表者名
  Tasuhiko Tomita, Yoshiyuki Okimoto, Hirofumi Yamamoto, Yoshinori Sagisaka
- 雑誌名
  
  Proc. ICASSP2005 I
  
  ページ: 1057-1060
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2005 研究成果報告書概要
[雑誌論文] Speech Recognition of 00V Expressions and Words2005
- 著者名/発表者名
  Tetsuhiko Tomita, Yoshiyuki Okimoto, Hirofumi Yamamoto, Yoshinori Sagasaki
- 雑誌名
  
  Proc. SNLP2005 I
  
  ページ: 273-278
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2005 研究成果報告書概要
[雑誌論文] 未知固有表現を含む音声の認識2005
- 著者名/発表者名
  富田達彦, 沖本純幸, 山本博史, 匂坂芳典
- 雑誌名
  
  情報処理学会研究報告
  
  ページ: 117-122
- NAID
  110002952523
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2005 研究成果報告書概要
[雑誌論文] 未登録固有表現と未登録単語を含む音声の認識2005
- 著者名/発表者名
  富田達彦, 沖本純幸, 山本博史, 匂坂芳典
- 雑誌名
  
  日本音響学会2005年秋季研究発表会講演論文集
  
  ページ: 45-46
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2005 研究成果報告書概要
[雑誌論文] Speech recognition of a named entity2005
- 著者名/発表者名
  Tatsuhiko Tomita, Yoshiyuki Okimoto, Hirofumi Yamamoto, Yoshinori Sagisaka
- 雑誌名
  
  Proc.ICASSP2005 I
  
  ページ: 1057-1060
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2005 研究成果報告書概要
[雑誌論文] Speech Recognition of OOV Expressions and Words2005
- 著者名/発表者名
  Tatsuhiko Tomita, Yoshiyuki Okimoto, Hirofumi Yamamoto, Yoshinori Sagisaka
- 雑誌名
  
  Proc.SNLP2005 I
  
  ページ: 273-278
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2005 研究成果報告書概要
[雑誌論文] Speech recognition of unregistered expressions2005
- 著者名/発表者名
  Tatsuhiko Tomita, Yoshiyuki Okimoto, Hirofumi Yamamoto, Yoshinori Sagisaka
- 雑誌名
  
  IPSJ SIG Technical Reports
  
  ページ: 117-122
- NAID
  110002952523
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2005 研究成果報告書概要
[雑誌論文] Speech recognition of OOV expressions and OOV words2005
- 著者名/発表者名
  Tatsuhiko Tomita, Yoshiyuki Okimoto, Hirofumi Yamamoto, Yoshinori Sagisaka
- 雑誌名
  
  2005 Autumn Meeting Acoustical Society of Japan
  
  ページ: 45-46
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2005 研究成果報告書概要
[雑誌論文] Speech recognition of a named entity2005
- 著者名/発表者名
  T.Tomita, Y.Okimoto, H.Yamamoto, Y.Sagisaka
- 雑誌名
  
  Proc.ICASSP2005 Vol.1
  
  ページ: 1057-1060
- 関連する報告書
  2005 実績報告書
[雑誌論文] Speech Recognition of OOV Expressions and Words2005
- 著者名/発表者名
  T.Tomita, Y.Okimoto, H.Yamamoto, Y.Sagisaka
- 雑誌名
  
  Proc.SNLP2005 Vol.I
  
  ページ: 273-278
- 関連する報告書
  2005 実績報告書
[雑誌論文] 複数のマルコフモデルを用いた階層化言語モデルによる未登録語録認識2004
- 著者名/発表者名
  山本博史, 小窪浩明, 菊井玄一郎, 小川良彦, 匂坂芳典
- 雑誌名
  
  電子情報通信学会論文誌(D-II) 12
  
  ページ: 2104-2111
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2005 研究成果報告書概要
[雑誌論文] Mis-recognized utterance detection using hierarchical language model2004
- 著者名/発表者名
  Hirofumi Yamamoto, Genichiro Kikui, Yshinori Sagisaka
- 雑誌名
  
  Proc. ICSLP2004 (International Conference on Speech Processing)
  
  ページ: 1025-1028
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2005 研究成果報告書概要
[雑誌論文] 未知固有表現を含む音声の認識2004
- 著者名/発表者名
  富田達彦, 沖本純幸, 山本博史, 匂坂芳典
- 雑誌名
  
  日本音響学会2004年秋季研究発表会講演論文集 I
  
  ページ: 59-60
- NAID
  110002952523
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2005 研究成果報告書概要
[雑誌論文] Out-of-Vocabulary Word Recognition with a Hierarchical Language Model Using Multiple Markov Model2004
- 著者名/発表者名
  Hirofumi Yamamoto, Hiroaki Kokubo, Genichiro Kikui, Yoshihiko Ogawa, Yoshinori Sagisaka
- 雑誌名
  
  The Journal of The Institute of Electronics, Information and Communication Engineers Vol.87
  
  ページ: 2104-2111
- NAID
  110003203161
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2005 研究成果報告書概要
[雑誌論文] Mis-recognized utterance detection using hierarchical language model2004
- 著者名/発表者名
  Hirofumi Yamamoto, Genichiro Kikui, Yoshinori Sagisaka
- 雑誌名
  
  Proc.ICSLP2004
  
  ページ: 1025-1028
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2005 研究成果報告書概要
[雑誌論文] Speech recognition for unregistered expression of a class2004
- 著者名/発表者名
  Tatsuhiko Tomita, Yoshiyuki Okimoto, Hirofumi Yamamoto, Yoshinori Sagisaka
- 雑誌名
  
  2004 Autumn Meeting Acoustical Society of Japan I
  
  ページ: 59-60
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2005 研究成果報告書概要
[雑誌論文] 未知固有表現を含む音声の認識2004
- 著者名/発表者名
  冨田達彦, 匂坂芳典, 沖本純幸
- 雑誌名
  
  日本音響学会2004年秋季研究発表会講演論文集 Vol.I,2-1-2
  
  ページ: 59-60
- NAID
  110002952523
- 関連する報告書
  2004 実績報告書
[雑誌論文] Mis-recognized utterance detection using hierarchical language model2004
- 著者名/発表者名
  Hirofumi Yamamoto, Genichiro Kikui, Yoshinori Sagisaka
- 雑誌名
  
  Proc.ICSLP 2004(International Conference on Speech Processing) Vol.2
  
  ページ: 1025-1028
- 関連する報告書
  2004 実績報告書
[雑誌論文] Spoken language processing as computational human modeling2004
- 著者名/発表者名
  Yoshinori Sagisaka
- 雑誌名
  
  TECHNOLOGY AND PROCESSING SYSTEMS and Oriental COCOSDA-2004 Vol.2
  
  ページ: 161-166
- 関連する報告書
  2004 実績報告書
[雑誌論文] 複数のマルコフモデルを用いた階層化言語モデルによる未登録語認識2004
- 著者名/発表者名
  山本博史, 小窪浩明, 菊井玄一郎, 小川良彦, 匂坂芳典
- 雑誌名
  
  電子情報通信学会論文誌D-2 J87-D-2 No.12
  
  ページ: 2104-2111
- NAID
  110003203161
- 関連する報告書
  2004 実績報告書
[雑誌論文] Word Class Modeling for Speach Recognition with Out-of-Task Words Using a Hierarchical Language Model2003
- 著者名/発表者名
  Yoshihiko Ogawa, Hirofumi Yamamoto, Yoshinori Sagisaka
- 雑誌名
  
  Proc. Eurospeech2003
  
  ページ: 221-224
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2005 研究成果報告書概要
[雑誌論文] タスク外語彙のための構造化クラス言語モデル2003
- 著者名/発表者名
  小川良彦, 山本博史, 匂坂芳典, 小窪浩明, 菊井玄一郎
- 雑誌名
  
  日本音響学会2003年秋季研究発表会講演論文集 I
  
  ページ: 83-84
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2005 研究成果報告書概要
[雑誌論文] Word Class Modeling for Speech Recognition with Out-of-Task Words Using a Hierarchical Language Model2003
- 著者名/発表者名
  Yoshihiko Ogawa, Hirofumi Yamamoto, Yoshinori Sagisaka
- 雑誌名
  
  Proc.Eurospeech2003
  
  ページ: 221-224
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2005 研究成果報告書概要
[雑誌論文] Word Class Modeling for Speech Recognition with Out-of-Task Words Using a Hierarchical Language Model2003
- 著者名/発表者名
  Yoshihiko Ogawa, Hirofumi Yamamoto, Yoshinori Sagisaka, Hiroaki Kokubo, Genichiro Kikui
- 雑誌名
  
  2003 Autumn Meeting Acoustical Society of Japan I
  
  ページ: 83-84
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2005 研究成果報告書概要
[雑誌論文] タスク外語彙を含む音声の認識2002
- 著者名/発表者名
  小川良彦, 磯貝俊太郎, 匂坂芳典, 大西茂彦, 山本博史, 菊井玄一郎
- 雑誌名
  
  日本音響学会2002年秋季研究発表会講演論文集 I
  
  ページ: 143-144
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2005 研究成果報告書概要
[雑誌論文] Speech recognition for out of vocabularies2002
- 著者名/発表者名
  Yoshihiko Ogawa, Shuntaro Isogai, Yoshinori Sagisaka, Shigehiko Onishi, Hirofumi Yamamoto, Genichiro Kikui
- 雑誌名
  
  2002 Autumn Meeting Acoustical Society of Japan I
  
  ページ: 143-144
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2005 研究成果報告書概要
[文献書誌] S.Onishi, H.Yamamoto, G.Kikui, Y.Sagisaka: "A statistical word model using word-class specific constraints for handling out-of-vocabulary words in speech recognition"Proceedings of SNLP-Oriental COCOSDA 2002. 37-42 (2002)
- 関連する報告書
  2002 実績報告書
[文献書誌] 匂坂芳典: "認知計算モデルとしての音声技術"電子情報通信学会信学技報. SP2002-29. 31-36 (2002)
- 関連する報告書
  2002 実績報告書
[文献書誌] 山下博史, 大西茂彦, 小窪浩明, 匂坂芳典: "構造化言語モデルとその実装"電子情報通信学会信学技報. SP2003-32. 49-54 (2002)
- 関連する報告書
  2002 実績報告書
[文献書誌] 小川良彦, 磯貝俊太郎, 匂坂芳典, 大西茂彦, 山本博史, 菊井玄一郎: "タスク外語彙を含む音声の認識"日本音響学会2002年秋季研究発表会講演論文集. 3-9-7. 143-144 (2002)
- 関連する報告書
  2002 実績報告書

未登録語を含むタスク外発話を受理する音声認識方式の研究

研究代表者

匂坂 芳典 早稲田大学, 大学院・国際情報通信研究科, 教授 (70339737)

14,000千円 (直接経費: 14,000千円)

報告書

研究成果

[雑誌論文] Speech recognition of a named entity2005

著者名/発表者名

雑誌名

説明

関連する報告書

[雑誌論文] Speech Recognition of 00V Expressions and Words2005

著者名/発表者名

雑誌名

説明

関連する報告書

[雑誌論文] 未知固有表現を含む音声の認識2005

著者名/発表者名

雑誌名

NAID

説明

関連する報告書

[雑誌論文] 未登録固有表現と未登録単語を含む音声の認識2005

著者名/発表者名

雑誌名

説明

関連する報告書

[雑誌論文] Speech recognition of a named entity2005

著者名/発表者名

雑誌名

説明

関連する報告書

[雑誌論文] Speech Recognition of OOV Expressions and Words2005

著者名/発表者名

雑誌名

説明

関連する報告書

[雑誌論文] Speech recognition of unregistered expressions2005

著者名/発表者名

雑誌名

NAID

説明

関連する報告書

[雑誌論文] Speech recognition of OOV expressions and OOV words2005

著者名/発表者名

雑誌名

説明

関連する報告書

[雑誌論文] Speech recognition of a named entity2005

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Speech Recognition of OOV Expressions and Words2005

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] 複数のマルコフモデルを用いた階層化言語モデルによる未登録語録認識2004

著者名/発表者名

雑誌名

説明

関連する報告書

[雑誌論文] Mis-recognized utterance detection using hierarchical language model2004

著者名/発表者名

雑誌名

説明

関連する報告書

[雑誌論文] 未知固有表現を含む音声の認識2004

著者名/発表者名

雑誌名

NAID

説明

関連する報告書

[雑誌論文] Out-of-Vocabulary Word Recognition with a Hierarchical Language Model Using Multiple Markov Model2004

著者名/発表者名

雑誌名

NAID

説明

関連する報告書

[雑誌論文] Mis-recognized utterance detection using hierarchical language model2004

著者名/発表者名

匂坂芳典早稲田大学, 大学院・国際情報通信研究科, 教授 (70339737)

[文献書誌] 匂坂芳典: "認知計算モデルとしての音声技術"電子情報通信学会信学技報. SP2002-29. 31-36 (2002)

[文献書誌] 山下博史, 大西茂彦, 小窪浩明, 匂坂芳典: "構造化言語モデルとその実装"電子情報通信学会信学技報. SP2003-32. 49-54 (2002)

[文献書誌] 小川良彦, 磯貝俊太郎, 匂坂芳典, 大西茂彦, 山本博史, 菊井玄一郎: "タスク外語彙を含む音声の認識"日本音響学会2002年秋季研究発表会講演論文集. 3-9-7. 143-144 (2002)