研究課題/領域番号 |
14380168
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
知能情報学
|
研究機関 | 早稲田大学 |
研究代表者 |
匂坂 芳典 早稲田大学, 大学院・国際情報通信研究科, 教授 (70339737)
|
研究分担者 |
白井 克彦 早稲田大学, 理工学部, 教授 (10063702)
小林 哲則 早稲田大学, 理工学部, 教授 (30162001)
山本 博史 国際電気通信基礎技術研究所, 主任研究員 (00395013)
|
研究期間 (年度) |
2002 – 2005
|
研究課題ステータス |
完了 (2005年度)
|
配分額 *注記 |
14,000千円 (直接経費: 14,000千円)
2005年度: 3,300千円 (直接経費: 3,300千円)
2004年度: 3,400千円 (直接経費: 3,400千円)
2003年度: 3,400千円 (直接経費: 3,400千円)
2002年度: 3,900千円 (直接経費: 3,900千円)
|
キーワード | 統計的言語モデル / 未登録語処理 / 階層的言語モデル / 連続音声認識 / タスクフリー音声認識 / 未登録語 / 単語クラスモデル / 音韻連接特性 |
研究概要 |
辞書中にない単語を含む音声を受理する認識機構として、階層化言語モデルを提案し、種々の認識実験を行った。この統計的言語モデルでは、未登録語が有する単語連接特性や構成音素連接特性を単語クラスタとしてモデル化することにより、辞書中にない単語を含む音声の認識を可能とした。このモデルは文法等に関連した単語間の接続制約を与える上位の層と、クラスタ内の単語の発音をサブワード系列で表す下位の層からなる。異なった言語制約を表す上位層、下位層の統計的言語モデルはそれぞれ独立に構築でき、一つの言語モデルとして統合できることが種々の音声認識実験によって確認された。このモデルを語彙連接からなる未登録表現に拡張することにより、これまで階層化言語モデルで扱ってきた従来の未登録語対象である人名・地名と言った特定の単語クラスだけでなく、より一般的な名詞クラスの未登録語への対処、異なるタスク間での語彙レベルでの適応を可能にした。このような、異種の統計的言語特徴量を調和した一つの言語モデルとしての構築するモデル化の成功は、現在の音声認識が直面しているタスク依存性の課題を、独立した種々の統計的言語制約の複合体により、タスクフリーモデルとして実現できる大きな可能性を示唆している。 具体的なモデルとしては、映画タイトル、書名等の、既知の単語の連接によって生ずる長い未登録固有表現に対処するため、複数の単語列からなる未登録固有表現に対して独立した単語連接特性を表した下位層モデルを従来の上位層のモデルと併用した階層的モデルを用いた。提案したモデルは、未登録表現を既知として辞書に入れた上限モデルの性能に肉薄する性能を示すことが音声認識実験により判明した。この実験によりモデルの妥当性が確認でき、未登録表現のクラスが規定可能な場合に対する階層化言語モデル作成法を確立できた。また、新出種類商品名や新規概念のように、あらかじめ言語モデルで取り扱うべきカテゴリを定めておくことが出来ないものに対処するため、一般的な未登録表現出現傾向を基に複数のマルコフモデルで表現したモデルも提案した。各既知クラスに対するモデルとこのモデルの複合により、一般的な未登録表現に対しても対処可能な統計的言語モデルを確立することができ、モデル作成に使用できるデータの量と質に応じた統計的言語モデル作成法を確立できた。
|