キーフレーズ認識とその信頼度計算に基づく柔軟な音声対話理解
Project/Area Number |
09780328
|
Research Category |
Grant-in-Aid for Encouragement of Young Scientists (A)
|
Allocation Type | Single-year Grants |
Research Field |
Intelligent informatics
|
Research Institution | Kyoto University |
Principal Investigator |
河原 達也 京都大学, 情報学研究科, 助教授 (00234104)
|
Project Period (FY) |
1997 – 1998
|
Project Status |
Completed (Fiscal Year 1998)
|
Budget Amount *help |
¥2,000,000 (Direct Cost: ¥2,000,000)
Fiscal Year 1998: ¥700,000 (Direct Cost: ¥700,000)
Fiscal Year 1997: ¥1,300,000 (Direct Cost: ¥1,300,000)
|
Keywords | 音声認識 / 音声理解 / 単語スポッティング / 発話検証 / キーフレーズ |
Research Abstract |
キーフレーズの検出・検証の高精度化のために、ドメインに独立な語彙・言語モデルの構成方法について研究した。このフィラーモデルは、キーワードやキーフレーズ以外の区間を近似することにより、検出や検証のためのスコアの正規化を行うものである。そのためには、できるだけ小さいサイズで十分なカバレージを持つことが望ましい。また、話題やキーワード語彙の変化に対して頑健であることが望ましい。 そこで、ドメインに依存した語彙やコーパスを前提とする代りに、会話スタイル(講演調、情報検索対話など)に依存したモデルを考える。例えば講演調スタイルモデルは、講演の内容に関わらず講演というスタイルに固有の話し言葉の特徴をとらえる。これにより、同一のスタイルからなる大規模なコーパスを利用して学習できる。話題(ドメイン)独立性の尺度として、単語wと話題集合T{t_1,...,t_n}との相互情報量I(T;w)を定義し、この値が小さい単語集合を抽出する。このモデルにより,従来の音節連接モデルに基づく手法に比べて、はるかに高い発話検証性能を得ることができ、講演をしながら音声で操作できるスライドプロジェクタを設計・実装できた。
|
Report
(2 results)
Research Products
(13 results)