2008 Fiscal Year Final Research Report
A switch-free spoken language interface for real-world speech interface
Project/Area Number |
18700118
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Allocation Type | Single-year Grants |
Research Field |
Media informatics/Database
|
Research Institution | Nagoya Institute of Technology |
Principal Investigator |
LEE Akinobu Nagoya Institute of Technology, 大学院・工学研究科, 准教授 (80332766)
|
Project Period (FY) |
2006 – 2008
|
Keywords | 音声区間検出 / 音声インタフェース / 音声認識システム / 耐雑音 / 発話棄却 |
Research Abstract |
日常環境で音声入力の開始・終了を意識せずに誰でも自然に使うことができる音声インタフェースの実現を目指して、音響・言語情報を密に統合したロバストかつ実時間の音声区間検出の研究を行った。短時間フレームごとのGMM尤度を用いた音声区間検出、およびフレーム単位の部分的な照合スコアから認識処理の照合度(信頼度)を判定する手法を提案した。大学案内音声対話システムを実際に構築して公共の場に設置し,データ収集と評価を行った。本研究の成果の一部は、大語彙音声認識エンジンJulius の機能として一般に公開されている。
|