研究概要 |
1. 音声対話・音声認識システムに関する調査 国内で行われた研究会を中心に,音声対話システムとそこで利用される音声認識システムの現状について調査した.現状の音声認識システムには,発話権授受に関する情報を処理する特別な機構は備わっていない.この結果をふまえ,本研究ではそれに必要な機能を追加することを改めて目標と設定した. 2. 音声認識システムの設計・実装 2-1. 音声入力部の拡張 音声入力部には,従来から用いられていた特徴抽出の他に,発話権授受の推定に有用と考えられる韻律情報抽出モジュールを統合した.また.後述するグループ会話への応用を見据え,従来の2チャンネル処理から多チャンネル(最大5チャンネル)に対応した. 2-2. 認識部の拡張 認識部においては発話の断片化に対処するため,時間的に複数区間に区切られた音声を統合した上で認識処理する機構を実現した.また,発話権授受に関する推定を,韻律情報を用いて行う枠組みについて検討した.これらの機構は次年度に統合することを目標としている. 3. 応用システムの検討 実現した音声認識システムの応用として,グループ会話に参加するロボット上の音声対話システムを検討した.このロボットは一人の司会と複数の回答者がいるクイズゲームに回答者の一人として参加するもので,回答者として適切に振舞う為には人の音声を逐次認識しながら,自らの発話のタイミングを適切に推定しなければならない.そのために,本研究で実装した音声認識システムを用いることを検討した.実際の応用は次年度の目標のーつとして挙げられる.
|