本研究で解決すべき課題は、異なる性質を持つ複数の音声入力検知機構や無効入力棄却判定機構を統合することで、実環境においてユーザの意図する入力音声のみを受理するアルゴリズムを構築することである。この成果をまとめることにより、最終的には、入力開始を意識しない「スイッチフリー」な音声言語インタフェースを実現する。最終的な目標としては、ユーザの入力音声のみを確実に取り出せる。自然で信頼感のあるスイッチフリーな実環境向け音声認識システムの構築を目指す。これらの研究計画にしたがい、平成19年度は、不要音・不要発話の棄却アルゴリズムについて、各手法の性能検討とその統合手法の検証ならびに評価を行った、大学の学生向け案内をタスクとした音声情報案内対話システムを構築し、運用を開始すると共に、日常環境における自然なユーザの対機械発話の収集を予備的に行った。具体的な内容は以下の通りである。 1.雑音環境向けのGMMに基づく実時間音声区間検出プログラムを音声認識ソフトウェア上に作成した。 2.マイクロフォンアレイにおけるタスク外発話の棄却アルゴリズムの検討と検証を行った。 3.学内案内用音声対話システムのプロトタイプ構築および試験運用を行った。 4.上記システムを稼働させ、雑音や無効入力を含む全ての入力を収集した。 5.収集データの整備:収集したデータについて、予備的な分析を行った。
|