研究課題/領域番号 |
19300065
|
研究機関 | 独立行政法人産業技術総合研究所 |
研究代表者 |
後藤 真孝 独立行政法人産業技術総合研究所, 情報技術研究部門, 主任研究員 (20357007)
|
研究分担者 |
緒方 淳 独立行政法人産業技術総合研究所, 情報技術研究部門, 研究員 (10392599)
江渡 浩一郎 独立行政法人産業技術総合研究所, サービス工学研究センター, 研究員 (20311277)
|
キーワード | 音声言語情報処理 / 音声情報検索 / 画像、文章、音声等認識 / ディレクトリ・情報検索 / ユーザインターフェース |
研究概要 |
本研究は、エンドユーザに音声認識誤りを訂正する協力をしてもらうことで、音声情報検索性能、音声認識性能をどこまで高くできるかを探求することを目的としている。本年度は、課題(1)「Web上のポットキャスト等のテキスト全文検索技術」、課題(2)「ユーザが音声認識による自動書き起こしテキストを閲覧し、認識誤りを訂正することを促す方法」、課題(3)「ユーザが訂正を繰り返した正解情報の自動学習等に基づく音声認識性能の向上技術」に関する研究を計画通り進めた。具体的には、課題(1)に関して、Webクライアント、音声認識器、音声認識状態管理部、データベース管理部、検索サーバを改良して安定性と機能を高めた。また、新たにビデオポットキャストへの対応を目指して検討し、今後の動画対応の可能性を高めた。課題(2)に関しては、音声認識結果閲覧・訂正用Webインタフェースや検索機能のユーザビリティを改善した。特に、音響イベント検出において音楽の有無の自動判定を改良し、笑い声等の音響イベントの検出にも取り組んだ。課題(3)に関しては、訂正により正しい書き起こしテキストが得られるので、それを音響モデルや言語モデルの再学習に用いて性能を改善する手法を実現した。一部のポットキャストに対しては人手による書き起こしを用意して、性能評価を行った。さらにRSS中の情報や話題や番組形式の違いを音声認識において考慮して、認識性能の向上に取り組んだ。本研究の成果は、産総研が2008年6月12日(木)にプレス・リリースをおこない、その結果、テレビの二つの番組と新聞9紙で報道された。科研費NEWSレター2008年11月発行p.8でも取り上げられた。
|