研究課題
基盤研究(A)
本研究では、複数のマイクロホンと全方位カメラとからなる入力装置により会議内容を収録したマルチメディアデータ(映像・音声)から、いつ、だれが、どんな発言をしたかという情報を、音源定位・音源分離や音声認識技術などを用いて自動推定して、会議の構造を視覚化するシステムを開発した。このシステムにより、キーワードを含む場面を簡単に検索・再生し、会議の概要を短時間で把握できるようになる。
すべて 2008 2007 2006 その他
すべて 雑誌論文 (5件) (うち査読あり 4件) 学会発表 (2件) 備考 (3件) 産業財産権 (1件)
Proc. ICASSP 2008
ページ: 297-300
Workshop on Multimodal Corpora
ページ: 27-31
EURASIP Journal on Audio, Speech, and Music Processing Volume 2007, Article ID 27616
Proc. Interspeech 2006
ページ: 2586-2589
Proc. MRCS2006
ページ: 793-800