研究課題/領域番号 |
18200007
|
研究機関 | 独立行政法人産業技術総合研究所 |
研究代表者 |
浅野 太 独立行政法人産業技術総合研究所, 情報技術研究部門, 研究グループ長 (00231895)
|
研究分担者 |
麻生 英樹 独立行政時法人産業技術総合研究所, 情報技術研究部門, 主任研究員 (10344194)
河本 満 独立行政時法人産業技術総合研究所, 情報技術研究部門, 研究員 (10300865)
緒方 淳 独立行政時法人産業技術総合研究所, 情報技術研究部門, 研究員 (10392599)
|
キーワード | マルチメディア / 会議録 / 構造化 / マイクロホンアレイ / 発話分離 / 音源定位 / カメラアレイ |
研究概要 |
会議中には、参加者が移動したり、新たな参加者が加わったりするなどの、動的変化がある場合がある。このような場合、従来のマイクロホンアレイを用いた収音システムでは、ターゲットを特定できず、効果的な音源分離も望めない。そこで、マイクロホンアレイを用いて、会議中に移動する人物の軌跡を推定するアルゴリズムを開発した。この手法は、パーティクルフィルタを用いて、複数人物の移動した軌跡を推定するものである。特に、発話のON/OFFにより、音源数が動的に変化した揚合でも、音源数を推定しながら、同時に軌跡を推定できる点が、従来の手法と大きく異なる点である。購入した3次元計測装置により、会議中の人物位置を計測し、これを真値として、評価実験を行った。この結果、従来法に比べ、二乗平均誤差が3分の1程度に減少し、実用レベルに近い性能に達したものと考えている。この結果は、国際会議ICSIP2007で発表した。 画像処理部においては、昨年度より引き続き、人物行動認識アルゴリズムの改良による精度向上に取り組んだ。人物位置認識アルゴリズムは、確率的な焼き鈍し処理を加えることで、誤検出の多い実環境においても、高い精度で人物位置の推定を可能にしたものである。その成果を国際会議MVA2007において発表した。本年度収録した顔方向データベースを用いて人物の視線方向を推定する認識器を作成した。また、視線方向などの表層的情報だけでなく、会話の文脈に関する情報を持つことで、誰が誰に対して喋っているかを推定するアルゴリズムを開発しその成果を国際会議ICMI2007において発表した。
|