Research Abstract |
本年度は,まず部屋内環境に設置したネットワークカメラ(既設)を用い,水場横や会議卓の上の映像を撮影し,ロバスト統計処理に基づく背景画像推定と更新手法を用いて,シーン変化イベントの検知を行った.人間の有無および物体の持込み,持去りの有無を検知する手法を研究した.単純な背景差分では影や照明条件の変動による誤検知が多発したが,身体構造の知識を用いた認識手法を実装し,人間のそばで起こった変化をイベントとしてとらえることで検知性能を向上できた. また物体同士が重なって置かれたり背後のものが持ち去られることによる複雑な画像上の変化を正しく解釈するべく,物体シーンのレイヤ構造化表現を考えた.シーン変化が検知された際それがある物体レイヤを持ち去ったときに予想されるシーン変化と整合するかを検証することで,持込みと持去りを適切に区別できた.これにより,背後に持ち込まれたあるいは背後から持ち去られた物体の解釈が隠れのために曖昧になることを適切に考慮し,手前のものがなくなって背後が観測できた時点で解釈を構築しなおすことができた. これらの物体持込・持去イベントの時系列をデータベースに蓄積し,簡単な音声・ジェスチャインターフェースによって,現場で持込・持去を問い合わせると結果をモニタやプロジェクタで提示,イベント検索シスアムプラットフォームを構築した.実験の結果,物体を適切に識別するには,物体を操作する人間の行動をさらに詳細に観察すること,また問い合わせを簡単に行うには,システム側のユーザとの対話戦略が重要であることが確認された. 物体の見えと手指による操作を詳細に観察することで物体認識を行う枠組みを研究した.簡単な背景とペンやカッター,コップなどを把持する手指の画像を大量に撮影し,物体領域,手領域,背景領域の分割結果と手領域のテクスチャ情報を連関させて学習させる方法を検討した,3,4種類の物体であれば,不完全な背景差分の結果を修正しつつもっとも妥当な物体のクラスに識別することができたが,識別の統計的な信頼度をどのように見積もるかが課題となった.
|