研究概要 |
バーチャルリアリティやマルチメディアの要素技術として画像解析技術への要求が高まっている。特に、特別なスタジオや機材を必要とすることなしに、一般のビデオ映像から人間や動物の「動作」を認識し、モデル化することが求められている。ここで、動作とは、単なる物体の動きの方向や速度ではなく、「走る」や「止まる」といった対象物の意図や意思によって意味付けされた、抽象度の高い記号表現を言う。動作による記号表現と映像との双方向の変換が可能になると、高度な情報の圧縮や、シナリオからの映像の自動生成、キーワードによる映像検索が可能になる。 本研究では、代表者が提案中の多層人工神経回路網(ハイパーコラムモデル)とその選択的注意機構(記号から信号へのトップダウン処理)を用い、以下の3つの点におけるモデル獲得システムの技術向上を目指している。(1)複雑な背景下でも対象物を安定して認識し、カメラで確実に追跡する技術。(2)追跡した物体の形状や動きを適切にパラメータ化する技術。(3)得られたパラメータを基に、記号的な意味付けを行う技術。 本年度は,実験のための環境作りと、提案モデルの性能を評価するための基礎実験を以下の点について行った。 ・ 対象物追跡システムの構築:首振り制御付きカメラとパーソナルコンピュータを用いた対象物追跡システムを構築した。 ・ ハイパーコラムモデルを動画像に適用するための改良:柔軟な対象物追跡を可能にするための、注意レベルの制御方法、制御レベルを切り替えるタイミングを検出するための予測方式を明らかにした。 ・ ハイパーコラムモデルの最上位層で形成される特徴マップの解析:動作の分かっているサンプル画像を基に形成した特徴地図を解析し、異なる動作の識別能力と、未学習動作に対する汎化能力を評価した。
|