本研究では、マルチメディアデータベース化を目的とした画像情報の認識・理解技術として、「マルチメディア協調」による認識枠組と、「目的指向規範」による利用枠組とを特徴とする「データベースビジョン」と呼ぶベき新しい術技スタンスを提案し、検討することを目的とする。この目的に沿って、以下の具体的成果を得た。 (1)データベースビジョンと目的指向規範の枠組の提案: 画像・映像の認識の程度を‘状態'とする汎用の自動認識機構を提案、実装し、生成された各対象物の‘最終状態'をデータモデル表現として、応用システムによってそれを利用する新しい形の方法論を提案した。 (2)複数メディアの協調による認識方式の提案と実装: 動画像と文書画像、音声の3つのメディアを対象に、各メディアの自動認識マネージャーと、それそれの認識結果を協調させてより高次の認識結果に導くためのスーパーバイザとから成る複数メディア協調型システムを提案し、ドラマ画像に対して、実ドラマ映像のシーン分解、登場人物同定を行うシステムを実装し、方式の有効性を実証した。 (3)目的指向規範を用いた画像データベースの実現: スポーツ画像の静止画群、及びTV放送の動画像を対象とした2種の画像データベースを実現し、実験による評価を行った。 (4)時間方向の多重化によるカラー動画像処理方式の提案: 動画像の効率的処理方式として、カラー画像を時間軸方向に平均化して静止画化し、この静止画を3次元カラー空間に写像してクラスタリングする形の新しい方式を提案し、有効性を実証した。
|