パターン認識では大きく分けて画像全体から得られる大局な情報と画像内の局所的な情報を用いた方法に分けられる。大局情報は位置に依存した情報であり、画像全体の構造を抽出できる。一方、局所情報は特定の位置から抽出した局所的な特徴であり、切り出した位置を捨ててしまえば位置不変性を持つ。各々性質が異なるので、そのエラーパータンも異なる。そこで、ここでは、画像から2つの情報を抽出して各々で類似度を測り、それを統合して識別することを考える。従来のパターン認識法では、事前に教師つきの学習サンプルを用いて多くのサンプルに対して有効である統合重みを決めるのが一般的である。しかし、どちらの情報が有効であるかは状況によって異なるはずである。そこで、ここでは新しい認識法の枠組みとして、画像が来てから大局情報と局所情報のどちらを優先させるかを適応的に選択させることにした。画像が入力されてから良い統合重みを決定するためには、良い重みとは何かを定義しなければならない。ここでは、重み空間での事後確率が高くなるものを良い重みとして考えた。したがって、重み空間での確率分布を推定できれば、良い重みが得られることになる。重み空間内での確率分布がどういう形であるのか分からないので、非線形分布も表現できるパーティクルフィルタを用いて確率分布を推定した。クラス毎にこの適応的な重み推定法を適用し、そのクラスがなるべく1位になるように重みを得た。13シーンを含む公開データセットを用いた実験により提案手法の有効性を評価し、これまでの1位を上回る精度を得ることができた。
|