研究概要 |
本研究の目的は内容に基づく画像検索、特に検索=識別と捉え、学習によって高精精度の検索を実現するとともに、検索手法を逐次改善する手法を確立することである。このとき従来の識別・学習手法では予め識別対象カテゴリが確定している必要があり、本研究の対象とするような用途には適用困難である。そこで今年度の研究においては画像内容を教師なし学習によってモデル化する確率的トピックモデルに基づく識別手法の検討を実施した。トピックモデルを画像に適用するための手法としては、画像に対してSIFT特徴抽出法を適用して得られる特徴集合をk-meansによりクラスタリングし、各クラスタを単語として捉えるものを用いた。トピックモデルとしては単純なmixture modelの他にpLSA、 LDAモデルを用いた。高信頼度の推論を実現するためにMAP推定に基づくEMアルゴリズム手法(pLSA)、 full-Bayes推定によるvariational methodの適用(LDA)などの改良を行った。これらのトピックモデルを用いた画像識別の実験を行い、以下の成果を得た。 ・画像内容に基づくセグメンテーション 画像検索を行うためのキーとなる特徴は画像全体に分布しているのではなく局在しているものと考えられる。本研究では、トピックモデルを用いた、内容に基づく画像分割を試み、文書画像の場合、90%を超える精度で分割が可能であることを確認した。 ・少数サンプルに基づく学習可能性 トピックモデルは教師無し学習である。この特性を利用することにより、カテゴリが付与されたサンプルが少数であっても良好な識別性能を示すことを確認した。 これらの成果はDAS(Int'1 Workshop on Document Analysis Systems)2008, ICPR(Int'1 Conference on Pattern Recognition)2008に投稿中である。
|