研究概要 |
近年多種多様な情報に対してネットワーク等を介してアクセスするための情報検索技術の重要性がますます増大している。このとき対象データが動画、画像、音声などのメディアデータである場合には、定式化が困難な、検索者の持つ感覚的距離基準、いわゆる「イメージ」に基づく類似検索、内容に基づく検索が重要であると考えられる。特に画像に対して内容に基づく検索を実施することを考えると、検索ユーザ毎に「内容」の概念が異なるなど検索は不確定性を有することになる。このような不確定性を有する検索問題に対して有効な解決策を与えるためには、確率モデルに基づく画像や文書のモデル化、及び検索事例からの学習に基づく推論方式の確立が必要となると考えられる。本研究は、主として文書解析において用いられてきた確率的トピックモデルを画像認識、画像検索、アノテーションに用いることによりこの問題を解決することを目指したものである。画像内容をもたらす要因は画像データから陽には計算できない隠れた変数としてモデル化できる。本研究においては、これを画像のトピックと考え、文書解析の分野において研究が進められて来ている確率的トピックモデルの代表例であるMixture of Unigrams, pLSA(probabilistic latent semantic analysis), LDA(latent Dirichlet allocation)を画像に適用する。本研究では、これらのモデルに基づき、例題からの学習によって確率モデルのパラメータを推論することにより、各画像のトピック分布を求め、これに基づいて画像識別、文書画像領域分割、画像アノテーション、画像のキーワード検索を行うための手法を提案する。また、種々の画像データベースを用いた実験により、提案手法の有効性を示す。
|