本年度の研究においては、階層型確率モデルを用いた推論方式、階層型識別器を用いた識別方式に関する検討を行い、主として文書画像、文字を含む情景画像を対象として実際の識別性能の評価を行った。特に、階層型確率モデルについては、昨年度の研究結果を受けて、確率的トピックモデル(pLSAモデル)に基づく領域識別・分類手法に基づき、より詳細な領域分割・分類を行う手法の研究を行った。昨年度の研究に基づく手法の場合、安定した識別結果を得るためには、画像領域中にvisual wordsが十分な数だけ含まれている必要があり、このため領域の精密な分割は困難であった。本研究においてはこの難点を解決するため、小領域の属性識別を行うために、この領域を包含し、十分な量の特徴量を持つ領域を設定し、この領域の識別結果を事前分布(prior)として用いて小領域のトピックモデルのパラメータのMAP型推論を行うことにより小領域の識別の精度を向上させる階層型認識手法を考案した。英語、日本語、数式、手書き領域を含む文書画像データに考案手法を適用し、単純なpLSAモデルの小領域への適用と比較して識別精度の向上が実現できることを検証した。また、文字部分を含む情景画像から文字領域を識別するための手法の研究も実施し、boostingによる学習によって異なる特徴量に基づく単純な識別関数(decision stumps)をカスケード状に組み合わせる、階層型の識別方式により、識別精度と計算速度の向上が図れることも確認した。
|