研究概要 |
内容に基づいた画像検索のための画像間の類似皮の評価, および性能向上についての研究をおこなった. まず, 通常の風景や人物などの写真画像について, これまでの類似度をそのまま用いるのみでは, 画像検索に用いた際の検索精度向上に問題があり, その原因は, 画像内のすべての領域について25次元の特徴量を求め, それらの値を等しく評価していた点であることを明らかにした. 人間は画像の特定の領域のみに注目し, その部分についての印象を強く感じ, その印象に基づいて画像の類似度を評価していると考えられ, 人間が注目する領域抽出を行うアルゴリズムを提案した. 提案手法を用いて画像から注目領域を抽出し, この注目領域のみの画像特徴量を求め, この特徴量による画像類似度を構成してビジュアルキー型画像検索を行った結果, 提案するアルゴリズムによる注目領域抽出を行った画像検索は, これまでの画像検索に対して適合率, 再現率とも25%増加することを確認した. 次に, 文字画像による文字認識においても, 文字の認識率向上のため, 文字画像の類似度を適切に評価する必要があるが, ラスター画像としての文字画から文字画像中の特定領域に注目し, 筆順などのストローク情報を保持したデータベースと照合することで, 手書き文字の認識率向上をおこなった. これらの研究成果から, 画像中の注目領域と非注目領域の特徴量を切り離し, 注目領域のみで類似度を評価する方が, 検索精度, 認識精度と向上することが明らかになった. また, 今後の課題として, 非注目領域の特徴量を無視するのではなく, 注目領域の特徴量と集約演算を行うことによる, 検索精度, 認識精度のさらなる向上が考えられる.
|