研究課題/領域番号 |
25330133
|
研究機関 | 宮崎大学 |
研究代表者 |
Pyke Tin 宮崎大学, 国際連携センター, 客員教授 (70536961)
|
研究分担者 |
濱 裕光 大阪市立大学, 工学(系)研究科(研究院), 名誉教授 (20047377)
ThiThi Zin 宮崎大学, 工学部, 教授 (30536959)
|
研究期間 (年度) |
2013-04-01 – 2017-03-31
|
キーワード | 類似画像検索 / ビジョンキー / 再帰的ランキング / 類似度測度 |
研究実績の概要 |
現在、様々な種類の画像が無数に溢れている。そのため、の効率的な管理、検索が必要になる。そこで、画像自体の特徴を利用し類似性に基づいて検索する CBIRに注目が集まっている。本研究では、画像の色、形状、テクスチャからいろいろな特徴量を組み合わせることでユーザ満足度の高い画像検索システムの構築を目指す。提案手法ではクエリとデータベース内の画像からそれぞれ特徴量を抽出して類似度を算出し、ランキングする。提案手法では、「特徴量による類似度測度、ビジョンキー抽出、特徴的なビン番号の抽出、色の割合、再帰的ランキングの順位の決定」を用いる。 特徴量は濃度共起行列、類似度の算出方法はユークリッド距離による。再帰的ランキングは、次のステップで行う:(1)一次ランキングで上位5位までの画像を再びクエリ画像として扱う、(2)1位から5位まで、一次ランキングと同様の処理を行う、(3)最終的なランキングは評価範囲内の最大5回の出現回数と、出現回数が同じ場合は重み加算による総合的な順位で決定する。実験は、Agip、starbucks、Heineken等11カテゴリ、計712枚を対象に行った。データベースの中には、11カテゴリ以外の不正解画像も含まれている。類似度ランキングの評価は、正解データの数の2倍の数だけ抽出を行った時の適合率、再現率、F値を求めるBull's eyeスコアの方法を用いる。一つの指標である再現率を見ると、35.3~80%の幅の広い結果となった。登録商標などを対象とするときには、数十万枚の画像から検索するので、「正解データの数の2倍の数」でなく10倍程度でも、高い再現率による省力化の効果が大きい。例えば、10万枚の画像から、100枚に絞れる効果は大きい。また、目視によると「同じ」ではなく、「似ている」画像を検索している様子が分かり、提案手法の有効性は確認できた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
Agipとpepsiに関しては、再現率80%、74.4%と比較的よい結果となったが、この2つのカテゴリは色の割合や色の位置関係等の色の表現方法が統一されているため良い結果が得られたと考える。評価の低いものとして、cocacolaは基盤の色と文字の色が逆転するケースが見られ、appleではクエリとは全く違う色で表示されるケースが多数見られたことから、データベース内の色の表現に対応できなかったことが原因と考えられる。このようにアルゴリズムの有効性は確認できたが、「類似している」と「同じカテゴリ内にある」の評価が必ずしも対応していない。カテゴリによっては、よくない結果となったが、人間の主観評価に照らすと納得できる結果が得られている場合が多い。このことより提案手法の有効性は確認されたが、評価基準の多様性が不可欠であることが明らかになった。
|
今後の研究の推進方策 |
複数特徴量による相補的利用が問題解決の鍵になると思われる。特徴量を増やし、ユーザの意図を把握し、うまく要求に応える特徴量の組み合わせを選択することにより、より高い再現率を目指す。もちろん、適合率やF値も重用であるが、再現率は最も重要なファクターであると考える。大規模検索結果を羅列的でなく効率的に順位づけて提示する。提示枚数を増やせば、再現率を高めることは容易であるが、ここでは、提示枚数をできるだけ少なく保ちつつ、高再現率を目指す。
|
次年度使用額が生じた理由 |
実験に不可欠なソフトウェアのライセンス更新と研究成果を多く発表するために次年度にできるだけ多くの予算を確保した。
|
次年度使用額の使用計画 |
ソフトウェアのライセンス更新と研究成果発表
|