2012 Fiscal Year Research-status Report
マンガ画像解析及びキャラクター検出手法に関する検討
Project/Area Number |
24700100
|
Research Institution | Waseda University |
Principal Investigator |
石井 大祐 早稲田大学, 理工学術院, 助手 (40581525)
|
Project Period (FY) |
2012-04-01 – 2014-03-31
|
Keywords | 画像解析 / マンガ / 人物検出 / 人物識別 |
Research Abstract |
本年度は顔の自動検出及び識別の初期段階として瞳検出および登場人物の切り出された顔画像に対する学習とその識別について調査及び実験を行った.初めに, 顔全体の検出処理だけでなく,瞳部分に絞って検出処理を行い,人物の存在有無を捉えることを試みた. ただし,瞳自体にも描かれるサイズの差異が大きく,これを学習判別に使用するためには,解像度変換もしくはHOG特徴量の計算時に次元を一定に保つ必要がある.そこで,上記2手法の判別処理に対する影響を調査した. 次に,登場人物の識別について検討を行った.前述の瞳検出により,登場人物のおおよその位置が得られることから,ここでは,顔が切り出せるものと仮定し,登場人物の顔画像同士を学習,比較し,その判別処理を実装し,検討を行った. HOG特徴量を計算し,これをSVMにより学習することで,登場人物識別器を構成し,実際に登場人物の識別処理を行ったところ,ruePositiveが60~99%,TrueNegativeが19~92%となった.HOG特徴量とSVMを用いた登場人物識別に関する問題点として, 識別器の生成時に学習パターン数を多くしすぎた場合に, 学習用画像のクラス内分散が大きくなり, これに伴いFalsePositiveが上昇することがある.これに対応するため, 登場人物の表情・顔のパターンを数種類に分け, クラス内分散を抑えつつ表情パターンへの対応を検討した. 結果として,学習画像枚数をそろえやすい正面向きの顔などでTruePositive, TrueNegativeの双方が高くなる結果が得られた. 本年度は、顔検出の基礎となる登場人物の瞳検出から、マンガ上の登場人物識別に関する検討を実施し、査読付き国際学会1件を含む,合計4件の学会発表を行った.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究では、マンガの登場人物の自動検出およびその識別の実現を目標としている. このうち、初年度では瞳の自動検出と、顔が検出されたという仮定上での顔識別を実施した. 瞳検出に付いては実験内容により精度が変化するため,今後更なる検討が必要である.一方で,顔識別については,実際にマンガの登場人物の識別処理を行ったところ,TruePositiveが60~99%,TrueNegativeが19~92%となった.さらに顔のパターン分類を行った場合にはさらなる精度向上が認められた.これはマンガの登場人物の検出と識別の自動化において,それぞれ基礎部分と基礎検討部分に相当するが,これらに対し,現状は一定の成果が得られている状況である.次の課題として瞳の情報を用いた顔の自動検出およびその精度向上と、顔識別の更なる高精度化が挙げられる.上記より、現時点での達成度は全体のおよそ半分程度であり,おおむね順調といえる.
|
Strategy for Future Research Activity |
基礎実験および基礎検討を行ってきた人物の瞳検出と、顔画像が得られた状態での人物識別を用い、登場人物の顔領域自動検出とその識別を実現する. 登場人物の識別に付いては本年度の研究成果から,顔領域の切り出しが行えている場合であればある程度実現可能であることが分かっている.このため,顔領域の検出(自動切り出し)が主なターゲットとなる.顔領域の検出では,これまでに実施した瞳情報を用いる方法および顔を直接検出するアプローチがある.これらを組み合わせ,かつ表情の変動をうまく取り扱う特徴量および学習器への入力方法について検討を行う.年度のなるべく早い段階で登場人物の自動検出・識別処理の統合を実現する.次いで,人物検出・識別の各要素についてアプローチによる検出精度への影響を調査する.併せて,現在までの実験では処理対象とするマンガのサンプルが小さいが,これを拡張する. このため,研究用途として利用可能なマンガ画像の収集と実験に要するデータの生成およびこれを用いた前年と比較し大規模な実験を実施する.各過程で得られた成果は逐次学会等での発表を行う.
|
Expenditure Plans for the Next FY Research Funding |
本年度の成果を含む,研究の各段階で得られた成果を広く一般に発信するため,国際学会を含む数件の学会等での発表,および1件以上の論文誌への投稿を予定している. 今年度実施予定の従来より大きい規模での解析実験のため,必要となる画像および正解データを多数準備する必要がある.これは多くの人的コストが必要であり,また,データ入力のための機器も必要となる.そこで,各種データ作成用の機材(画像処理用PC,モニタ等)および人的コストへの支出を検討している.加えて,得られたデータを安全に保持するためのストレージを導入する.
|
Research Products
(5 results)