2012 Fiscal Year Research-status Report
Project/Area Number |
24500216
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Research Institution | Waseda University |
Principal Investigator |
鎌田 清一郎 早稲田大学, 理工学術院, 教授 (00204602)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Keywords | 画像認識 / 画像検索 / 空間充填曲線 / 線形多様体 / 顔検索 |
Research Abstract |
画像認識についてはまず色情報における記述子としてどのような特徴が抽出できるかを検討した。その結果、固有空間を線形多様体とした新たな色特徴記述子を提案した。これは、固有空間の各基底に色分布に基づく重みを重畳する方法である。薬剤パッケージを用いた認識実験の結果、他の手法相互部分空間法やJ勾配法などと比較して優位性が確認できた。次に、画像検索については、空間充填曲線の一種であるヒルベルト曲線を用いたヒルベルト走査型Bag of Features(HS-BoF)の拡張方法を提案した。これは、画像の基本特徴(色、形状など)を表すデータ特徴量に対してkmeansなどのクラスタリング手法により、近い特徴を持ったものをグループ化してカテゴリ名をつけ、各グループの代表特徴量に対して木構造表現を用いて類似グループを階層的にまとめ、画像内の対象物を階層上に表現し、この表現上で対象の部分画像を検索する方法である。実験では、Caltech-256やImageNetなどを用いて評価実験を行った結果、提案手法は、従来手法BoFに比べて、少ないメモリで高精度検索が可能であることがわかった。さらに、膨大なビデオデータセットからの人物を効率的に特定するための検索手法を検討した。これはビデオを顔トラック、シーントラック、人物関係の組織化を行い、高速検索を可能にするものである。ここで組織化とは、グループ化を行い複数のクラブを作る。ある人物はいずれかのクラブに属するようにクラスタリングを行うことになる。標準データベースとして公開されている複数のビデオ(映画、TVショウ、NASA,インタビューなど)を使って、100万枚の顔画像を含んだ約20万セットの顔トラックから検索した結果、従来手法としてk-FacesやSivic法を選び、比較実験を行った結果、提案手法が従来手法より検索効率が大幅に改善できることを確認した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
24年度の研究計画として画像特徴抽出方式および画像検索方式の確立を行うことを挙げていたが、計画通りに研究を遂行することができた。特に薬剤PTPパッケージの認識に関しては、従来にない認識性能を実現することができた。また、画像、ビデオ検索に関しても、対象物の検索効率において精度面および速度面で大幅な向上が実現できた。
|
Strategy for Future Research Activity |
画像認識、検索に関して得られた研究成果については、国際的に権威ある国際会議において研究発表を行う予定である。まず、7月15-19日米国サンノゼにおいて開催されるIEEEの主要国際会議ICEME2013(Internation Conference on Multimedia Expo.)において論文Facial Signatures for Fast Individual Retrieval from Video Datasetを発表し、また9月15-18日メルボルンにて開催されるIEEEの主要国際会議ICIP2013 (International Conference on Image Processing)において論文Maximum Correntropy Criterion for Discriminative Didctionary Learningが採択されたので研究発表を行う予定である。また、本研究では膨大な画像、ビデオデータを使用する必要があり、認識および検索性能の評価において検索精度および速度を上げるために、今後も様々な画像やビデオを収集する予定である。
|
Expenditure Plans for the Next FY Research Funding |
本研究では、ビデオや画像の蓄積が膨大であるため、今後の研究を推進する上で7,175円はそれらの蓄積メディアと一緒に購入する予定である。
|