研究課題/領域番号 |
26540078
|
研究機関 | 東京大学 |
研究代表者 |
山崎 俊彦 東京大学, 情報理工学(系)研究科, 准教授 (70376599)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | 画像認識 / 物体検出 / 機械学習 / 確信度 |
研究実績の概要 |
本研究の目的は、これまで独立に行われてきた「材質認識」と「物体認識(形状認識)」を融合して処理し、互いのデータを補助的に用いることでそれぞれのタスクの認識率を向上させること、さらに材質・形状を手がかりとしたさらに細かな画像分類を可能とすることであった。しかし、深層学習などあたらしい手法の登場により両者の垣根がなくなり同等の問題として扱われるようになってきた。そのため、下記のように研究の力点を変え、材質認識、物体認識両方に一般的に利用可能な手法について研究を進めた。 これまで行ってきた研究内容は大きく分けて3つある。1つめは、機械学習器の確信度判定である。正しく確信度を判定できれば、確信度が低い場合に別の特徴抽出や機械学習の手法を導入ことによって判定結果を正しいものに上書きできる可能性がある。この確信度判定について、解析的な手法と機械学習を用いる手法を提案した。2つめは、進化計算を用いたCNNの構造・パラメータ自動最適化の研究である。CNNに代表される深層学習は、研究者が手作業で特徴量抽出アルゴリズムを決定する必要がない画期的な手法とされているが、構造・パラメータについては研究者がやはり手作業で決定する必要がある。これらの最適化は探索空間が広く手作業による最適化は非常に困難であるため、進化計算による自動最適化について研究た。本年度は特に粒子群最適化法による最適化を行い、具体的な性能向上を確認すると共に画像認識のスマートフォンアプリを公開した。3つめは文脈に基づく物体検出・認識性能の向上である。画像中に共起している他の物体の情報や、物体の出現位置や大きさを考慮して確信度を再計算する手法を提案した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
研究内容について申請時の研究計画からの修正はあるものの、逆により汎用性の高い複数の課題について研究を行うことができ、予想以上の成果をあげている 1つめの機械学習器の確信度判定については、論文誌に再録されたほかその拡張方式を国際会議に投稿中である。これまでのところ、SVMが出力する分離超平面からの符号付き距離やConvolutional Neural Network (CNN)などで用いられるsoft-max法が出力する確率値などに対して解析的な手法と機械学習による手法の2つを提案し、研究代表者がこれまで研究してきた差分法にくらべて大きな精度向上が実現できた。また、CNNで確信度が低い場合にAdaboostと組み合わせることで画像認識精度を向上できることを実験的に示した。 2つめのCNNの構造・パラメータ自動最適化については、大規模な実験によりその有効性を確認した。進化計算は多くのシードを用いて繰り返して最適化を行うため計算時間が膨大になる問題があるが、小規模な学習ででも大規模な学習とほぼ同等の性能が得られる方式を開発した。これは、進化計算を行う場合、最終的な精度がわからなくとも個体同士の優劣差が明らかになればよい、という知見に基づく。数種類の標準画像データセットを用いて認識実験を行ったところ、いずれの場合においても数%の精度向上を確認した。 3つめの文脈に基づく物体検出・認識性能の向上については、どのような物体検出手法に対しても適用可能な後処理として、画像の文脈情報を用いた出力の高精度化を行っている。類似画像から統計的に学習された文脈情報と既存物体検出の出力を条件付き確率場最適化により統合し、その出力を棄却するかについて再ラベリングを行った。現在、大規模実験を行い、手法の有効性について確認している段階である。
|
今後の研究の推進方策 |
CNNのパラメータ自動最適化については、有効性が確認できたので様々なシーンに応用・展開を行っていく。可能であればパラメータだけでなく構造の最適化も自動化できるよう、検討を行っていきたい。 機械学習器の確信度判定については、機械学習器が出力する符号付き距離や確率値のクラス間相関をマルコフ確率場で考慮し、最適化する手法を引き続き検討していく。あわせて、近年は複数の問題の統一最適化に対しても深層学習+CRFという組み合わせが用いられるようになってきており、この手法についても検討する。 また、発展的な課題として時間方向の情報を持った映像処理・解析に対して検討していきたい。
|