• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2015 年度 実施状況報告書

材質認識と物体認識を融合した画像認識の新展開

研究課題

研究課題/領域番号 26540078
研究機関東京大学

研究代表者

山崎 俊彦  東京大学, 情報理工学(系)研究科, 准教授 (70376599)

研究期間 (年度) 2014-04-01 – 2017-03-31
キーワード画像認識 / 物体検出 / 機械学習 / 確信度
研究実績の概要

本研究の目的は、これまで独立に行われてきた「材質認識」と「物体認識(形状認識)」を融合して処理し、互いのデータを補助的に用いることでそれぞれのタスクの認識率を向上させること、さらに材質・形状を手がかりとしたさらに細かな画像分類を可能とすることであった。しかし、深層学習などあたらしい手法の登場により両者の垣根がなくなり同等の問題として扱われるようになってきた。そのため、下記のように研究の力点を変え、材質認識、物体認識両方に一般的に利用可能な手法について研究を進めた。
これまで行ってきた研究内容は大きく分けて3つある。1つめは、機械学習器の確信度判定である。正しく確信度を判定できれば、確信度が低い場合に別の特徴抽出や機械学習の手法を導入ことによって判定結果を正しいものに上書きできる可能性がある。この確信度判定について、解析的な手法と機械学習を用いる手法を提案した。2つめは、進化計算を用いたCNNの構造・パラメータ自動最適化の研究である。CNNに代表される深層学習は、研究者が手作業で特徴量抽出アルゴリズムを決定する必要がない画期的な手法とされているが、構造・パラメータについては研究者がやはり手作業で決定する必要がある。これらの最適化は探索空間が広く手作業による最適化は非常に困難であるため、進化計算による自動最適化について研究た。本年度は特に粒子群最適化法による最適化を行い、具体的な性能向上を確認すると共に画像認識のスマートフォンアプリを公開した。3つめは文脈に基づく物体検出・認識性能の向上である。画像中に共起している他の物体の情報や、物体の出現位置や大きさを考慮して確信度を再計算する手法を提案した。

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

研究内容について申請時の研究計画からの修正はあるものの、逆により汎用性の高い複数の課題について研究を行うことができ、予想以上の成果をあげている
1つめの機械学習器の確信度判定については、論文誌に再録されたほかその拡張方式を国際会議に投稿中である。これまでのところ、SVMが出力する分離超平面からの符号付き距離やConvolutional Neural Network (CNN)などで用いられるsoft-max法が出力する確率値などに対して解析的な手法と機械学習による手法の2つを提案し、研究代表者がこれまで研究してきた差分法にくらべて大きな精度向上が実現できた。また、CNNで確信度が低い場合にAdaboostと組み合わせることで画像認識精度を向上できることを実験的に示した。
2つめのCNNの構造・パラメータ自動最適化については、大規模な実験によりその有効性を確認した。進化計算は多くのシードを用いて繰り返して最適化を行うため計算時間が膨大になる問題があるが、小規模な学習ででも大規模な学習とほぼ同等の性能が得られる方式を開発した。これは、進化計算を行う場合、最終的な精度がわからなくとも個体同士の優劣差が明らかになればよい、という知見に基づく。数種類の標準画像データセットを用いて認識実験を行ったところ、いずれの場合においても数%の精度向上を確認した。
3つめの文脈に基づく物体検出・認識性能の向上については、どのような物体検出手法に対しても適用可能な後処理として、画像の文脈情報を用いた出力の高精度化を行っている。類似画像から統計的に学習された文脈情報と既存物体検出の出力を条件付き確率場最適化により統合し、その出力を棄却するかについて再ラベリングを行った。現在、大規模実験を行い、手法の有効性について確認している段階である。

今後の研究の推進方策

CNNのパラメータ自動最適化については、有効性が確認できたので様々なシーンに応用・展開を行っていく。可能であればパラメータだけでなく構造の最適化も自動化できるよう、検討を行っていきたい。
機械学習器の確信度判定については、機械学習器が出力する符号付き距離や確率値のクラス間相関をマルコフ確率場で考慮し、最適化する手法を引き続き検討していく。あわせて、近年は複数の問題の統一最適化に対しても深層学習+CRFという組み合わせが用いられるようになってきており、この手法についても検討する。
また、発展的な課題として時間方向の情報を持った映像処理・解析に対して検討していきたい。

  • 研究成果

    (15件)

すべて 2016 2015 その他

すべて 雑誌論文 (1件) (うち査読あり 1件、 オープンアクセス 1件、 謝辞記載あり 1件) 学会発表 (13件) (うち国際学会 3件、 招待講演 1件) 備考 (1件)

  • [雑誌論文] 各クラスへの中間出力値を用いた多クラス認識のための確信度処理2015

    • 著者名/発表者名
      山崎俊彦, 大島 辰之輔, 相澤清晴
    • 雑誌名

      映像情報メディア学会誌

      巻: 69 ページ: J257-J260

    • DOI

      http://doi.org/10.3169/itej.69.J257

    • 査読あり / オープンアクセス / 謝辞記載あり
  • [学会発表] Towards Online Impression Prediction of Oral Presentations using Soft Coding2016

    • 著者名/発表者名
      T. Yamasaki, Y. Fukushima, R. Furuta, and K. Aizawa
    • 学会等名
      Proc. 1st workshop on Attractiveness Computing in Multimedia (ACM)
    • 発表場所
      Taipei, Taiwan
    • 年月日
      2016-04-20 – 2016-04-22
    • 国際学会
  • [学会発表] 類似シーン画像を用いた物体検出のフィルタリング2016

    • 著者名/発表者名
      井上直人, 古田諒佑, 山崎俊彦, 相澤清晴
    • 学会等名
      情報処理学会第78回全国大会
    • 発表場所
      慶応大学、横浜、神奈川
    • 年月日
      2016-03-10 – 2016-03-12
  • [学会発表] カスケード型識別器と進化計算による自動最適化CNNを用いたハイブリッド画像認識2016

    • 著者名/発表者名
      本間拓人, 山崎俊彦, 相澤清晴, 川崎順平, 茶谷亮裕, 進藤俊彦
    • 学会等名
      電子情報通信学会, 信学技報, 画像工学研究会
    • 発表場所
      北海道大学、札幌市、北海道
    • 年月日
      2016-02-22 – 2016-02-23
  • [学会発表] Prediction of User Ratings of Oral Presentations using Label Relations2015

    • 著者名/発表者名
      T. Yamasaki, Y. Fukushima, R. Furuta, L. Sun, K. Aizawa, and D. Bollegala
    • 学会等名
      ACMMM Workshop on Affect and Sentiment in Multimedia (ACMMM ASM)
    • 発表場所
      Brisbane, Australia
    • 年月日
      2015-11-30 – 2015-11-30
    • 国際学会
  • [学会発表] 文書・音声特徴によるリアルタイム・プレゼンテーション解析にむけた検討2015

    • 著者名/発表者名
      山崎俊彦, 古田諒佑, 福島悠介, 相澤清晴
    • 学会等名
      2015年度映像メディア処理シンポジウム (IMPS 2015)
    • 発表場所
      ラフォーレ修善寺, Sizuoka, Shuzenji
    • 年月日
      2015-11-18 – 2015-11-20
  • [学会発表] 高階エネルギーのMRF最適化によるラベル共起を考慮したマルチラベル分類2015

    • 著者名/発表者名
      古田諒佑, 福島悠介, 山崎俊彦, 相澤清晴
    • 学会等名
      2015年度映像メディア処理シンポジウム (IMPS 2015)
    • 発表場所
      ラフォーレ修善寺, 伊豆市、静岡
    • 年月日
      2015-11-18 – 2015-11-20
  • [学会発表] 畳み込みニューラルネットワークの最適化に関する探索の効率化2015

    • 著者名/発表者名
      本間拓人, 山崎俊彦, 相澤清晴
    • 学会等名
      2015年度映像メディア処理シンポジウム (IMPS 2015)
    • 発表場所
      ラフォーレ修善寺, 伊豆市、静岡
    • 年月日
      2015-11-18 – 2015-11-20
  • [学会発表] MRF-Based Multi-Label Classification using Label Relations2015

    • 著者名/発表者名
      Ryosuke Furuta, Yusuke Fukushima, Toshihiko Yamasaki, Kiyoharu Aizawa
    • 学会等名
      情報処理学会・第198回コンピュータビジョンとイメージメディア研究発表会(CVIM)
    • 発表場所
      愛媛大学, 松山, 愛媛
    • 年月日
      2015-09-14 – 2015-09-15
  • [学会発表] A Fast Table-Based Approach of Bag-of-Features for Large-Scale Image Classification2015

    • 著者名/発表者名
      邱盟竣, 山崎俊彦, 相澤清晴
    • 学会等名
      映像情報メディア学会年次大会
    • 発表場所
      東京理科大学葛飾キャンパス, 葛飾区、東京
    • 年月日
      2015-08-26 – 2015-08-28
  • [学会発表] クラス間の共起情報を用いた物体検出結果のフィルタリング2015

    • 著者名/発表者名
      井上直人, 古田諒佑, 山崎俊彦, 相澤清晴
    • 学会等名
      映像情報メディア学会年次大会
    • 発表場所
      東京理科大学葛飾キャンパス, 葛飾区、東京
    • 年月日
      2015-08-26 – 2015-08-28
  • [学会発表] 粒子群最適化を用いた深層学習のアーキテクチャ自動最適化2015

    • 著者名/発表者名
      本間 拓人, 山崎 俊彦, 相澤 清晴
    • 学会等名
      The 18th Meeting on Image Recognition and Understanding (MIRU)
    • 発表場所
      阪急エクスポパーク、吹田市、大阪
    • 年月日
      2015-07-27 – 2015-07-30
  • [学会発表] A Fast Method of Visual Words Assignment of Bag-of-Features for Object Recognition2015

    • 著者名/発表者名
      Meng-Jiun Chiou, Toshihiko Yamasaki, Kiyoharu Aizawa
    • 学会等名
      The 18th Meeting on Image Recognition and Understanding (MIRU)
    • 発表場所
      阪急エクスポパーク、吹田市、大阪
    • 年月日
      2015-07-27 – 2015-07-30
  • [学会発表] Future Design and User Navigation Using Big Multimedia Data2015

    • 著者名/発表者名
      T. Yamasaki
    • 学会等名
      The 1st International Conference on Advanced Imaging (ICAI)
    • 発表場所
      一橋記念講堂、千代田区、東京
    • 年月日
      2015-06-17 – 2015-06-19
    • 国際学会 / 招待講演
  • [備考]

    • URL

      https://www.hal.t.u-tokyo.ac.jp/~yamasaki/project/index-e.html

URL: 

公開日: 2017-01-06  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi