• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2017 Fiscal Year Annual Research Report

全方位カメラを用いた周辺情報認識による視覚障害者支援

Research Project

Project/Area Number 17H01803
Research InstitutionOsaka Prefecture University

Principal Investigator

岩村 雅一  大阪府立大学, 工学(系)研究科(研究院), 准教授 (80361129)

Project Period (FY) 2017-04-01 – 2020-03-31
Keywords全方位カメラ / 認識 / 検出 / トラッキング / 大規模情景内文字データセット
Outline of Annual Research Achievements

本年度は、主に(1)視覚障害者支援システムのための要素技術の開発、(2)情景文字大規模データセットの作成と(3)作成を容易にする手法の開発を行った。
(1)に関して、2つ実施した。1つは、全方位カメラで撮影した周囲の様子を文字・物体認識技術を用いてリアルタイムに認識し、視覚障害者に伝えるシステムを構築するため、その基盤となるリアルタイム認識システムの構築に取り組んだ。具体的には、全方位カメラで得た全周画像に対して、物体認識(検出)とトラッキングを同時に行うシステムを提案した。もう1つは、物体認識精度を向上させるために、深層学習の学習方法を改良した。CIFAR-100という物体認識データベースを使った実験では、2度世界最高精度を達成し、大学を通じてプレスリリースを行った。
(2)に関して、日本の実環境において文字認識システムの性能を評価するための大規模情景内文字データセットを作成している。本年度は、既に作成していたデータセットのラベルの修正に取り組んだ。そうして作成したデータセットを公開し、これを用いたICDAR 2017 Robust Reading Challenge on Omnidirectional Videoというコンペティションを開催した。
(3)では、視覚障害者の周囲にあるドアの位置(有無)を視覚障害者に教えることを目的として研究を進めた。既存の学習済みの物体検出手法を試したところ、実用に耐える精度が得られなかったため、多様なドアの画像を用いての追加学習を目指した。そのためには多種多量のドアの画像を用意する必要があるが、これをなるべく安価で楽に行う手法を検討した。情景内文字検出・認識においては、フォントを写真上にレンダリングした合成画像を用いて大量の学習データを用意すれば、検出・認識性能が大幅に向上することが知られているため、同様の手法をドアに適用した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

本研究の要である、全方位カメラで得た全周画像に対して、物体認識(検出)とトラッキングを同時に行う手法を構築できたため、おおむね順調と判断した。

Strategy for Future Research Activity

視覚障害者支援システムをノートパソコンでリアルタイムで動かすべく、実装の工夫を行う。また、認識結果をユーザである視覚障害者に伝える際に、情報の取捨選択や要約が必要であるため、これにも注力する。加えて、大規模情景内文字データセットは正解ラベルの更新を完了する。さらに、視覚障害者の要望を受けて、ドアの検出だけでなく、空いている椅子の検出なども実現する。

  • Research Products

    (4 results)

All 2018 2017

All Presentation (4 results) (of which Int'l Joint Research: 2 results)

  • [Presentation] ShakeDrop Regularization2018

    • Author(s)
      Yoshihiro Yamada, Masakazu Iwamura, Koichi Kise
    • Organizer
      International Conference on Learning Representation Workshop Track
    • Int'l Joint Research
  • [Presentation] ICDAR2017 Robust Reading Challenge on Omnidirectional Video2017

    • Author(s)
      Masakazu Iwamura, Naoyuki Morimoto, Keishi Tainaka, Dena Bazazian, Lluis Gomez, Dimosthenis Karatzas
    • Organizer
      14th IAPR International Conference on Document Analysis and Recognition (ICDAR)
    • Int'l Joint Research
  • [Presentation] PyramidNetに対する新たな確率的正則化手法ShakeDropの提案2017

    • Author(s)
      山田 良博, 岩村 雅一, 黄瀬 浩一
    • Organizer
      電子情報通信学会 PRMU研究会
  • [Presentation] Deep Pyramidal Residual Networks with Stochastic Depth2017

    • Author(s)
      Yoshihiro Yamada, Masakazu Iwamura, Koichi Kise
    • Organizer
      画像の認識・理解シンポジウム217

URL: 

Published: 2018-12-17  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi