研究課題/領域番号 |
17H01803
|
研究機関 | 大阪府立大学 |
研究代表者 |
岩村 雅一 大阪府立大学, 工学(系)研究科(研究院), 准教授 (80361129)
|
研究期間 (年度) |
2017-04-01 – 2020-03-31
|
キーワード | 全方位カメラ / 認識 / 検出 / トラッキング / 大規模情景内文字データセット |
研究実績の概要 |
本年度は、主に(1)視覚障害者支援システムのための要素技術の開発、(2)情景文字大規模データセットの作成と(3)作成を容易にする手法の開発を行った。 (1)に関して、2つ実施した。1つは、全方位カメラで撮影した周囲の様子を文字・物体認識技術を用いてリアルタイムに認識し、視覚障害者に伝えるシステムを構築するため、その基盤となるリアルタイム認識システムの構築に取り組んだ。具体的には、全方位カメラで得た全周画像に対して、物体認識(検出)とトラッキングを同時に行うシステムを提案した。もう1つは、物体認識精度を向上させるために、深層学習の学習方法を改良した。CIFAR-100という物体認識データベースを使った実験では、2度世界最高精度を達成し、大学を通じてプレスリリースを行った。 (2)に関して、日本の実環境において文字認識システムの性能を評価するための大規模情景内文字データセットを作成している。本年度は、既に作成していたデータセットのラベルの修正に取り組んだ。そうして作成したデータセットを公開し、これを用いたICDAR 2017 Robust Reading Challenge on Omnidirectional Videoというコンペティションを開催した。 (3)では、視覚障害者の周囲にあるドアの位置(有無)を視覚障害者に教えることを目的として研究を進めた。既存の学習済みの物体検出手法を試したところ、実用に耐える精度が得られなかったため、多様なドアの画像を用いての追加学習を目指した。そのためには多種多量のドアの画像を用意する必要があるが、これをなるべく安価で楽に行う手法を検討した。情景内文字検出・認識においては、フォントを写真上にレンダリングした合成画像を用いて大量の学習データを用意すれば、検出・認識性能が大幅に向上することが知られているため、同様の手法をドアに適用した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究の要である、全方位カメラで得た全周画像に対して、物体認識(検出)とトラッキングを同時に行う手法を構築できたため、おおむね順調と判断した。
|
今後の研究の推進方策 |
視覚障害者支援システムをノートパソコンでリアルタイムで動かすべく、実装の工夫を行う。また、認識結果をユーザである視覚障害者に伝える際に、情報の取捨選択や要約が必要であるため、これにも注力する。加えて、大規模情景内文字データセットは正解ラベルの更新を完了する。さらに、視覚障害者の要望を受けて、ドアの検出だけでなく、空いている椅子の検出なども実現する。
|