2012 年度実績報告書

ウェアラブルな文字認識視覚補助デバイスに関する研究

研究課題

研究課題/領域番号	22300194
研究機関	東北大学
研究代表者	後藤英昭東北大学, サイバーサイエンスセンター, 准教授 (40271879)
研究期間 (年度)	2010-04-01 – 2013-03-31
キーワード	画像認識 / 福祉工学 / 文字認識 / ウェアラブルカメラ / シーン文字検出 / 視覚障害者補助
研究概要	視覚障害者に自立的な文字識別・理解の能力を提供し、QoL(生活の質)の向上を図るために、ウェアラブルな文字認識視覚補助デバイスの実現を目指して、看板や文書等のシーン中文字のリアルタイム抽出やトラッキング(追跡)、リアルタイム高速文字認識などの要素技術を開発し、理論的・実験的な考察を行なった。前年度までに開発したウェアラブルカメラ用の文字抽出・トラッキング手法に改良を加え、従来手法(2011年信学技報で発表)と比較して、同一の文字領域から生じる重複した画像の数を約1/3に抑えつつ、同約3倍の速度を実現した。これにより、重複した音声出力が減り、視覚補助デバイスの利便性向上に貢献できる。視覚障害者が自力で環境中の看板などを見つけ、認識に適した文字画像を撮影できるようにするため、文字の位置を音響信号によって提示する手法を前年度までに開発したが、本年度はこれに文字認識と音声合成を組み合わせた「文字読み上げカメラ」のプロトタイプを開発した。音響信号の工夫により、文字位置の高い正答率(98.8%)を得た。本プロトタイプを視覚障害者向けイベント「サイトワールド2012」に出展し、視覚障害者に利用してもらうことで、提案システムの有効性を確認するとともに、今後の改良や発展につながる有益なコメントや知見を多数得ることができた。ビデオレートのリアルタイム文字認識を実現するために、多クラス判別分析(LDA)と二分探索木を用いて、日本語文字認識の高速化手法の改良を推し進めた。前年度開発の手法では手書き文字データ(ETL9B)で速度・認識精度とも大きく低下していたが、改良型の手法ではこの性能低下を抑え、全数整合法と比べて33.9倍の速度を0.24%の精度低下で実現した。この処理速度は動画像(30fps)の1フレームあたり約198文字に相当し、リアルタイム文字認識の応用につながる。
現在までの達成度 (区分)	理由 24年度が最終年度であるため、記入しない。
今後の研究の推進方策	24年度が最終年度であるため、記入しない。

研究成果
(3件)

すべて 2012 その他

すべて雑誌論文 (1件) (うち査読あり 1件) 学会発表 (2件)

[雑誌論文] Scene Text Detection and Tracking for a Camera-equipped Wearable Reading Assistant for the Blind2012
- 著者名/発表者名
  Faustin Pegeot
- 雑誌名
  
  The 11th Asian Conference on Computer Vision (ACCV2012), Workshop on Detection and Tracking in Challenging Environments (DTCE)
  
  巻: - ページ: -
- 査読あり
[学会発表] 高速日本語文字認識のための線形判別分析を用いた高精度クラスタリング手法
- 著者名/発表者名
  後藤英昭
- 学会等名
  信学技報パターン認識・メディア理解
- 発表場所
  山形大学
[学会発表] 視覚障害者のための音響による情景文字情報提示・読み上げシステム
- 著者名/発表者名
  後藤英昭
- 学会等名
  電子情報通信学会2013年総合大会
- 発表場所
  岐阜大学

2012 年度 実績報告書

ウェアラブルな文字認識視覚補助デバイスに関する研究

研究代表者

後藤 英昭 東北大学, サイバーサイエンスセンター, 准教授 (40271879)

理由

研究成果

[雑誌論文] Scene Text Detection and Tracking for a Camera-equipped Wearable Reading Assistant for the Blind2012

著者名/発表者名

雑誌名

[学会発表] 高速日本語文字認識のための線形判別分析を用いた高精度クラスタリング手法

著者名/発表者名

学会等名

発表場所

[学会発表] 視覚障害者のための音響による情景文字情報提示・読み上げシステム

著者名/発表者名

学会等名

発表場所

2012 年度実績報告書

後藤英昭東北大学, サイバーサイエンスセンター, 准教授 (40271879)