研究課題/領域番号 |
23500647
|
研究機関 | 名古屋大学 |
研究代表者 |
大西 昇 名古屋大学, 情報科学研究科, 教授 (70185338)
|
研究分担者 |
竹内 義則 大同大学, 情報学部, 准教授 (60324464)
|
キーワード | 文字情報 / 飲食店メニュー / 品名と価格 / 投影歪み / 情報保障 / 視覚障害者支援 |
研究概要 |
本研究の目的は,身の回りに存在する看板・案内板,メニュー,商品の消費期限,ATM等の画面に表示された文字など,視覚障害者が日常生活で必要な文字情報の取得を可能とする,持ち運びできるシステムを研究・開発することである.今年度は,飲食店メニューの品名・価格抽出と,斜め方向からの撮影による歪み補正を研究した. 飲食店において,点字メニューの普及はまだ不十分であり,視覚障害者には,一人で飲食店に行きたい,予算に収まる商品を選ぶために価格を知りたい,という要望がある.そこで,飲食店メニューの品名・価格を抽出する方法を考案した.文字(品目・価格)が料理の写真などと重ならないシンプルなメニューに対しては,複数のフィルタリング処理で文字領域を抽出し,その領域にOCRを適用し文字情報を抽出する.文字が写真と重なっているメニューに対しては,SVMで抽出した通貨記号の色と同じ領域を抽出し,その領域に対して,シンプルなメニューと同様の処理を行う.文字が写真と重なっているメニュー4枚での実験では,完全一致の文字情報抽出率は16%,一部の間違いを許した場合の抽出率は55%であった. 斜め方向からの撮影による投影歪み,缶詰などの曲面に書かれた文字など,文字認識を困難にする歪みがある.開いた本をカメラで撮影した文書画像によくある湾曲・射影歪を除去する方法を考案した.これは,湾曲行の4次多項式近似,複比と消失点による縦方向の推定,行と縦方向により分割された各グリッドの射影変換行列の推定を経て,画像歪みを補正する.英語の文書画像30枚(5763単語),中国語/日本語文書画像10枚(3122文字)で実験し,OCRによる英語の単語認識率は91%,中国語/日本語の文字認識率は66%であった(補正無し画像での認識率はほぼゼロ).
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
平成24年度は,1)文字を含むシーン画像の収集,2) 文字情報の抽出とシステムの試作,3)評価実験,4)歪み検出・補正,5)音声対話インタフェース作成を計画した.1)として,飲食店メニュー画像,歪みのある文書画像などを収集した.2) では,文字が写真と重なっている飲食店メニューにある品名・価格の抽出手法を考案し,3)評価実験を行った.さらに,4)として,開いた本をカメラで撮影した文書画像によくある湾曲・射影歪を除去する方法を考案し,OCRを利用した実験により手法の有効性を確認した. 成果発表として,国際会議ICCHPでの発表1件,国内研究会での発表が4件であり,ウェブhttp://www.ohnishi.nuie.nagoya-u.ac.jp/For_Visually_Impaired_Peopleに,文書画像の湾曲・射影歪みの除去,飲食店メニュー読み上げシステムの成果を掲示した.
|
今後の研究の推進方策 |
最終年度の平成25年度には,最終システムの作製と人による評価実験を行う. 前年度の評価実験に基づく改良を加え,同時に文字情報の順位付け・歪み補正・音声対話の機能を組み込んだ最終システムを作製する.つぎに,最終システムを用いて,健常者・障害者による実験を実施し,結果を評価する. その成果を,国際会議や国内研究会で発表し,学術誌へ論文として投稿する.
|
次年度の研究費の使用計画 |
申請時の使用計画通りに,最終システムの作製,評価実験および成果発表で,研究費を有効に執行する.
|