テキストを手がかりとした環境映像の検索-ディジタル・フラッシュバック-
Project/Area Number |
17700198
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Allocation Type | Single-year Grants |
Research Field |
Perception information processing/Intelligent robotics
|
Research Institution | Kyushu University |
Principal Investigator |
内田 誠一 九州大学, 大学院システム情報科学研究院, 助教授 (70315125)
|
Project Period (FY) |
2005 – 2006
|
Project Status |
Completed (Fiscal Year 2006)
|
Budget Amount *help |
¥3,500,000 (Direct Cost: ¥3,500,000)
Fiscal Year 2006: ¥1,300,000 (Direct Cost: ¥1,300,000)
Fiscal Year 2005: ¥2,200,000 (Direct Cost: ¥2,200,000)
|
Keywords | 実環境文字認識 / 動的計画法 / ビデオカメラ / マッチング |
Research Abstract |
本課題では、静止画像ではなく動画像を用いた文字列(テキスト)の認識を検討してきた。動画像の利用により認識できるテキストの長さの制約を排除できると考えられる。また動画像中のオーバーラップした領域を用いることにより、モザイキングにより生成されるテキスト画像の質の向上が期待できる。昨年度の検討により、モザイキングと文字認識を同時に行うという基本アルゴリズム(mosaicing-by-recognition)を確立した。ただし、撮影中の手ぶれにより文字が射影変換などの幾何変形を受けること、スキャナに比べて低解像度画像となること、さらに画像からの文字行の切り出し(セグメンテーション)を検討する必要があった。 最終年度である今年度は、基本アルゴリズムの性能向上を目指し、撮影時に様々な劣化を受けた文字(スキャナによって取得される従来の文字パターンに対照して「実環境文字」と呼ばれる)を如何に認識するかに重点を置き、様々な角度から検討を行った。すなわち、本手法は実環境文字認識処理を内包しており、その巧拙がモザイキングを含めた全体のパフォーマンスを左右する。そこで、実環境文字の幾何変換への対応、セグメンテーションの問題、解像度の問題を解決するための幾つかの試みを行った。特筆すべきは幾何変形下でも可読となるように文字自身に工夫を施しておくという試みである。OCRフォントの現代版とも言えるこの試みは成功裏に終了し、評価実験によりその有効性(強い射影変換を受けた英大文字234サンプル中233を正答)を実証した。 以上の結果は様々な国際会議、学術誌において公表済みもしくは公表予定である。また、昨年度までに検討してきた基本アルゴリズムについては、当該分野で評価の高い国際学術誌「Pattern Recognition」に投稿済みであり、現在(ほとんど語句訂正程度の)条件付採録となっている。
|
Report
(2 results)
Research Products
(12 results)