2015 Fiscal Year Research-status Report
曲がった文字列も対応可能な実環境文字列認識方法の開発
Project/Area Number |
15K00258
|
Research Institution | Sasebo National College of Technology |
Principal Investigator |
志久 修 佐世保工業高等専門学校, その他部局等, 教授 (00235516)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 文字認識 / 傾き補正 / 単文字 |
Outline of Annual Research Achievements |
本研究では、歪んだり曲がっていたりする文字列を高精度に認識する技術の開発を目的とする。今年度は、傾いた文字を、単文字の形状だけを用いて補正する方法の性能評価を行った。認識方法として方向線素特徴量と部分空間法を用いた方法(方法1)、畳み込みニューラルネットワークを用いた方法(方法2)を採用した。学習する傾き文字は、文字フォントから作った文字画像に対し、いくつかの角度で傾斜を与えたものを用いた。評価用には、同じフォントを異なるサイズで画像化し、異なる角度で傾斜させたものを用いた。方法1では学習用文字画像に対し、傾き補正ありとなしの場合で、それぞれ方向線素特徴の抽出および部分空間法の認識辞書作成(主成分分析による認識用辞書の作成)を行った。方法2では傾き補正ありとなしの場合で、それぞれの文字画像を学習させた。実験の結果、方法1および方法2の両方法ともに、傾き補正をしたほうが認識性能が上がることが分かった。現在は、カメラで撮影した実際の傾き画像に対しても上記2方法を用いて比較実験を行っている。現時点で定量的なデータ整理が終わっていないが、前述の基礎実験の結果と同様に、傾き補正を行うほうが認識精度が良くなることを確認している。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
近年画像認識の分野で畳み込みニューラルネットワークが盛んに研究されている。そのため本研究においても、当初予定した従来の文字認識方法(方向線素特徴+部分空間法)による評価だけではなく、新たに畳み込みニューラルネットワークを用いた評価も行った。そのため、若干研究の進捗が遅れているが、新たな知見も得られた。
|
Strategy for Future Research Activity |
現在行っている単文字での評価を終わらせ、文字列全体の形状を用いた補正についての性能評価を実施する。
|
Causes of Carryover |
畳み込みニューラルネットワークを用いた実験を行うためにGPU搭載のパーソナルコンピュータを複数台購入する計画だったが、生産待ちのために購入できなかったため。
|
Expenditure Plan for Carryover Budget |
次年度に本年度購入する予定だったパソコンを購入する。
|
Research Products
(4 results)