研究課題/領域番号 |
15K00258
|
研究機関 | 佐世保工業高等専門学校 |
研究代表者 |
志久 修 佐世保工業高等専門学校, その他部局等, 教授 (00235516)
|
研究期間 (年度) |
2015-04-01 – 2018-03-31
|
キーワード | 文字認識 / 傾き補正 / 単文字 |
研究実績の概要 |
本研究では、歪んだり曲がっていたりする文字列を高精度に認識する技術の開発を目的とする。今年度は、傾いた文字を、単文字の形状だけを用いて補正する方法の性能評価を行った。認識方法として方向線素特徴量と部分空間法を用いた方法(方法1)、畳み込みニューラルネットワークを用いた方法(方法2)を採用した。学習する傾き文字は、文字フォントから作った文字画像に対し、いくつかの角度で傾斜を与えたものを用いた。評価用には、同じフォントを異なるサイズで画像化し、異なる角度で傾斜させたものを用いた。方法1では学習用文字画像に対し、傾き補正ありとなしの場合で、それぞれ方向線素特徴の抽出および部分空間法の認識辞書作成(主成分分析による認識用辞書の作成)を行った。方法2では傾き補正ありとなしの場合で、それぞれの文字画像を学習させた。実験の結果、方法1および方法2の両方法ともに、傾き補正をしたほうが認識性能が上がることが分かった。現在は、カメラで撮影した実際の傾き画像に対しても上記2方法を用いて比較実験を行っている。現時点で定量的なデータ整理が終わっていないが、前述の基礎実験の結果と同様に、傾き補正を行うほうが認識精度が良くなることを確認している。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
近年画像認識の分野で畳み込みニューラルネットワークが盛んに研究されている。そのため本研究においても、当初予定した従来の文字認識方法(方向線素特徴+部分空間法)による評価だけではなく、新たに畳み込みニューラルネットワークを用いた評価も行った。そのため、若干研究の進捗が遅れているが、新たな知見も得られた。
|
今後の研究の推進方策 |
現在行っている単文字での評価を終わらせ、文字列全体の形状を用いた補正についての性能評価を実施する。
|
次年度使用額が生じた理由 |
畳み込みニューラルネットワークを用いた実験を行うためにGPU搭載のパーソナルコンピュータを複数台購入する計画だったが、生産待ちのために購入できなかったため。
|
次年度使用額の使用計画 |
次年度に本年度購入する予定だったパソコンを購入する。
|