2010 Fiscal Year Annual Research Report
階層型識別器を用いた高精度古文書文字認識とその応用
Project/Area Number |
20560389
|
Research Institution | Matsue National College of Technology |
Principal Investigator |
堀内 匡 松江工業高等専門学校, 電子制御工学科, 准教授 (50294129)
|
Co-Investigator(Kenkyū-buntansha) |
加藤 聡 松江工業高等専門学校, 情報工学科, 講師 (40342547)
|
Keywords | パターン認識 / 機械学習 / 古文書文字認識 / 古文書読解支援 / サポートベクターマシン |
Research Abstract |
本研究では,認識部を大分類部と細分類部に分けた階層的な識別器を用いた高精度の古文書文字認識を実現することを第一の目的とする.さらに,第二の目的として,上記で得られた認識手法を用いて,初心者が読解困難な文字に対する読みの候補文字を複数個提示することにより古文書読解を支援するシステムを構築する. 本年度は,1)古文書読解支援システムの改良と評価,2)古文書文字認識手法の改良と評価,の二つの項目について研究を実施した.まず,古文書読解支援システムの改良と評価においては,昨年度に試作した古文書読解支援システムのプロトタイプシステムに対して,処理の高速化を図るとともに,ユーザによる評価実験を実施した.ユーザが読むことが困難な文字として選択した文字に対するシステムの正答率は約83%であった.これは,古文書文字の個別認識実験における正答率に比べると低下しているが,ユーザがマウスを用いて文字の範囲を選択しており,前後の文字がつながっている文字が多いことなどを考慮すると,一定の有効性が確認できたといえる.また,古文書文字認識手法の改良においては,サポートベクターマシンを用いた認識手法に関して,パス追跡アルゴリズムに基づく新しいパラメータ選択手法を提案し,計算時間の短縮を実現した.これらの成果に関して,計測自動制御学会中国支部学術講演会などにおいて成果発表を行なうとともに,学術論文としてまとめ,国際雑誌International Journal of Innovative Computing, Information and Controlに投稿し,採録となった
|
Research Products
(3 results)