2008 Fiscal Year Annual Research Report
階層型識別器を用いた高精度古文書文字認識とその応用
Project/Area Number |
20560389
|
Research Institution | Matsue National College of Technology |
Principal Investigator |
堀内 匡 Matsue National College of Technology, 電子制御工学科, 准教授 (50294129)
|
Co-Investigator(Kenkyū-buntansha) |
加藤 聡 松江工業高等専門学校, 情報工学科, 助教 (40342547)
|
Keywords | パターン認識 / 機械学習 / 古文書文字認識 / 古文書読解支援 |
Research Abstract |
本研究では,認識部を大分類部と細分類部に分けた階層的な識別器を用いた高精度の古文書文字認識を実現することを第一の目的とする.さらに,第二の目的として,上記で得られた認識手法を用いて,初心者が読解困難な文字に対する読みの候補文字を複数個提示することにより古文書読解を支援するシステムを構築する. 本年度は,本研究の第一目的である「階層型識別器を用いた高精度古文書文字認識の実現」に向けて,まず古文書翻刻支援システム開発プロジェクトが公開している古文書文字データベースHCDシリーズから多数の字種の古文書文字データを集めてデータセットを準備した.つぎに,大分類部に自己組織化マップ,細分類部に多層パーセプトロンのモジュール群を用意したモジュール型ニューラルネットワークによる階層型識別器を実現し,57字種に対して約95%という高い認識率を得られることを明らかにした.これらの成果に関しては,電気学会電子・情報・システム部門大会において成果発表を行なうとともに,投稿論文としてまとめ,現在査読中である.また,認識手法として,セルラニューラルネットワークおよびサポートベクターマシンを用いた古文書文字認識システムについても実現を試み,性能評価を開始した.これらの成果に関しては,電気・情報関連学会中国支部連合大会および電気学会全国大会などにおいて成果発表を行なった.さらに,本研究の第二目的である「古文書読解支援システムへの応用」に向けて,古文書読解支援システムのプロトタイプシステムについて検討し,実装を開始した.
|
Research Products
(5 results)