1994 Fiscal Year Annual Research Report
Project/Area Number |
06680382
|
Research Institution | Tohoku Institute of Technology |
Principal Investigator |
小島 正美 東北工業大学, 工学部, 助教授 (60085420)
|
Co-Investigator(Kenkyū-buntansha) |
川添 良幸 東北大学, 金属材料研究所, 教授 (30091672)
|
Keywords | 木版刷 / チベット文字 / 文字自動認識 / オブジェクト指向文字辞書 / 仏典文献 / 類似文字 / 潰れ文字 / 繋り文字 |
Research Abstract |
平成6年度は、初期の研究目的である木版刷文献からの文字切り出しの高精度化を重点的に行った。初めに木版刷チベット文献を、文節毎にイメージデータとしておよそ1万文字データ分を保存した。その場合、文節毎に文字列の傾きが異なるので、切り出した文節毎にチベット文字の特徴である横棒(MHL:Main Horizontal Lineと呼んでいる)に注目して、傾き補正を行った。切り出された文節データから1文字切り出しを行った。従来の縦方向の射影により空白を検出する単純な切り出しでは、認識対象5、000文字に対しておよそ5%の切り出し率しか得られない。そこで、斜め方向の切り出し方法を行なうことによりおよそ25%の切り出し率を得、さらに繋がり文字に対しては繋がり文字の特徴検出を行い、その特徴に合わせた切り出しを行なうことにより,およそ70%の切り出し率を実現している。切り出し失敗は文字が複数個繋がり、繋がっている文字自体が潰れ文字、掠れ文字であるために起きている。それらの文字に対して、文字列としての特徴検出を行うことにより、切り出し率90%を目指している。木版刷チベット文献中の基本30子音からなるクローズデータ199サンプルについて、クローズデータを基にして作成した辞書文字とのユークリッド距離による重ね合わせ法により、認識率はおよそ97%を得ている。誤認識した文字は「ba」と「pa]の様に類似した文字である。これらの類似文字に対して、オブジェクト指向による類似辞書文字を作成し認識実験を行うことにより,認識率向上の見通しを得ている。これらについては,平成6年度第4回情報処理学会東北支部研究会('95 3)において「オブジェクト指向設計法による木版刷チベット類似文字認識について」という演題で発表した。
|
Research Products
(1 results)