1995 Fiscal Year Annual Research Report
オブジェクト指向設計による木版刷チベット文献の文字自動認識に関する研究
Project/Area Number |
07207222
|
Research Institution | Tohoku Institute of Technology |
Principal Investigator |
小島 正美 東北工業大学, 工学部, 助教授 (60085420)
|
Co-Investigator(Kenkyū-buntansha) |
川添 良幸 東北大学, 金属材料研究所, 教授 (30091672)
|
Keywords | チベット文字 / 木版刷 / 文字切り出し / 文字認識 / オブジェクト指向 / つながり文字 / 類似文字 / 仏典文献 |
Research Abstract |
本研究で認識対象とした文献は、デルゲ版チベット文献である。本文献は木版刷文献で文字同士が複雑に重なり合っている。現在、文字認識を行う一般的な手法として、1文字切り出しを行い、1文字切り出しを行った文字の辞書文字を作成し、作成した辞書文字とのユークリッド距離法により文字認識を行う。本文献のような木版刷文献の場合、1文字切り出しが、困難となる。木版刷チベット文献は総て同じような文字切り出し法が適応できるわけでなく、各文献の文字の特徴により、文字切り出し率が大きく異なることになる。 本研究では、まず「水流し法」によりデルゲ版チベット5.000文字に対しておよそ24%程度の1文字切り出し率しか得られていない。このことは、その他の76%の文字は繁がり文字であることを示している。さらに、木版刷チベット文字は、総ての文字が縦方向に切り出し不可能である。 すなわち、斜め方向に文字列が繁がっている。今後は、これらの複雑に繋がっている文字に対して、チベット文字の特徴を考慮したオブジェクト指向設計による高精度な1文字切り出し法を検討する必要がある。辞書文字を作成した530文字に対するユークリッド距離による認識率はおよそ96%であり、さらに、チベット活字においては、オープン実験でほぼ99%の認識率を得ているが、木版刷チベット文字はまだまだそこまでの認識率までいたっていない。そのために、誤認識する文字の特徴を抽出して、さらに高度な文字認識システムの構築を目指していきたい。
|
Research Products
(1 results)