• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

オブジェクト指向設計による木版刷チベット文献の文字自動認識に関する研究

研究課題

研究課題/領域番号 07207222
研究種目

重点領域研究

配分区分補助金
研究機関東北工業大学

研究代表者

小島 正美  東北工業大学, 工学部, 助教授 (60085420)

研究分担者 川添 良幸  東北大学, 金属材料研究所, 教授 (30091672)
研究期間 (年度) 1995 – 1996
研究課題ステータス 完了 (1995年度)
配分額 *注記
1,800千円 (直接経費: 1,800千円)
1995年度: 1,800千円 (直接経費: 1,800千円)
キーワードチベット文字 / 木版刷 / 文字切り出し / 文字認識 / オブジェクト指向 / つながり文字 / 類似文字 / 仏典文献
研究概要

本研究で認識対象とした文献は、デルゲ版チベット文献である。本文献は木版刷文献で文字同士が複雑に重なり合っている。現在、文字認識を行う一般的な手法として、1文字切り出しを行い、1文字切り出しを行った文字の辞書文字を作成し、作成した辞書文字とのユークリッド距離法により文字認識を行う。本文献のような木版刷文献の場合、1文字切り出しが、困難となる。木版刷チベット文献は総て同じような文字切り出し法が適応できるわけでなく、各文献の文字の特徴により、文字切り出し率が大きく異なることになる。
本研究では、まず「水流し法」によりデルゲ版チベット5.000文字に対しておよそ24%程度の1文字切り出し率しか得られていない。このことは、その他の76%の文字は繁がり文字であることを示している。さらに、木版刷チベット文字は、総ての文字が縦方向に切り出し不可能である。
すなわち、斜め方向に文字列が繁がっている。今後は、これらの複雑に繋がっている文字に対して、チベット文字の特徴を考慮したオブジェクト指向設計による高精度な1文字切り出し法を検討する必要がある。辞書文字を作成した530文字に対するユークリッド距離による認識率はおよそ96%であり、さらに、チベット活字においては、オープン実験でほぼ99%の認識率を得ているが、木版刷チベット文字はまだまだそこまでの認識率までいたっていない。そのために、誤認識する文字の特徴を抽出して、さらに高度な文字認識システムの構築を目指していきたい。

報告書

(1件)
  • 1995 実績報告書
  • 研究成果

    (1件)

すべて その他

すべて 文献書誌 (1件)

  • [文献書誌] 小島・布宮・川村・秋山・川添: "オブジェクト指向設計によるチベット活字辞書を用いた類似文字認識" 情報処理学会誌. 36. 2611-2621 (1995)

    • 関連する報告書
      1995 実績報告書

URL: 

公開日: 1995-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi