• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

木版刷チベット文献の文字自動認識に関する研究

研究課題

研究課題/領域番号 06680382
研究種目

一般研究(C)

配分区分補助金
研究分野 情報システム学(含情報図書館学)
研究機関東北工業大学

研究代表者

小島 正美  東北工業大学, 工学部, 助教授 (60085420)

研究分担者 川添 良幸  東北大学, 金属材料研究所, 教授 (30091672)
研究期間 (年度) 1994 – 1995
研究課題ステータス 完了 (1995年度)
配分額 *注記
2,000千円 (直接経費: 2,000千円)
1995年度: 700千円 (直接経費: 700千円)
1994年度: 1,300千円 (直接経費: 1,300千円)
キーワード木版刷 / チベット文字 / 文字認識 / オブジェクト指向設計 / 差分重み付ユークリッド距離 / 類似文字 / つながり文字 / 仏典文献 / 文字自動認識 / オブジェクト指向文字辞書 / 潰れ文字 / 繋り文字
研究概要

本研究では認識対象とした文献は、デルゲ版チベット文献である。本文献は木版刷文献の中でも文字同士が大変複雑に繋がっている。そのため今回用いた「水流し法」により孤立している文字の切り出しを行い、繋がっている文字に対しては、繋がり文字の特徴を抽出してその特徴に合わせた文字切り出しを行なうことにより、およそ70%の文字切り出しまでしか実現できなかった。認識精度の向上には、高精度な1文字切り出しが要求されている。木版刷チベット文献の文字切り出しを行なう場合、元の文献は大変重要な文献である場合が多く、書庫に厳重に保存されている場合が多い。そのため予めコピーされた文献を認識実験に使用する場合がほとんどである。この場合、当然のことながらコピーの善し悪しが文字切り出し率に影響してくることになる.原典を損なわないようにいかにコンピュータへデータを取込むかが今後の課題と言える.
認識実験においては、活字チベット文献で、アナログ辞書文字とサンプル(認識対象)文字とのユークリッド距離を算出して第1位候補文字と第2位候補文字との距離が実験で定めた値以上の場合は、第1位候補文字を認識文字とする。第1位候補文字と第2位候補文字以降との距離が実験で定めた値以内に接近している場合は、これらの文字群は総て類似文字であると判定し、候補文字のアナログ辞書同士の差分を取り、新たに差分重み付ユークリッド距離を求め、距離がもっとも近いアナログ辞書文字を候補文字とする我々が開発した「差分重み付ユークリッド距離法」を適用することにより、10、000文字に対して99%の認識率を得ている。本手法は予め類似文字を選定せず、文字自身が類似文字であることを判定してい行なう手法で、本手法を同様に木版刷チベット文献に530クローズデータに適用し96%の認識率を得ている。現在、オープン実験への適用を行なっている。

報告書

(3件)
  • 1995 実績報告書   研究成果報告書概要
  • 1994 実績報告書
  • 研究成果

    (5件)

すべて その他

すべて 文献書誌 (5件)

  • [文献書誌] 小島正美,布宮千夏子,川村隆庸,秋山庸子,川添良幸: "オブジェクト指向設計によるチベット活字辞書を用いた類似文字認識" 情報処理学会論文誌. 36. 2611-2621 (1995)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1995 研究成果報告書概要
  • [文献書誌] Masami Kojima,Yoshiyuki Kawazoe,Masayuki Kimura: "Automatic Tibetan Script Recognition by Computer" 7th Seminar of the International Association for Tibetan Stadies. (1997)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1995 研究成果報告書概要
  • [文献書誌] Masami Kojima, Chikako Nunomiya, Takanobu Kawamula, Youko Akiyama and Yoshiyuki Kawazoe: "Recognition of Similar Characters by Using Object Oriented Designed Printed Tibetan Dictionary" Journal of IPSI. vol.36, No11. 2611-2621 (1995)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1995 研究成果報告書概要
  • [文献書誌] 小島・布宮・川村・秋山・川添: "オブジェクト指向設計によるチベット活字辞書を用いた類似文字認識" 情報処理学会誌. 36. 2611-2621 (1995)

    • 関連する報告書
      1995 実績報告書
  • [文献書誌] 小島・布宮・川村・秋山・川添: "オブジェクト指向設計によるチベット活字辞書を用いた類似文字認識" 情報処理学会誌. (掲載予定). (1995)

    • 関連する報告書
      1994 実績報告書

URL: 

公開日: 1994-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi