• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

古文書文字認識システムの高精度化に関する研究

研究課題

研究課題/領域番号 14380184
研究種目

基盤研究(B)

配分区分補助金
応募区分一般
研究分野 情報システム学(含情報図書館学)
研究機関京都大学 (2003-2004)
国際日本文化研究センター (2002)

研究代表者

柴山 守 (2003-2004)  京都大学, 東南アジア研究所, 教授 (10162645)

笠谷 和比古 (2002)  国際日本文化研究センター, 研究部, 教授 (90124198)

研究分担者 加藤 寧  東北大学, 大学院・情報科学研究科, 教授 (00236168)
山田 奨治  国際日本文化研究センター, 研究部, 助教授 (20248751)
川口 洋  帝塚山大学, 経営情報学部, 教授 (80224749)
原 正一郎  国文学研究資料館, 研究情報部, 助教授 (50218616)
並木 美太郎  東京農工大学, 工学部, 助教授 (10208077)
柴山 守  大阪市立大学, 学術情報総合センター, 教授 (10162645)
石谷 康人  (株)東芝, 研究開発センター, 研究主務
梅田 三千雄  大阪電気通信大学, 総合情報学部, 教授 (30213490)
研究期間 (年度) 2002 – 2004
研究課題ステータス 完了 (2004年度)
配分額 *注記
12,000千円 (直接経費: 12,000千円)
2004年度: 4,700千円 (直接経費: 4,700千円)
2003年度: 4,700千円 (直接経費: 4,700千円)
2002年度: 2,600千円 (直接経費: 2,600千円)
キーワード古文書 / 文字認識 / 手書きOCR / 文字認識辞書
研究概要

本研究は、古文書翻刻支援システム開発プロジェクト(HCRプロジェクト)において、手書き文字OCR技術などを発展的に応用して、古文書文字認識システムの高精度化に関する研究を行うことである。
平成14-16年度の研究期間において、主に古文書文字データベースを構築すること、及び日本語文字認識アルゴリズムの適用可能な範囲と問題点を洗い直し、以下の検討課題での研究をすすめ、成果を挙げた。
(1)文字切り出し法、及び正規化法について:射影ヒストグラム、文字外形の曲率などの手法を検討し、レイアウト認識では、Hough変換による行抽出方式を提案し、文字データベースの基づく実験を進めた。
(2)オフライン文字認識手法について:古文書文字認識に有効と考えられる文字切り出しと文字認識を連携処理させる方法について検討した。非線形正規化手法の研究及び実験を行った。
(3)オンライン文字認識手法について:くずし字検索等に適用可能なタブレット入力によるオンライン古文書文字認識手法について検討した。また、『くずし字解読辞典』の文字画像から筆順を推定する手法の研究を行った。本成果は、電子くずし字辞典として平成17年度中に刊行する予定である。
(4)東京堂出版『漢字くずし方辞典』の文字パターンを入力し、オンライン検索ソフトウェアの開発を行った。これも上記の(3)に含め、刊行予定である。
(5)文字認識用文字パターン辞書として、9種類の古文書文字データベースを公開した。すべてがHCRプロジェクトのホームページは,http//www.nichibun.ac.jp/shoji/hcr/からダウンロード可能である。また、公開したソフトウェアは、2種類GetAMojiマクロ(古文書翻刻中に遭遇する不明文字(ゲタ文字)の正解候補を提示する機能)、及びWeb版GetAMoji(古文書翻刻中に遭遇する不明文字(ゲタ文字)の正解候補を提示する機能のWeb版)である。

報告書

(4件)
  • 2004 実績報告書   研究成果報告書概要
  • 2003 実績報告書
  • 2002 実績報告書
  • 研究成果

    (23件)

すべて 2005 2004 2003 2002 その他

すべて 雑誌論文 (14件) 文献書誌 (9件)

  • [雑誌論文] A Nonlinear Shape Normalization Method for Holistic Recognition of Japanese Historical String2005

    • 著者名/発表者名
      H.Nakayama, Y.Waizumi, Nei.Kato, Mamoru.Shibayama
    • 雑誌名

      Journal of International Journal on Document Analysis and Recognition (printing)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] A Nonlinear Shape Normalization Method for Holistic Recognition of Japanese Historical String2005

    • 著者名/発表者名
      H.Nakayama, Y.Waizumi, Nei.Kato, Mamoru Shibayama
    • 雑誌名

      Journal of International Journal on Document Analysis and Recognition (in printing)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] A Nonlinear Shape Normalization Method for Holistic Recognition of Japanese Historical String2005

    • 著者名/発表者名
      H.Nakayama, Y.Waizumi, Nei Kato, Mamoru Shibayamaほか
    • 雑誌名

      Journal of International Journal on Document Analysis and Recognition (印刷中)

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] 古文書におけるHough変換を用いた行抽出手法の提案2004

    • 著者名/発表者名
      松本隆一, 増田好克, 柴山守
    • 雑誌名

      平成16年度電気学会全国大会講演論文集

      ページ: 109-110

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] 非線形正規化を応用した学習パターン生成による手書き文字認識2003

    • 著者名/発表者名
      和泉勇治, 海老澤則之, 加藤 寧, 根本義章
    • 雑誌名

      電子情報通信学会論文誌 J86-D-II, 10

      ページ: 1391-1399

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] 文字切出しを前提としない古文書標題認識2003

    • 著者名/発表者名
      近藤博人, 松本隆一, 柴山 守, 山田奨治
    • 雑誌名

      情報処理学会研究報告2003-CH-57 Vol.2003, No.5

      ページ: 1-8

    • NAID

      110002911087

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] Handwritten Character Recognition based on Learning Pattern Generation by Applying Non Linear Normalization2003

    • 著者名/発表者名
      Yuji Waizumi, Noriyuki Ebisawa, Nei Kato
    • 雑誌名

      Transaction of IEICE J86-D-II, 10

      ページ: 1391-1399

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] Development of "Electronic Kuzushiji Dictionary" with the Function of Similar Character Retrieval2003

    • 著者名/発表者名
      Shoji Yamada, Yuji Waizumi, Nei Kato, Mamoru Shibayama
    • 雑誌名

      SIG Report of IPSJ 2002-CH-54 Vol.2002, No.3

      ページ: 43-50

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] Historical Character Recognition without Character Segmentation2003

    • 著者名/発表者名
      Hiroto Kondo, Ryuichi Matsumoto, Mamoru Shibayama
    • 雑誌名

      SIG Report of IPSJ Vol.2003, No.5

      ページ: 1-8

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] 古文書を対象にした文字認識の研究2002

    • 著者名/発表者名
      山田奨治, 柴山 守
    • 雑誌名

      情報処理 Vol.43, No.9

      ページ: 950-955

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] 認識処理を援用した文字切り出しによる古文書キャラクタスポッティング2002

    • 著者名/発表者名
      梅田三千雄, 橋本智広
    • 雑誌名

      電気学会論文誌 Vol.122, No.11

      ページ: 1876-1884

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] 類似文字検索機能をそなえた電子くずし字辞典の開発2002

    • 著者名/発表者名
      山田奨治, 和泉勇治, 加藤 寧, 柴山 守
    • 雑誌名

      情報処理学会研究報告2002-CH-54 Vol.2002, No.3

      ページ: 43-50

    • NAID

      110002930169

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] Study on Character Recognition for Historical Document2002

    • 著者名/発表者名
      Shoji Yamada, Mamoru Shibayama
    • 雑誌名

      Information Processing Vol.43, No.9

      ページ: 950-955

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] Character Spotting for Historical Document based on Character Segmentation using Recognition Technology2002

    • 著者名/発表者名
      Michio Umeda, Tomohiro Hashimoto
    • 雑誌名

      Transaction of Electric Society of Japan Vol.122, No.11

      ページ: 1876-1884

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [文献書誌] 和泉勇治, 加藤 寧ほか: "非線形正規化を応用した学習パターン生成による手書き文字認識"電子情報通信学会論文誌. J86-D-II, 10. 1391-1399 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 山田 奨治, 柴山 守: "n-gramとOCRによる定型表現がある古文書文字の推定"情報処理学会研究報告. 2003,59. 17-24 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 松本隆一, 増田好克, 柴山 守: "古文書におけるHough変換を用いた行抽出手法の提案"平成16年度電気学会全国大会講演論文集. 109-109 (2004)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 山田奨治, 柴山守: "古文書を対象にした文字認識の研究"情報処理. 43・9. 950-955 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 山田奨冶, 和泉勇治, 加藤寧ほか: "類似文字検索機能をそなえた電子くずし字辞典の開発"情報処理学会研究報告. 2002・5. 43-50 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 近藤博人, 柴山守ほか: "文字切出しを前提としない古文書標題認識"情報処理学会研究報告. 2003・5. 1-8 (2003)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 安倍広多, 柴山守ほか: "『くずし字解読辞典』文字画像からの筆順抽出の試み"大阪市立大学学術情報総合センター紀要. 4. 19-23 (2003)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 篠原早苗, 加藤寧ほか: "SVMを用いた手書き文字認識における学習データ選択と認識精度に関する一考察"電子情報通信学会技術研究報告. 102・708. 81-86 (2003)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 川口洋: "『江戸時代における人口分析システム(DANJUR0 ver.20)』の構築・運用・利用"帝塚山大学学術論集. 9. 1-27 (2002)

    • 関連する報告書
      2002 実績報告書

URL: 

公開日: 2002-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi