• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

古文書解読支援システムの開発と電子辞書技術の応用に関する研究

研究課題

研究課題/領域番号 12558037
研究種目

基盤研究(B)

配分区分補助金
応募区分展開研究
研究分野 情報システム学(含情報図書館学)
研究機関大阪市立大学

研究代表者

柴山 守  大阪市立大学, 学術情報総合センター, 教授 (10162645)

研究分担者 並木 美太郎  東京農工大学, 工学部, 助教授 (10208077)
原 正一郎  国文学研究資料館, 研究情報学部, 助教授 (50218616)
山田 奨治  国際日本文化研究センター, 研究部, 助教授 (20248751)
岩崎 宏之  常磐大学, コミュニティ振興学部, 教授 (50087904)
川口 洋  帝塚山大学, 経営情報学部, 助教授 (80224749)
研究期間 (年度) 2000 – 2002
研究課題ステータス 完了 (2002年度)
配分額 *注記
5,800千円 (直接経費: 5,800千円)
2002年度: 2,000千円 (直接経費: 2,000千円)
2001年度: 3,800千円 (直接経費: 3,800千円)
キーワード古文書認識 / 文字認識 / 辞書データベース / くずし字解読 / 電子辞書 / くずし文字解読 / 古文書解読支援
研究概要

本研究の目的は、歴史学・古文書学や文学の専門家が古文書解読を行う際に利用する"くずし字解読辞典"(ストローク(起筆順)索引による字形・用例抽出)、"くずし字用例辞典"(字形索引による用例抽出)をコンピュータ上に実装し、モバイル環境で利用可能な電子辞書の開発を行うこと、及び本研究の過程で得られる字形認識プロセスを別途科研費で進めている古文書翻刻支援システム(古文書OCR)の文字認識に直接応用しようとすることにある.研究期間において、以下に示す研究実績を上げた。
(1)"くずし字解読辞典"(ストローク(起筆順)索引による字形・用例抽出)の字形索引、及び熟語を1字毎に画像(スキャナー)入力し、"くずし字解読辞典"コード、"文字鏡"コード、シフトJISコードを付加した「くずし字辞書データベース」の構築を行った。
(2)上記の辞書を検索する類似文字検索機能を開発した。
(3)古文書翻刻支援システム(古文書OCR)に2-gram、3-gramを適用し、欠損文字の推定などにおいて、その有効性を確認した。
(4)古文書文字認識辞書の構築では、証文類古文書に標記される全文字を対象に、約24万文字の文字認識辞書を構築するため、文字切出しプログラムの開発、および文字選定作業を進めた。
(5)電子辞書の構築として、以下に示す古文書文字データベースHCDシリーズの第2版を作成した。
HCD2 借金証文標題行 伏見屋善兵衛文書 200行 1,378字 2値
HCD2a 借金証文標題行 伏見屋善兵衛文書 200行 1,378字 256階調
HCD2b 借金証文標題行 伏見屋善兵衛文書 200行 1,378字 24bitsカラー
HCD3 借金証文標題行 伏見屋善兵衛文書 183字種 4,933字 2値
(6)上記の辞書を使用して、標題行による古文書認識研究を進めた。あらかじめ標題行の各文字を切り出さずに、辞書に存在する文字パターンをテンプレートとするマッチング手法の研究を進めた。
(7)"くずし字解読辞典"(ストローク(起筆順)索引による字形・用例抽出)の「くずし字辞書データベース」から筆順を抽出し、推定する研究をすすめた。
なお、研究成果については、裏面の雑誌論文のほか、研究成果(中間)報告書「古文書翻刻支援システムの研究」(1)を平成12年3月に、同(2)を平成13年3月に刊行している。

報告書

(4件)
  • 2002 実績報告書   研究成果報告書概要
  • 2001 実績報告書
  • 2000 実績報告書
  • 研究成果

    (20件)

すべて その他

すべて 文献書誌 (20件)

  • [文献書誌] 山田奨治, 柴山 守他: "類似文字検索機能をそなえた電子くずし字辞典の開発"情報処理学会研究報告2002-CH-54. Vol.2002, No.23. 43-50 (2002)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] 山田奨治, 柴山 守他: "古文書を対象にした文字認識の研究"情報処理. Vol.43, No.9. 950-955 (2002)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] 近藤博人, 松本隆, 柴山 守, 山田奨治, 荒木義彦: "文字切出しを前提としない古文書標題認識"情報処理学会研究報告2003-CH-57. Vol.2003, No.5. 1-8 (2002)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] 安倍広多, 中塚麻記子, 柴山 守: "『くずし字解読辞典』文字画像からの筆順抽出の試み"大阪市立大学学術情報総合センター紀要. Vol.4. 19-23 (2003)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] Kota Abe, Makiko Nakatsuka, and Mamoru Shibayama: "An Attempt to Extract Stroke Order from Handwritten Cursive Japanese Character Image"Bulletin of Osaka City University Media Center. 14. (2003)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] Hirohito Kondo, Ryuichi Matsumoto, Mamoru Shiabayama, and Yoshihiko Araki: "Character Recognition without Segmentation for Title in Historical Document Images"IPSJ SIG-Report 2002. 57. 1-8 (2003)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] Shoji Yamada and Mamoru Shibayama: "Studies on Chracter Recognition for Historical Document"Information Processing. 43 No.9. 950-955 (2002)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] Shoji Yamada, Yuji Waizumi, Nei Kato, and Mamoru Shibayama: "Development of Digital Dictionary of Historical Characters with Search Function of Slimar Characters"IPSJ SIG-Report 2002. 54. 43-50 (2002)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] Shoji Yamada, Nei Kato, Mamoru Shibayama, and et al.: "Historical Character Recognition (HCR) Project Report (2)"IPSJ SIG-Report 2001. 50. 9-16 (2001)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] Koji OZAKI, Mamoru SHIBAYAMA, and Yoshihiko ARAKI: "Layout Recognition and Title Extraction for Historical Document Image"Proceedings of Symposium on Computer and the Humaniies, IPSJ. (2000)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] Shoji YAMADA, Mamoru SHIBAYAMA: "A study of a historical document research supporting system using n-gram"IPSJ Symposium Series. 2000, No.17. 185-192 (2000)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2002 研究成果報告書概要
  • [文献書誌] 山田奨治, 柴山 守他: "類似文字検索機能をそなえた電子くずし字辞典の開発"情報処理学会研究報告2002-CH-54. Vol.2002,No.23. 43-50 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 山田奨治, 柴山 守: "古文書を対象にした文字認識の研究"情報処理. Vol.43 No.9. 950-955 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 近藤博人, 松本隆一, 柴山 守, 山田奨治, 荒木義彦: "文字切出しを前提としない古文書標題認識"情報処理学会研究報告2003-CH-57. Vol.2003,No.5. 1-8 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 安倍広多, 中塚麻記子, 柴山 守: "『くずし字解読辞典』文字画像からの筆順抽出の試み"大阪市立大学学術情報総合センター紀要. Vol.4. 19-23 (2003)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 山田奨治, 柴山 守他: "類似文字検索機能をそなえた電子くずし字辞典の開発"情報処理学会研究報告 2002-CH-54.

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] 尾崎浩司,柴山守 他: "古文書画像のレイアウト認識を標題抽出"情報処理学会研究報告. 2000・67. 47-54 (2000)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] 山田奨治,柴山守: "n-gramによる古文書証文類翻刻支援の検討"人文科学とコンピュータシンポジウム2000論文集.

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] 尾崎浩司,柴山守 他: "古文書画像の標題文字セグメンテーション"人文科学をコンピュータシンポジウム2000論文集.

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] 柴山守: "証文類古文書標題の文字認識辞書構築とその利用について"京都大学大型計算機センター第67回研究セミナー. (2001)

    • 関連する報告書
      2000 実績報告書

URL: 

公開日: 2001-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi