研究課題
平成15年度は、まず本プロジェクトで整備してきた古文書文字データベースを利用して、既存の日本語文字認識アルゴリズムの適用可能な範囲と問題点を洗い直し、以下の検討課題での研究をすすめた。(1)文字切り出し法、及び正規化法について:射影ヒストグラム、文字外形の曲率などの手法を検討し、レイアウト認識では、Hough変換による行抽出方式を提案し、実験した。(2)オフライン文字認識手法について:古文書文字認識に有効と考えられる文字切り出しと文字認識を連携処理させる方法について検討した。辞書パターンをセグメントする対象行に対して、切り出し及び認識を連携する方式の実験を行った。(3)オンライン文字認識手法について:くずし字検索等に適用可能なタブレット入力によるオンライン古文書文字認識手法について検討した。また、『くずし字解読辞典』の文字画像から筆順を推定する手法の研究を行った。(4)東京堂出版『くずし字用例辞典』の筆順データを入力し、オンライン検索ソフトウェアを開発した。(5)文字認識用文字パターン辞書として、『伏見屋善兵衛文書』本文に出現する各文字パターンの辞書を完成させて、公開した。(6)現在整備している古文書文字データベースを補完するために、東京堂出版『くずし字用例辞典』(1,300頁、収録文字数約13万文字)の電子化を行い、今年度は、くずし字用例見出し部についてのインデックス入力、大漢和コード、JISコード及び今昔文字鏡コードの付与を行った。以上の研究成果を、研究成果報告書(中間報告)『古文書翻刻支援システムの研究(3)』平成16年3月に発行した。
すべて その他
すべて 文献書誌 (3件)