• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

古文書の文字認識に向けて-くずし字画像からの筆順推定と認識辞書の作成-

研究課題

研究課題/領域番号 16700112
研究種目

若手研究(B)

配分区分補助金
研究分野 メディア情報学・データベース
研究機関大阪市立大学

研究代表者

安倍 広多  大阪市立大学, 大学院創造都市研究科, 助教授 (40291603)

研究期間 (年度) 2004 – 2005
研究課題ステータス 完了 (2005年度)
配分額 *注記
2,200千円 (直接経費: 2,200千円)
2005年度: 1,100千円 (直接経費: 1,100千円)
2004年度: 1,100千円 (直接経費: 1,100千円)
キーワードくずし字 / 文字認識 / ストローク抽出 / 古文書 / 筆順推定 / オフライン文字認識
研究概要

平成17年度は,2値化された毛筆文字画像から筆の軌跡(ストローク)を抽出する新しいアルゴリズムを開発した.アルゴリズムの詳細は[1]で発表している.本研究の貢献には以下のものがあげられる.
-毛筆文字画像から筆の中心が通過したことが確実な領域と、そうでない領域(交点や接触点を含む領域)を分離する手法を開発したこと.領域の判別は,新たに考案した角度距離グラフ(各黒ピクセル中心から,周囲360度方向に対して白ピクセルが現れる距離を測定し,これをX軸に角度、Y軸に距離としてプロットしたもの)を用いて行う.角度距離グラフは,交差部分の判定や,ストロークの直線性などを容易に判定できる,優れたツールであると考えている.
-交点や接触点を含む領域の内部で,筆の中心がどのように動いたかを推定することは困難であったが,これを計算幾何学的手法により推定する方法を考案したこと.
-筆文字でよく見られる折り返し(筆の動きが一旦停止し,その後逆方向に動くこと)を考慮したストローク抽出方法を提案したこと.
-ある文字を描くために考えられるストロークの組み合わせ方は非常に多いため,すべての組み合わせを計算することは事実上困難であるが,これを実用的な計算量で推定する方式を考案したこと.
提案手法を「くずし字解読辞典」(東京堂出版)から抽出した40文字の画像に適用した結果,ストローク抽出結果第1位での正答率は80%、第10位までの累積正解率は95%程度となった.これは,問題の困難さを考えると悪くない結果である.また,評価関数を見直すことで,より高い正解率が得られると考えている.今後,ストローク同士のつながり方(筆順)推定を組み込み,ストローク辞書を作成することで,筆文字のオフライン文字認識へと向けた努力を行う予定である.
[1]安倍広多,柴山守."計算幾何学を用いた毛筆文字画像からのストローク抽出"信学技報,Vol.105,No.615,pp.73-78,(2006-2).(PRMU2005-214)

報告書

(2件)
  • 2005 実績報告書
  • 2004 実績報告書
  • 研究成果

    (1件)

すべて 2006

すべて 雑誌論文 (1件)

  • [雑誌論文] 計算幾何学を用いた毛筆文字画像からのストローク抽出2006

    • 著者名/発表者名
      安倍広多, 柴山守
    • 雑誌名

      電子情報通信学会技術研究報告 Vol.105, No.615

      ページ: 73-78

    • NAID

      110004662930

    • 関連する報告書
      2005 実績報告書

URL: 

公開日: 2004-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi