古文書の文字認識に向けて-くずし字画像からの筆順推定と認識辞書の作成-
Project/Area Number |
16700112
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Allocation Type | Single-year Grants |
Research Field |
Media informatics/Database
|
Research Institution | Osaka City University |
Principal Investigator |
安倍 広多 大阪市立大学, 大学院創造都市研究科, 助教授 (40291603)
|
Project Period (FY) |
2004 – 2005
|
Project Status |
Completed (Fiscal Year 2005)
|
Budget Amount *help |
¥2,200,000 (Direct Cost: ¥2,200,000)
Fiscal Year 2005: ¥1,100,000 (Direct Cost: ¥1,100,000)
Fiscal Year 2004: ¥1,100,000 (Direct Cost: ¥1,100,000)
|
Keywords | くずし字 / 文字認識 / ストローク抽出 / 古文書 / 筆順推定 / オフライン文字認識 |
Research Abstract |
平成17年度は,2値化された毛筆文字画像から筆の軌跡(ストローク)を抽出する新しいアルゴリズムを開発した.アルゴリズムの詳細は[1]で発表している.本研究の貢献には以下のものがあげられる. -毛筆文字画像から筆の中心が通過したことが確実な領域と、そうでない領域(交点や接触点を含む領域)を分離する手法を開発したこと.領域の判別は,新たに考案した角度距離グラフ(各黒ピクセル中心から,周囲360度方向に対して白ピクセルが現れる距離を測定し,これをX軸に角度、Y軸に距離としてプロットしたもの)を用いて行う.角度距離グラフは,交差部分の判定や,ストロークの直線性などを容易に判定できる,優れたツールであると考えている. -交点や接触点を含む領域の内部で,筆の中心がどのように動いたかを推定することは困難であったが,これを計算幾何学的手法により推定する方法を考案したこと. -筆文字でよく見られる折り返し(筆の動きが一旦停止し,その後逆方向に動くこと)を考慮したストローク抽出方法を提案したこと. -ある文字を描くために考えられるストロークの組み合わせ方は非常に多いため,すべての組み合わせを計算することは事実上困難であるが,これを実用的な計算量で推定する方式を考案したこと. 提案手法を「くずし字解読辞典」(東京堂出版)から抽出した40文字の画像に適用した結果,ストローク抽出結果第1位での正答率は80%、第10位までの累積正解率は95%程度となった.これは,問題の困難さを考えると悪くない結果である.また,評価関数を見直すことで,より高い正解率が得られると考えている.今後,ストローク同士のつながり方(筆順)推定を組み込み,ストローク辞書を作成することで,筆文字のオフライン文字認識へと向けた努力を行う予定である. [1]安倍広多,柴山守."計算幾何学を用いた毛筆文字画像からのストローク抽出"信学技報,Vol.105,No.615,pp.73-78,(2006-2).(PRMU2005-214)
|
Report
(2 results)
Research Products
(1 results)