文書画像からの文字列の抽出と認識に関する研究

Research Project

Project/Area Number	09780367
Research Category	Grant-in-Aid for Encouragement of Young Scientists (A)
Allocation Type	Single-year Grants
Research Field	Intelligent informatics
Research Institution	Sasebo National College of Technology
Principal Investigator	志久修佐世保工業高等専門学校, 助教授 (00235516)
Project Period (FY)	1997 – 1998
Project Status	Completed (Fiscal Year 1998)
Budget Amount *help	¥2,100,000 (Direct Cost: ¥2,100,000) Fiscal Year 1998: ¥200,000 (Direct Cost: ¥200,000) Fiscal Year 1997: ¥1,900,000 (Direct Cost: ¥1,900,000)
Keywords	文書画像 / 文字列抽出 / 線分密度 / 文字列認識 / 2値画像
Research Abstract	本研究では,文字と図形が混在している2値画像の中から,様々な方向と大きさを持つ文字列を抽出する方法と,抽出した文字列の認識についての研究を行った. まず,文字列抽出では,「文字列とは短い線分が密集している領域である」と考え,(1)線分の密集具合を表す2種類の線分密度(局所的線分密度と大域的線分密度)の開発(高速計算法)と,(2)これらの線分密度を特徴量とした文字列抽出法の開発を行った.開発した文字列抽出法では,まず始めにラスタベクタ変換により,画像データを線分データに変換する.次に,得られた線分データから局所的線分密度(注目点を中心とする円形領域内に含まれる線分本数)を求め,局所的に線分が密集している領域を文字列候補領域として抽出する.そして,文字列候補領域内における大域的線分密度(任意の直線と交差する線分数)から,線分の分布形状を調べ,帯状に分布している線分を文字列にグループ化していく.これにより文字列のサイズや傾き,あるいは接触などの影響を受けずに,文字列の抽出が行える.住宅地図など28枚の画像(文字列数276)に対し実験を行った結果,文字列抽出率91.3%と良好な結果が得られた. 次に,文字列の認識では,手書き日本語文字列を対象として研究を行った.従来の文字列認識法では文字列からの個々の文字切出しと文字認識が行われる.しかし,文字同士の接触や入込みが生じた場合,文字の切出しが正確に行えないという問題がある.本研究で開発した方法は文字列全体を一つのユニットとみなして認識を行う.そのため,文字の切出しと認識は不要となるが,文字列全体の形状変形が大きくなるという問題が生じる.そこで,これらの変形吸収のため,図形間隔,図形幅,文字列サイズの3段階の正規化と,DPマッチングを採用した.1,655件の手書き日本語文字列の認識実験により,高い認識性能(96.5%)が得られた.

Report

(2 results)

1998 Annual Research Report
1997 Annual Research Report

Research Products
(8 results)

All Other

All Publications (8 results)

[Publications] 志久修: "パターン整合法による手書き文字列の分類実験" 電子情報通信学会論文誌. J80-D-II・5. 1326-1328 (1997)
- Related Report
  1998 Annual Research Report
[Publications] 志久修: "局所的および大域的な線分密度を用いた文字列抽出" 画像の認識・理解シンポジウム論文集. Vol I. I39-44 (1998)
- Related Report
  1998 Annual Research Report
[Publications] O.SHIKU: "A Method for Character String Extraction Using Local and Global Segment Crowdedness" Proceedings of 14th International Conference on Pattern Recognition. Vol.II. 1077-1080 (1998)
- Related Report
  1998 Annual Research Report
[Publications] 志久修: "画像処理による水槽中を泳ぐ魚の認識システムについて" 第12回情報処理学会九州支部研究会報告. 301-306 (1998)
- Related Report
  1998 Annual Research Report
[Publications] 志久修: "単語全体の形状に注目した手書き日本語単語の認識" 第13回情報処理学会九州支部研究会報告. 69-76 (1999)
- Related Report
  1998 Annual Research Report
[Publications] 志久修、中村彰、高比良秀彰、黒田英夫: "パターン整合法による手書き文字列の分類実験" 電子情報通信学会論文誌. Vol.J80-DII,5. 1326-1328 (1997)
- Related Report
  1997 Annual Research Report
[Publications] 田口嘉伸、志久修、中村彰、武富敬: "線分のハフ変換と画像分割による文字列抽出" 電気関係学会九州支部連合大会講演論文集. 70-70 (1997)
- Related Report
  1997 Annual Research Report
[Publications] 志久修、中村彰、滝川雄、田中美聖: "パターンマッチングによる手書き文字列認識" 電気関係学会九州支部連合大会講演論文集. 71-71 (1997)
- Related Report
  1997 Annual Research Report

文書画像からの文字列の抽出と認識に関する研究

Principal Investigator

志久 修 佐世保工業高等専門学校, 助教授 (00235516)

¥2,100,000 (Direct Cost: ¥2,100,000)

Report

Research Products

[Publications] 志久 修: "パターン整合法による手書き文字列の分類実験" 電子情報通信学会論文誌. J80-D-II・5. 1326-1328 (1997)

Related Report

[Publications] 志久 修: "局所的および大域的な線分密度を用いた文字列抽出" 画像の認識・理解シンポジウム論文集. Vol I. I39-44 (1998)

Related Report

[Publications] O.SHIKU: "A Method for Character String Extraction Using Local and Global Segment Crowdedness" Proceedings of 14th International Conference on Pattern Recognition. Vol.II. 1077-1080 (1998)

Related Report

[Publications] 志久 修: "画像処理による水槽中を泳ぐ魚の認識システムについて" 第12回情報処理学会九州支部研究会報告. 301-306 (1998)

Related Report

[Publications] 志久 修: "単語全体の形状に注目した手書き日本語単語の認識" 第13回情報処理学会九州支部研究会報告. 69-76 (1999)

Related Report

[Publications] 志久 修、中村 彰、高比良秀彰、黒田英夫: "パターン整合法による手書き文字列の分類実験" 電子情報通信学会論文誌. Vol.J80-DII,5. 1326-1328 (1997)

Related Report

[Publications] 田口嘉伸、志久 修、中村 彰、武富 敬: "線分のハフ変換と画像分割による文字列抽出" 電気関係学会九州支部連合大会講演論文集. 70-70 (1997)

Related Report

[Publications] 志久 修、中村 彰、滝川 雄、田中美聖: "パターンマッチングによる手書き文字列認識" 電気関係学会九州支部連合大会講演論文集. 71-71 (1997)

Related Report

志久修佐世保工業高等専門学校, 助教授 (00235516)

[Publications] 志久修: "パターン整合法による手書き文字列の分類実験" 電子情報通信学会論文誌. J80-D-II・5. 1326-1328 (1997)

[Publications] 志久修: "局所的および大域的な線分密度を用いた文字列抽出" 画像の認識・理解シンポジウム論文集. Vol I. I39-44 (1998)

[Publications] 志久修: "画像処理による水槽中を泳ぐ魚の認識システムについて" 第12回情報処理学会九州支部研究会報告. 301-306 (1998)

[Publications] 志久修: "単語全体の形状に注目した手書き日本語単語の認識" 第13回情報処理学会九州支部研究会報告. 69-76 (1999)

[Publications] 志久修、中村彰、高比良秀彰、黒田英夫: "パターン整合法による手書き文字列の分類実験" 電子情報通信学会論文誌. Vol.J80-DII,5. 1326-1328 (1997)

[Publications] 田口嘉伸、志久修、中村彰、武富敬: "線分のハフ変換と画像分割による文字列抽出" 電気関係学会九州支部連合大会講演論文集. 70-70 (1997)

[Publications] 志久修、中村彰、滝川雄、田中美聖: "パターンマッチングによる手書き文字列認識" 電気関係学会九州支部連合大会講演論文集. 71-71 (1997)