研究課題/領域番号 |
08558032
|
研究機関 | 豊田工業高等専門学校 |
研究代表者 |
野澤 繁之 豊田工業高等専門学校, 情報工学科, 教授 (10043184)
|
研究分担者 |
岡部 直木 豊田工業高等専門学校, 情報工学科, 教授 (90109273)
竹下 鉄夫 豊田工業高等専門学校, 情報工学科, 教授 (20149933)
|
キーワード | 文字認識 / パターン認識 / 筆者認識 / 筆者識別 / 手書き文字 / 文字ベータベース |
研究概要 |
本研究の目的は、筆記者が、記入の制約を受けることなく記入した文字をデータとして多数集め、筆者認識や筆者識別の研究者に提供すると共に、そのデータを用いて筆者認識の研究を行うことを目的としている。 上記の目的に従って、以下の研究実績を得た。 1.従来、研究に必要な手書き文字データの収集には、名古屋大学大型計算機センターの画像入力装置を利用していたが、研究室で手軽に文字データを収集することを目的として、高性能パソコン、画像入力用スキャナー、大容量磁気ディスク装置を利用して、手書き文字データ収集システムを野澤・竹下研究室に作成した。 2.筆記者が、記入の制約を受けることなく書いた文字は、記入枠をはみ出すことがしばしばある。これを画像データから個々の文字データとして切り出し、実験的に利用可能なデータとするためには、多くの困難を伴う。今回の研究で、市販のA4版大の400字詰め原稿用紙に記入された文字を、90%前後の精度で切り出すアルゴリズムの開発、切り出しに利用できるようにした。 3.豊田高専の学生が書いた報告書の中から、筆記者10名を選択、各筆記者が約1年の間に亘って書いた10回分の報告書を上記切り出しアルゴリズムを利用してディジタルデータ化した。 4.ディジタル化したデータは、A4版大400字×160=64,000文字からなり、主として平仮名と漢字である。ほんの一部カタカナも含まれる。この文字データは文脈のある報告書の中から抽出されたものあり、筆記者が筆記の制約を受けて書いたものではない。従って、これらの文字には筆記者の個人性が損なわれることなく含まれていると考えてよく、筆者認識は筆者識別の研究に有効に利用することができる。
|