研究課題/領域番号 |
09041129
|
研究機関 | 広島市立大学 |
研究代表者 |
|
研究分担者 |
BENREJEB Moh University of Tunis II. ENTT, 教授
佐野 学 広島市立大学, 情報科学部, 教授 (10092785)
|
キーワード | アラビア語 / 文字認識 / 手書き文字 / 印刷文字 / ファジィ論理 / ニューラルネットワーク / 構造的アプローチ / ハイブリッド方法 |
研究概要 |
オンラインアラビア文字を用いて認識を行った。方法としては、ファイルから習得した文字の座標値を配列に置き換えて、その配列をフリーマンコードに変換する。オンライン方式では、文字の書き順が重要視されるので、フリーマンコードは認識を行う上で必要不可欠な情報である。ここでフリーマンコード法則に従って圧縮方を行った。フリーマンコードも認識の一つの方法であるが、他には、文字の特徴を利用する方法がある。ここでは、文字を書く時にペンを離した回数を用いる。何故この特徴を利用するかのというと、アラビア文字は28文字あり、そのうち15文字はドットが存在する。一筆で書ける文字は10文字しかない。以上で述べた事から分かるように、書く時にペンを離す文字が多いからである。その特徴より、アラビア28文字を4パターンに分けることができた。さらには、文字を認識するのに必要不可欠なデータとして、アラビア文字には、どのような特徴があるのか、以下の項目に述べたことも考えられる。文字は一本又はそれ以上の線で構成されており、それぞれの線はまっすぐだったり曲がっていたりしている。文字から得られる情報としては、 (1)何本の線(セグメント、ドット)で構成されているか。(2)文字にループが存在するか。 (3)領域のうちどこから書き始められ、どこで書き終わっているか。(4)ドットはあるか、いくつ存在するか。文字全体でみると、上中下のどの位置にあるか。などが考えられる。この認識方法を使用し、アラビア文字に対して高い認識率を得られることはできた。
|