1990 Fiscal Year Annual Research Report
Project/Area Number |
02680033
|
Research Institution | Osaka Electro-Communication University |
Principal Investigator |
梅田 三千雄 大阪電気通信大学, 工学部, 教授 (30213490)
|
Keywords | 文字認識 / 単語理解 / 部首理解 / Hough変換 / ニュ-ラルネットワ-ク / バックプロパゲ-ション / 情景理解 / 文字列抽出 |
Research Abstract |
人間の感性に基づく文字情報の認識・理解に関して,次の4つの観点から研究を進めた。 言語知識を利用した文字の理解に関して,今期は偏または旁の不明確な文字に対して,単語知識を援用することにより,どの程度の理解が可能となるかを定量的に解析した。その結果,偏が不明確な漢字を含むものの約95%が旁の情報だけから単語として理解できることが明らかになった。また,旁の下明確な漢字についても,その3/4が偏の形から単語として理解できることが明らかになった。 部首情報に着目した文字認識アルゴリズムについて検討した。今期は特に,偏と旁で構成される漢字に対して,その偏を認識し,旁を認識して漢字を理解するアルゴリズムを構築した。 漢字のもつストロ-クの直線性に着目して,Hough変換による漢字の特徴抽出と,それを利用した文字認識について検討した。今期は細線化パタ-ンの連続性に着目した,新しいHough変換手法を見い出した。 上記の2点については,3層の階層型ニュ-ラルネットワ-クとバックプロパゲ-ション学習法を用いることにより,従来のパタ-ン整合法に比べて,はるかに高い認識率を実現できることが明らかになった。 最後に,情景画像に含まれる文字列情報の抽出手法について検討した。今期は,粗い濃度階調画像に分割し,それぞれの階調画像に対して輪郭情報を求めることにより,かなり正確に文字列情報だけを抽出できることが判明した。
|