研究概要 |
人間の感性に基づく文字情報の認識・理解に関して,次の4つの観点から研究を進めた。 言語知識を利用した文字の理解に関して,今期は偏または旁の不明確な文字に対して,単語知識を援用することにより,どの程度の理解が可能となるかを定量的に解析した。その結果,偏が不明確な漢字を含むものの約95%が旁の情報だけから単語として理解できることが明らかになった。また,旁の下明確な漢字についても,その3/4が偏の形から単語として理解できることが明らかになった。 部首情報に着目した文字認識アルゴリズムについて検討した。今期は特に,偏と旁で構成される漢字に対して,その偏を認識し,旁を認識して漢字を理解するアルゴリズムを構築した。 漢字のもつストロ-クの直線性に着目して,Hough変換による漢字の特徴抽出と,それを利用した文字認識について検討した。今期は細線化パタ-ンの連続性に着目した,新しいHough変換手法を見い出した。 上記の2点については,3層の階層型ニュ-ラルネットワ-クとバックプロパゲ-ション学習法を用いることにより,従来のパタ-ン整合法に比べて,はるかに高い認識率を実現できることが明らかになった。 最後に,情景画像に含まれる文字列情報の抽出手法について検討した。今期は,粗い濃度階調画像に分割し,それぞれの階調画像に対して輪郭情報を求めることにより,かなり正確に文字列情報だけを抽出できることが判明した。
|