文字の視覚的特徴のニューラルネットを用いた自動抽出に関する研究

Research Project

Project/Area Number	04246222
Research Category	Grant-in-Aid for Scientific Research on Priority Areas
Allocation Type	Single-year Grants
Research Institution	Toyohashi University of Technology
Principal Investigator	吉田辰夫豊橋技術科学大学, 工学部, 教授 (40220652)
Project Period (FY)	1992
Project Status	Completed (Fiscal Year 1992)
Budget Amount *help	¥2,100,000 (Direct Cost: ¥2,100,000) Fiscal Year 1992: ¥2,100,000 (Direct Cost: ¥2,100,000)
Keywords	特徴抽出 / ニューラルネット / ネオコグニトロン / 文字認識 / 視覚認識機構
Research Abstract	視覚系が文字や図形を認知する過程で、どの様な特徴を識別の手掛かりとして用いるのかは、未だに解明されない問題である。生理学の知見によれば視覚系のニューロンには、最終段の認識細胞に到るまでの途中の段階では、特定の方位の線分に反応するもの以外は見出されていない。一方、心理学においては視覚系が、例えば十文字のような線分以外の特徴にも選択的に反応することが報告されている。本研究では、ニューラルネットに文字認識の機能を学習させた時、ニューロンがどのような特徴に反応するようになるのかを解析し、その結果に基づいて視覚認識機構の構成原理の検討を行なった。ニューラルネットには、視覚系の構造を最も忠実に模擬したモデルとして、ネオコグニトロンを採用した。4層のネオコグニトロンを構成し、英数字の認識を学習させた。学習は教師無し学習によって行なわれ、英数字の各文字を識別するのに必要な特徴が2層目と3層目のニューロンによって自動的に抽出される。 5種類の文字セットを用いて学習を行なった。ネットワーク中の各種のパラメータを最適に調整したところ、認識率は最終的に5種の学習文字セットについて97.1%に到達した。この時の特徴パターンを調べると、それぞれの文字中のかなり複雑な部分パターンが含まれていることが示された。次に、特徴を選び出す過程に、少数のカテゴリーにしか含まれない特徴は抽出しないというアルゴリズムを導入して改めて学習を行なったところ、線分のような簡単な特徴パターンのみが抽出されるようになり、この時、認識率への影響はあまり生じていないことが見出された。今後、ニューロンの受容野の大きさなどのパラメータを調整することにより、線分などの簡単な特徴のみを用いる視覚系と類似のパターン認識機構を構成し得るとの見通しを得た。

Report

(1 results)

1992 Annual Research Report