パーソナルコンピュータ、欧文文字読取認識装置、イメージスキャナとで欧文ドキュメント読取認識システムを構築し、同システムの評価を行った。その結果、当初予想していた以上の認識率を得ることができたが、読み取ろうとする文書の印刷品質・読み取る際の角度等によって処理速度に大きな違いがでることが判明した。更に認識率・処理速度の向上を図るべくシステムの改善を行っている。特にパーソナルコンピュータのメモリー環境の改善を図り、手軽に且つ迅速にテキストデータベースを作成し得るシステムを目指している。 本システムにより、英語・ドイツ語で書かれた比較的コンパクトな論文・文学作品等の全文テキストデータベースを作成し、単語検索・分析を行うプログラムの開発を行ったが、今後各作品別のグロサリー、分野別のシソーラスを作成する。 本システムにより比較的コンパクトな英々辞典をデータベース化し、その活用方法を検討しているが、ワードプロセッサー等のアプリケーションプログラムに組み込む同義語辞典、スペルチェック辞典等に使用し得る可能性がある。 最近、大容量のデータを収納し得る光磁気ディスク装置やCD-ROM装置が廉価に提供されるようになり、電子出版が盛んになることが予想される、その際、データの作成には本研究で構築したようなシステムが必要不可欠になると思われる。
|