1999 年度実績報告書

知識主導型モデルを用いた次世代文書認識システムの構築

研究課題

研究課題/領域番号	11558043
研究種目	基盤研究(B)
研究機関	東北大学
研究代表者	加藤寧東北大学, 大学院・情報科学研究科, 助教授 (00236168)
研究分担者	鈴木雅人東京工業高等専門学校, 情報工学科, 助教授 (50290721)
キーワード	文書認識 / 文字認識 / 知識処理 / 認識システム
研究概要	文字認識技術は、音声認識技術と共にひとに優しいマルチメディア情報化社会の実現に重要な役割を担っており、国内外で盛んに研究が行われている。本研究では、知識主導型モデルを用いた次世代文書認識システムを提案し実現する。具体的には、切出し技術、認識技術、知識処理技術の開発を行い、知識処理を中心に据えた高精度な文書認識システムを構築する。平成11年度では、以下のように研究を進め、所望の成果が得られている。・システム全体の設計を行う。具体的には、システムが所望の認識精度および認識速度を保証するための各処理部の仕様を検討し決定した。また、文書認識システムとして実用化する場合のユーザーインターフェースの設計を行った。・開発の第1歩として標準パターンを作成するためのサンプル収集を行った。収集の対象字種をJIS第一水準漢字(2965字種)、平仮名、片仮名、アルファベットとした。複数のフォントに対し、字種ごとに1サンプルを収集した。・1サンプルずつ収集されたサンプルに対し、高精度な標準パターンを作成した。具体的には、フォントが同じであっても、宇の大きさ、コピー回数、プリンタの種類によって、字体が違ってくるため、ここでは、細線化あるいは太線化の手法を適用し、1つの字体から複数のサンプルを自動的に生成した。また、文字のストロークを抽出して、その相対位置を変化させることにより、プリンタによる違いを吸収した。作成後、実際に使用して認識精度の検証を行った。検証に基づき、パラメータの変更を行い、最適値を導出した。

研究成果
(5件)

すべてその他

すべて文献書誌 (5件)

[文献書誌] 鈴木雅人: "候補字種の動的抽出を用いた手書きあて名の2段階認識手法"電子情報通信学会論文誌(D-II). 11. 1895-1902 (1999)
[文献書誌] 和泉勇治: "自乗結合を用いた多層パーセプトロンによる手書き文字認識の高精度化"1999年電子情報通信学会情報・システムソサイエティ大会. 185 (1999)
[文献書誌] 石井力: "ニューラルネットワークを用いた二者択一方式の手書き文字認識システムにおけるモジュール構成法の提案"1999年電子情報通信学会情報・システムソサイエティ大会. 186 (1999)
[文献書誌] 根本一崇: "宛名辞書の階層化による宛名認識の高速化に関する検討"1999年電子情報通信学会情報・システムソサイエティ大会. 187 (1999)
[文献書誌] 和泉勇治: "自乗結合を持つニューラルネットワークによる手書き文字の高精度認識"電子情報通信学会技術研究報告. PRMU99-54. 37-44 (1999)