研究課題/領域番号 |
62460124
|
研究種目 |
一般研究(B)
|
配分区分 | 補助金 |
研究分野 |
電子通信系統工学
|
研究機関 | 工学院大学 |
研究代表者 |
南 敏 工学院大学, 工学部, 教授 (80146729)
|
研究分担者 |
来馬 孝治 沖電気工業(株), 画像通信技術部, 部長
篠原 克幸 工学院大学, 工学部, 講師 (40100309)
中村 納 工学院大学, 工学部, 助教授 (70100336)
高橋 静昭 工学院大学, 工学部, 助教授 (90100304)
|
研究期間 (年度) |
1987 – 1990
|
研究課題ステータス |
完了 (1989年度)
|
配分額 *注記 |
6,400千円 (直接経費: 6,400千円)
1989年度: 1,000千円 (直接経費: 1,000千円)
1988年度: 2,400千円 (直接経費: 2,400千円)
1987年度: 3,000千円 (直接経費: 3,000千円)
|
キーワード | 文書画像 / 符号化 / ミクストモ-ド / 単語認識 / 文字認識 / フォント認識 / 電子図書館 / 図形プリミティブ / ミクストモード / セグメンテーション / 単語単位の符号化 / ミクストモード通信 / 文書画像の符号化 / 文書画像の編集 / インデックスの自動抽出 |
研究概要 |
標記の研究課題に関し、昭和62年度は、(1)ミクストモ-ド通信方式の方式構成の検討、(2)単語の認識、(3)単語認識処理における誤認識文字の訂正アルゴリズムに関する検討、(4)図形からの特徴抽出と認識処理について検討し、その成果を関係する内外の学会誌で報告した。本方式の基本的考えは、英文文書に対しては(i)単語をその語構成(接頭辞+語根+接尾辞)に基づいて符号化する。これによって辞書の小型化を走る。(ii)出現頻度が対象文書に強く依存すると考えられる単語に対しては、別に、カレント辞書(一時登録用辞書)を設けこれによって符号化効率のばらつきを軽減する。さらに(iii)、同一の単語が再び出現するまでの間隔がある範囲に限定されているという調査結果から、この性質を利用して符号長を短縮するようにカレント辞書の構成を工夫する、という点にある。昭和63年度は、前年度までの成果を踏まえ、本方式を文書画像のデ-タベ-スへ応用するため、(1)文書構造の定義と、(2)文書画像からのインデックスの自動抽出について検討し、関係する学会に報告した。また、本方式を実時間で処理するために、アルゴリズムの主要部分である拡大と縮退及び文字領域、行領域および単語領域の抽出部分をハ-ドウェアで構成することを考え、その試作をコ-ダ電子に依頼し、平成元年度中にこれを完成した。システム全体の動作さとしては、ハ-ドウェアから出力される個別文字および単語の認識をハ-ソナルコンピュ-タで行わせるという構成とした。平成元年度は、入出力装置を含めたシステム全体の機能評価を行い、所期の目標とした機能が達成できることを確認した。
|