研究分担者 |
来馬 孝治 沖電気工業株式会社, 画像通信技術部, 部長
篠原 克幸 工学院大学, 工学部・電子工学科, 助手 (40100309)
中村 納 工学院大学, 工学部・電子工学科, 講師 (70100336)
高橋 静昭 工学院大学, 工学部・電子工学科, 助教授 (90100304)
|
研究概要 |
非電話系サービスとしてミクストモード通信方式が提案され,CCITTSGVIIIにおいて,検討が行われている. これは,文書画像を伝送する場合,文字領域に対しては,文字コード,図形領域に対しては,図形コマンド,又はファクシミリモードで対処することによって大幅な情報量の圧縮と画質の改善を図ろうとするものである.標記の研究課題に関して,昭和62年度は,次の2項目について検討した.以下,概要を述べる. 1.単語一括処理による文章領域の符号化 本方式は,単語の語構成(接頭辞+語根+接尾辞)に基づいて符号化が行われる.本研究では単語認識用の辞書として,上記語構成に基づく3辞書,すなわち(1)語根辞書,(2)接頭辞辞書,(3)接尾辞辞書,と単語の一時登録用の辞書であるカレント辞書を用意することとし,これら辞書の最適化について検討した.これらの辞書を用いて単語認識を行い,12種類の語構成に基づいて符号化した結果,従来の文字単位の符号化に比べ約2倍の符号化効率が達成できることを確認した.また,本方式を実現する上で比較的処理時間の要する,文章領域のセグメンテーションに関してはこの処理をハードウェアで実現する方式を検討し,昭和62年度は高速画像2次元メモリ部分について完成した.昭和63年度以降は引続き,各処理部の試作を行う予定である. 2.文書画像からのインデックスの自動抽出法 本手法では文書画像の構造情報を物理構造と意味構造の両面から考え,文書の持つ意味内容まで考慮しながらインデックスを自動抽出する方法を提案している.14種類の紙面(論文の第一ページ)について実験を行った結果,本手法が極めて有効であることを確認した. 尚,上記(1),(2)に関する研究成果は,それぞれ関連する国内外の学会で発表した.
|