研究概要 |
コンピュータ,ファクシミリをはじめとする各種情報機器が益々多様化し,日常化する現在,優れたユーザインタフェースの開発が重要な技術的課題のひとつとなってきている.文字認識システムは,多数の人が特に訓練を必要とせずに手軽に利用できるという意味で,このような条件を満たす優れたユーザインタフェースであり,コンピュータの入力システム,郵便・商品配送システム,各種統計調査等をはじめとして広く実用に供せられている. 認識システムの認識率の向上を図るために自然言語に含まれる冗長を利用することが従来行なわれてきているが,これらの手法は郵便番号,電話番号等のほとんど冗長を含まない情報源に対しては必ずしも十分効果的に適用することができない.従って,これらの情報に対してはあらかじめ冗長を組織的に付加する必要があるが,その具体的手法については従来全く検討されていなかった. 本研究ではまず,認識システムの評価基準として情報量が有効であることを示し,これを用いて認識文字の最適な生起確率分布を求める.さらに生起確率が小さな文字を削除することにより,情報量を最大化することができることを明らかにした. 次に各文字が上で求めた最適な生起確率分布を有するような誤り訂正符号をシミュレーテッドアニーリング法を用いて構成し,これが既存の符号と比較して優れた性能を有していることを確認した. また,より実用的な符号を構成するために,文字認識システムを一種の非対称通信路としてモデル化し,生起確率は一定として,符号化・復合化の容易な符号を構成した.
|