人間の感性に基づく文字情報の認識・理解に関して、人間のもつ柔軟な知識処理機構の解明と豊富な言語知識の適応的な活用法の両面から研究を進めた。 1.柔軟な認識処理機構を模倣したニュ-ラルネットワ-クの動作と能力を解明するため、テクスチャ画像の識別を例として検討した。テクスチャの性質を表す統計量には、濃度共起行列と濃度差分特徴を利用した。ニュ-ラルネットワ-クには、3層の階層型ネットワ-クを用い、誤差逆伝搬法によって学習を実行した。10種類のテクスチャに対する識別実験の結果、ほぼ完全な識別が可能となった。 2.ニュ-ラルネットワ-クによる手書き漢字と平仮名の区別について検討し、学習に使用した文字種に対しては、未知デ-タセットでも94〜96%の正確率が得られることが明らかになった。 3.色相と明度情報に着目した、情景画像からの文字情報の分離抽出法を提案し、20種類の情景画像に含まれる104文字に対して68%の文字抽出率が得られた。 4.単語知識を活用した不明文字に対する推定能力について検討した。この結果、75千語の日本語単語において、漢字の「旁」が不明でも、「遍」が判ると72%の単語が正しく推定でき、「偏」が不明でも、「旁」が判れば、95%の単語を正しく推定できることが明らかになった。 5.日本語言語に関する知識処理の一還として、日本の苗字デ-タベ-スを作成し、その分析を進めた。このデ-タベ-スは、71千個の苗字から成り、3.8千個の文字種を含んでいる。
|