主に、伊勢・敦賀・尼崎を中心に、これまで収集してきたデータから金石文の風化を分類した。先ず、風化による凹みと文字の凹みを比較して文字の凹みがより深い試料に対しては、石碑表面の凹凸をヒストグラム解析による閾値を用いて、最も深い凹部分を抽出した。次に、表面にほぼ均一に風化が作用し凹凸が失われている資料に関しては、遮光撮影による照度差の差分を用いることで字形の輪郭を抽出した。 上記の結果を用いて、抽出した字形の二値化・線形化し、字形以外の凹凸によるノイズの除去することで、文字の認識精度の向上が図れた。 しかし、将来の文字の自動認識を可能とするための文字予測システムに関しては、金石文の風化が酷くなるにつれて、字形が部分的に欠損する試料が増え、結果、現在のシステムでは予測される文字数が多くなり過ぎ、実用には耐えなかった。また、現地調査で人力での文字認識を超えるまでの精度は得られず「後世に文字認識の為のデータ(画像)を残すという」本システムの目標の為には、さらなる精度の向上を図る為の新たな工夫が必要となった。 この問題を解決するための手法の一つとして、実際の石碑調査では調査者が熟達してくると文字が不鮮明な場合でも、年号・人名・願文といった文字列の性格や、宮座の有無といった地域の社会構造、石灯籠か一石五輪塔かといった石碑の種類など、文字情報以外の石碑の副次的な情報を補助として文字を判読していることに着目し、現在、副次的情報の利用をデータベースに組み込むことで、文字情報が大幅に失われた金石文の予測精度を向上させる仕組みの開発に着手している。
|