1.伝統モンゴル文字認識に適した史料画像処理手法の開発 画像二値化・傾き補正・雑音除去など史料画像の前処理に関する手法と領域分割・クラスタリングなど画像レイアウト解析に関する手法について研究した。特に、雑音除去などでは文字列が形作る中央線の間隔によってフィルタの大きさを適切に決定できる手法を開発した。 2.単語・文字・字素の抽出・認識 モンゴル文字列が形作る中心線に着目し、中心線を検出しその位置を用いることによってモンゴル文字を効率よく認識するCLBM法を開発しその有効性を示した。また、史料中の同じ行にある他の単語の中心線位置を参照することで高い精度で中心線を検出する手法を開発した。そして、字素に加わる拘束と文字規則を用いることによって単語認識において文字候補の絞り込みが可能であることを示した。また、モンゴル文字には同形異義字が存在する。そこで単語が男性語か女性語かの区別および十二字頭・弱化母音・二重母音に関する文字構成規則に基づいて同形異義字を判別し文字や単語を特定する手法を開発した。 3.伝統モンゴル文字認識システム 印字されたモンゴル史料の画像を対象として単語を検索するシステムを開発した。単語検索にあたって中心線に基づく5つの特徴量の有効性を示した。そして、単語検索では文字列がすべて一致する単語ではなく部分的に一致する単語を検索したいときがある。そこで、部分一致検索と同時にフォントの大きさや種類の変化にも対応できるように、動的計画法によって検索範囲の始端終端が自由に設定できる検索法を開発した。さらに、単語画像の縦横比と字素数から動的計画法での対応付けにおける単語画像間の一致度を調整する方法を開発した。
|