画像データの構造的特徴を反映させたデータの自動構築を行う手法の開発を行い、実際に画像データを生成して評価を行った。まず、画像データをベクトルで表し、ベクトルの要素を相関に応じてクラスタリングすることで構造ごとにモデル化し、それらを統合してデータを生成する手法を開発した。大量の手書き文字データを用いてデータを生成する実験を行い、違和感のないデータが生成されることを確認した。この手法は要素の相関をもとにしているので、連動して変形する部分を自動抽出してモデル化することができ、人間の直感とは関係なく、統計的に妥当なデータのモデル化を自動的に行うことができる点に大きな特徴がある。一方で、より直接的に構造情報を反映させるために、情景画像中の活字文字を対象とし、モーフィングを用いて文字データを生成する手法についても検討を行った。モーフィングは画像を滑らかに変形させる技術であるが、さまざまな活字フォントのように大きく異なる複数の文字に対して適用するには工夫が必要であり、サンプリングとスプライン曲線近似を利用した手法を開発した。文字部分と背景部分を構成するテクスチャ画像を生成する手法も開発し、文字パターンどうしのモーフィング結果と生成されたテクスチャ画像を融合することで、視覚的に妥当な文字パターンを生成することが可能となった。提案手法によって作成された人工パターンを用いて文字認識実験を行い、認識精度が向上することを確認した。
|