研究概要 |
本年度は,データ入力支援システムの中核をなす文書画像のレイアウト解析の高機能化を目的とし,以下の項目について検討を行った. 1.ボロノイ図を用いた領域分割法の改良 昨年度に考案した領域分割法の細部を見直し,処理の高速化を図るとともに,文書画像226サンプルについて実験を行った.その結果,本手法は画像の解像度,傾き,レイアウトによらず安定的かつ高速(300dpiの画像に対して5〜7秒/P6-200MHzのCPU利用)に領域分割が可能であることがわかった. 2.ボロノイ図を用いた文字列抽出法の検討 上の手法はテキストブロック・図表・写真などのブロックを抽出するものである.データ入力支援システムでは文字列を抽出する必要もあるため,その手法を実現した.本手法は,ボロノイ図から得られる連結成分間の隣接関係をグラフとして表し,そのグラフの部分グラフとして文字列を抽出するものである.この際,連結成分間を結ぶアークの角度,長さ(距離)をもとに,一定距離内で直線的に並ぶことを制約として用いている.20サンプルの文書画像を対象に実験を行った結果,大半の文字列が傾きによらず抽出できることが分かった. 3.カラー文書画像に対するレイアウト解析法の検討 近年,雑誌などではカラー印刷が多用されるようになってきた.このような文書の自動入力を目指し,カラー文書画像のレイアウト解析を検討した.特に本研究では,雑誌の本文でしばしば見受けられる「背景色を変更することにより階層的に記事の区別を表す」ようなレイアウトの文書を対象に,色クラスタリング,連結成分分類という2種類の処理を再帰的に施し,階層構造を抽出する手法を考案した.
|