1997 Fiscal Year Annual Research Report
電子図書館構築のための文書データ入力支援システムの高機能化
Project/Area Number |
09780391
|
Research Institution | Osaka Prefecture University |
Principal Investigator |
黄瀬 浩一 大阪府立大学, 工学部, 講師 (80224939)
|
Keywords | 電子図書館 / 文書画像理解 / 文書画像解析 / レイアウト解析 / ボロノイ図 / 文字列抽出 / カラー文書画像 / 色クラスタリング |
Research Abstract |
本年度は,データ入力支援システムの中核をなす文書画像のレイアウト解析の高機能化を目的とし,以下の項目について検討を行った. 1.ボロノイ図を用いた領域分割法の改良 昨年度に考案した領域分割法の細部を見直し,処理の高速化を図るとともに,文書画像226サンプルについて実験を行った.その結果,本手法は画像の解像度,傾き,レイアウトによらず安定的かつ高速(300dpiの画像に対して5〜7秒/P6-200MHzのCPU利用)に領域分割が可能であることがわかった. 2.ボロノイ図を用いた文字列抽出法の検討 上の手法はテキストブロック・図表・写真などのブロックを抽出するものである.データ入力支援システムでは文字列を抽出する必要もあるため,その手法を実現した.本手法は,ボロノイ図から得られる連結成分間の隣接関係をグラフとして表し,そのグラフの部分グラフとして文字列を抽出するものである.この際,連結成分間を結ぶアークの角度,長さ(距離)をもとに,一定距離内で直線的に並ぶことを制約として用いている.20サンプルの文書画像を対象に実験を行った結果,大半の文字列が傾きによらず抽出できることが分かった. 3.カラー文書画像に対するレイアウト解析法の検討 近年,雑誌などではカラー印刷が多用されるようになってきた.このような文書の自動入力を目指し,カラー文書画像のレイアウト解析を検討した.特に本研究では,雑誌の本文でしばしば見受けられる「背景色を変更することにより階層的に記事の区別を表す」ようなレイアウトの文書を対象に,色クラスタリング,連結成分分類という2種類の処理を再帰的に施し,階層構造を抽出する手法を考案した.
|
Research Products
(6 results)
-
[Publications] Koichi Kise: "Document Image Segmentation as Selection of Voronoi Edges" Proceedings of IEEE Workshop on Document Image Analysis. 32-39 (1997)
-
[Publications] 黄瀬浩一: "画像・図と言語の統合" システム/制御/情報. 41. 416-421 (1997)
-
[Publications] 黄瀬浩一: "文書画像理解の目指すもの" 電子情報通信学会パターン認識・メディア理解研究会資料. 97. 55-62 (1998)
-
[Publications] 大開保: "背景の階層構造に着目したカラー文書画像のレイアウト解析" 1998年電子情報通信学会総合大会講演論文集. (発表予定). (1998)
-
[Publications] 岩田基: "一般図形ボロノイ図に基づく文書画像からの文字列抽出" 1998年電子情報通信学会総合大会講演論文集. (発表予定). (1998)
-
[Publications] Koichi Kise: "Segmentation of Page Images Using the Area Voronoi Diagram" Journal of Computer Vision and Image Understanding. (採録決定). (1998)