電子図書館構築のための文書データ入力支援システムの高機能化

研究課題

研究課題/領域番号	09780391
研究種目	奨励研究(A)
配分区分	補助金
研究分野	情報システム学(含情報図書館学)
研究機関	大阪府立大学
研究代表者	黄瀬浩一大阪府立大学, 工学部, 講師 (80224939)
研究期間 (年度)	1997 – 1998
研究課題ステータス	完了 (1998年度)
配分額 *注記	2,200千円 (直接経費: 2,200千円) 1998年度: 500千円 (直接経費: 500千円) 1997年度: 1,700千円 (直接経費: 1,700千円)
キーワード	電子図書館 / 文書画像理解 / 文書画像解析 / レイアウト解析 / ボロノイ図 / 文字列抽出 / ハイパーテキスト化 / パッセージ検索 / カラー文書画像 / 色クラスタリング
研究概要	昨年度に引続き,文書画像のレイアウト解析の高機能化に関する研究を行うと共に,電子テキストを対象として,ハイパーテキストリンク自動生成について検討を行った.概要は以下の通りである. 1. ポロノイ図を用いた文字列抽出法の改良昨年度に提案した文字列抽出法について,抽出に用いる特徴量や処理アルゴリズムの改良を行った.また,マンハッタンレイアウト,非マンハッタンレイアウトの文書画像50サンプル(各25サンプル)を対象として実験を行い,性能を評価した.その結果,平均処理時間約7秒(Pentium II 300MHz),文字列抽出率89.6%という結果を得,処理精度的には課題が残るものの,高速に処理可能であることがわかった. 2. ブロック抽出結果を用いた文字列抽出法の検討上記手法の処理誤りの多くは,局所的な制約のみを考慮して文字列を抽出することに起因する.そこで,ブロックという大域的な領域の抽出結果を用いて,文字列抽出の誤りを訂正する処理を考案し,弛緩法に基づいて実現した.同じ機器,サンプルを用いて評価実験を行ったところ,平均処理時間52秒,文字列抽出率90.6%を得た. 処理誤りの殆んどはブロック抽出誤りに起因するものであった. 3. ハイパーテキストリンクの自動生成法の検討ハイパーテキストリンクをいかに生成するかは,電子図書館を実現する上で重要な問題である.予めシステム作成者がリンクを生成しておくのではなく,利用者の要求に応じてリンクが生成できれば,よりユーザフレンドリなシステムとなる.そこで本研究では,電子テキストを対象に,ユーザが興味を持つ文書の一部(例示部分)を例示すると,それに関連した部分(関連部分)を文書データベースから抽出する手法を検討した.本手法の特徴は,単語出現密度を用いて関連部分を同定する点にある.実験の結果,再現率62.9%,適合率58.8%を得,本手法の有効性を確認した.

報告書

(2件)

1998 実績報告書
1997 実績報告書

研究成果
(12件)

すべてその他

すべて文献書誌 (12件)

[文献書誌] Koichi Kise: "Segmentation of Page Images Using the Area Voronoi Diagram" Journal of Computer Vision and Image Understanding. 70・3. 370-382 (1998)
- 関連する報告書
  1998 実績報告書
[文献書誌] Koichi Kise: "A Computational Geometric Approach to Text-line Extraction from Binary Document Images" Proc.of the 3rd IAPR Workshop on Document Analysis Systems. 346-355 (1998)
- 関連する報告書
  1998 実績報告書
[文献書誌] 岩田基: "隣接グラフによる文字列抽出" 画像の認識・理解シンポジウム'98講演論文集. 2. 281-286 (1998)
- 関連する報告書
  1998 実績報告書
[文献書誌] 岩田基: "文書画像のレイアウトや傾きに依存しない高速文字列抽出法" 平成10年電気関係学会関西支部連合大会講演論文集. G345 (1998)
- 関連する報告書
  1998 実績報告書
[文献書誌] 岩田基: "弛緩法に基づく文書画像のレイアウト解析" 1999年電子情報通信学会総合大会講演論文集. (発表予定). (1999)
- 関連する報告書
  1998 実績報告書
[文献書誌] 山口将志: "例示部分に対する関連部分抽出のための文書検索法" 1999年電子情報通信学会総合大会講演論文集. (発表予定). (1999)
- 関連する報告書
  1998 実績報告書
[文献書誌] Koichi Kise: "Document Image Segmentation as Selection of Voronoi Edges" Proceedings of IEEE Workshop on Document Image Analysis. 32-39 (1997)
- 関連する報告書
  1997 実績報告書
[文献書誌] 黄瀬浩一: "画像・図と言語の統合" システム/制御/情報. 41. 416-421 (1997)
- 関連する報告書
  1997 実績報告書
[文献書誌] 黄瀬浩一: "文書画像理解の目指すもの" 電子情報通信学会パターン認識・メディア理解研究会資料. 97. 55-62 (1998)
- 関連する報告書
  1997 実績報告書
[文献書誌] 大開保: "背景の階層構造に着目したカラー文書画像のレイアウト解析" 1998年電子情報通信学会総合大会講演論文集. (発表予定). (1998)
- 関連する報告書
  1997 実績報告書
[文献書誌] 岩田基: "一般図形ボロノイ図に基づく文書画像からの文字列抽出" 1998年電子情報通信学会総合大会講演論文集. (発表予定). (1998)
- 関連する報告書
  1997 実績報告書
[文献書誌] Koichi Kise: "Segmentation of Page Images Using the Area Voronoi Diagram" Journal of Computer Vision and Image Understanding. (採録決定). (1998)
- 関連する報告書
  1997 実績報告書

電子図書館構築のための文書データ入力支援システムの高機能化

研究代表者

黄瀬 浩一 大阪府立大学, 工学部, 講師 (80224939)

2,200千円 (直接経費: 2,200千円)

報告書

研究成果

[文献書誌] Koichi Kise: "Segmentation of Page Images Using the Area Voronoi Diagram" Journal of Computer Vision and Image Understanding. 70・3. 370-382 (1998)

関連する報告書

[文献書誌] Koichi Kise: "A Computational Geometric Approach to Text-line Extraction from Binary Document Images" Proc.of the 3rd IAPR Workshop on Document Analysis Systems. 346-355 (1998)

関連する報告書

[文献書誌] 岩田基: "隣接グラフによる文字列抽出" 画像の認識・理解シンポジウム'98講演論文集. 2. 281-286 (1998)

関連する報告書

[文献書誌] 岩田基: "文書画像のレイアウトや傾きに依存しない高速文字列抽出法" 平成10年電気関係学会関西支部連合大会講演論文集. G345 (1998)

関連する報告書

[文献書誌] 岩田基: "弛緩法に基づく文書画像のレイアウト解析" 1999年電子情報通信学会総合大会講演論文集. (発表予定). (1999)

関連する報告書

[文献書誌] 山口将志: "例示部分に対する関連部分抽出のための文書検索法" 1999年電子情報通信学会総合大会講演論文集. (発表予定). (1999)

関連する報告書

[文献書誌] Koichi Kise: "Document Image Segmentation as Selection of Voronoi Edges" Proceedings of IEEE Workshop on Document Image Analysis. 32-39 (1997)

関連する報告書

[文献書誌] 黄瀬浩一: "画像・図と言語の統合" システム/制御/情報. 41. 416-421 (1997)

関連する報告書

[文献書誌] 黄瀬浩一: "文書画像理解の目指すもの" 電子情報通信学会パターン認識・メディア理解研究会資料. 97. 55-62 (1998)

関連する報告書

[文献書誌] 大開保: "背景の階層構造に着目したカラー文書画像のレイアウト解析" 1998年電子情報通信学会総合大会講演論文集. (発表予定). (1998)

関連する報告書

[文献書誌] 岩田基: "一般図形ボロノイ図に基づく文書画像からの文字列抽出" 1998年電子情報通信学会総合大会講演論文集. (発表予定). (1998)

関連する報告書

[文献書誌] Koichi Kise: "Segmentation of Page Images Using the Area Voronoi Diagram" Journal of Computer Vision and Image Understanding. (採録決定). (1998)

関連する報告書

黄瀬浩一大阪府立大学, 工学部, 講師 (80224939)