• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

図とテキストの協調的構造解析に基づく文書画像からのハイパーメディア構造の抽出

研究課題

研究課題/領域番号 06780357
研究種目

奨励研究(A)

配分区分補助金
研究分野 情報システム学(含情報図書館学)
研究機関大阪府立大学

研究代表者

黄瀬 浩一  大阪府立大学, 工学部, 助手 (80224939)

研究期間 (年度) 1994
研究課題ステータス 完了 (1994年度)
配分額 *注記
900千円 (直接経費: 900千円)
1994年度: 900千円 (直接経費: 900千円)
キーワード文書画像理解 / ハイパーメディア / ハイパーテキスト / 文書画像処理 / レイアウト解析 / 図面理解 / 文書データベース / Mosaic
研究概要

1.参照形態の分析・分類
文書のテキストから図,表,写真,テキストへの参照の形態を分析した。その結果,参照形態は,(1)直接的参照,(2)順序による参照,(3)配置による参照,(4)文脈による参照,(5)近接による参照の5種類に分類できること,またこれらを組み合わせた参照もあることが分かった。
2.複数頁を対象とした文書画像理解システムの構築
技術論文のハイパーメディア化には,技術論文の全頁を対象とする処理が必要である。このとき,図,表など頁内の位置が不定なものの分離抽出法,文書の全頁を対象とした論理構造の抽出法が問題となる。本研究では,(1)文学認識の結果を用いて図表のキャプションを抽出した後,キャプションの位置を手がかりに図表の本体を抽出する手法,(2)全頁に含まれる文字列を読み順にソ-トし,その結果を構文解析して論理構造を抽出する手法を開発した。また,これらの2手法に基づいて,技術論文の全頁を処理可能な文書画像理解システムを構築した。
3.概念図理解システムの構築
技術論文にしばしば含まれる概念図を対象に,図理解システムを構築した。本システムの特徴は,図に記述された概念,および概念間の関係という高次の情報を抽出する点にある。抽出された概念は,キーワードとして登録され,テキストとの参照構造の抽出に用いられる。
4.参照構造の抽出とハイパーメディア化
参照形態(1),(2),(5)を対象に,参照構造を抽出する手法を開発した。具体的には,(a)図表を図表番号に基づいてテキストとリンクする処理,(b)章,節を参照するテキストを,章,節の本体とリンクする処理,(c)著者照会文と写真を,頁領域における両者の近さに基づいてリンクする処理などを実現した また,図,表、写真の画像,本文の文字認識結果,および抽出したリンクを入力とし,HTML形式のデータを得るシステムを開発し,Mosaicなどのブラウザで表示可能とした。

報告書

(1件)
  • 1994 実績報告書
  • 研究成果

    (8件)

すべて その他

すべて 文献書誌 (8件)

  • [文献書誌] Koichi Kise: "Representing,Utilizing and Acquiring Knowledge for Document Image Understanding" IEICE Transactiong on Information and Systems. E77-D. 770-777 (1994)

    • 関連する報告書
      1994 実績報告書
  • [文献書誌] 黄瀬浩一: "印刷文書のハイパーテキスト化に関する一考察" 平成6年電気関係学会関西支部連合大会論文集. G275- (1994)

    • 関連する報告書
      1994 実績報告書
  • [文献書誌] 秋吉裕二: "不確定領域を許容する文書画像の領域分割" 平成6年電気関係学会関西支部連合大会論文集. G274- (1994)

    • 関連する報告書
      1994 実績報告書
  • [文献書誌] Noriyoshi Yoneda: "A Method of Understanding Conceptual Diagrams" Proceedings of IAPR Workshop on Maclune Vision Applications. 334-337 (1994)

    • 関連する報告書
      1994 実績報告書
  • [文献書誌] 黄瀬浩一: "幾何問題の理解と解決を目的とした図と文の統合理解" 電気学会論文誌C. 114-C. 1201-1207 (1994)

    • 関連する報告書
      1994 実績報告書
  • [文献書誌] 黄瀬浩一: "構文・意味解析を用いた文字認識後処理法" 電子情報通信学会論文誌 D-II. J77-D-II. 2199-2209 (1994)

    • 関連する報告書
      1994 実績報告書
  • [文献書誌] 秋吉裕二: "空白の構造に基づく文書画像の領域分割" 電子情報通信学会技術研究報告パターン認識・理解研究会. PRU94(PRU94-101). 31-38 (1995)

    • 関連する報告書
      1994 実績報告書
  • [文献書誌] 小山乃り子: "適用性を高めた印刷文書の論理構造化の一手法" 1995年電子情報通信学会総合大会論文集. (発表予定). (1995)

    • 関連する報告書
      1994 実績報告書

URL: 

公開日: 1994-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi