• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

図とテキストの協調的構造解析に基づく文書画像からのハイパーメディア構造の抽出

Research Project

Project/Area Number 06780357
Research Category

Grant-in-Aid for Encouragement of Young Scientists (A)

Allocation TypeSingle-year Grants
Research Field 情報システム学(含情報図書館学)
Research InstitutionOsaka Prefecture University

Principal Investigator

黄瀬 浩一  大阪府立大学, 工学部, 助手 (80224939)

Project Period (FY) 1994
Project Status Completed (Fiscal Year 1994)
Budget Amount *help
¥900,000 (Direct Cost: ¥900,000)
Fiscal Year 1994: ¥900,000 (Direct Cost: ¥900,000)
Keywords文書画像理解 / ハイパーメディア / ハイパーテキスト / 文書画像処理 / レイアウト解析 / 図面理解 / 文書データベース / Mosaic
Research Abstract

1.参照形態の分析・分類
文書のテキストから図,表,写真,テキストへの参照の形態を分析した。その結果,参照形態は,(1)直接的参照,(2)順序による参照,(3)配置による参照,(4)文脈による参照,(5)近接による参照の5種類に分類できること,またこれらを組み合わせた参照もあることが分かった。
2.複数頁を対象とした文書画像理解システムの構築
技術論文のハイパーメディア化には,技術論文の全頁を対象とする処理が必要である。このとき,図,表など頁内の位置が不定なものの分離抽出法,文書の全頁を対象とした論理構造の抽出法が問題となる。本研究では,(1)文学認識の結果を用いて図表のキャプションを抽出した後,キャプションの位置を手がかりに図表の本体を抽出する手法,(2)全頁に含まれる文字列を読み順にソ-トし,その結果を構文解析して論理構造を抽出する手法を開発した。また,これらの2手法に基づいて,技術論文の全頁を処理可能な文書画像理解システムを構築した。
3.概念図理解システムの構築
技術論文にしばしば含まれる概念図を対象に,図理解システムを構築した。本システムの特徴は,図に記述された概念,および概念間の関係という高次の情報を抽出する点にある。抽出された概念は,キーワードとして登録され,テキストとの参照構造の抽出に用いられる。
4.参照構造の抽出とハイパーメディア化
参照形態(1),(2),(5)を対象に,参照構造を抽出する手法を開発した。具体的には,(a)図表を図表番号に基づいてテキストとリンクする処理,(b)章,節を参照するテキストを,章,節の本体とリンクする処理,(c)著者照会文と写真を,頁領域における両者の近さに基づいてリンクする処理などを実現した また,図,表、写真の画像,本文の文字認識結果,および抽出したリンクを入力とし,HTML形式のデータを得るシステムを開発し,Mosaicなどのブラウザで表示可能とした。

Report

(1 results)
  • 1994 Annual Research Report
  • Research Products

    (8 results)

All Other

All Publications (8 results)

  • [Publications] Koichi Kise: "Representing,Utilizing and Acquiring Knowledge for Document Image Understanding" IEICE Transactiong on Information and Systems. E77-D. 770-777 (1994)

    • Related Report
      1994 Annual Research Report
  • [Publications] 黄瀬浩一: "印刷文書のハイパーテキスト化に関する一考察" 平成6年電気関係学会関西支部連合大会論文集. G275- (1994)

    • Related Report
      1994 Annual Research Report
  • [Publications] 秋吉裕二: "不確定領域を許容する文書画像の領域分割" 平成6年電気関係学会関西支部連合大会論文集. G274- (1994)

    • Related Report
      1994 Annual Research Report
  • [Publications] Noriyoshi Yoneda: "A Method of Understanding Conceptual Diagrams" Proceedings of IAPR Workshop on Maclune Vision Applications. 334-337 (1994)

    • Related Report
      1994 Annual Research Report
  • [Publications] 黄瀬浩一: "幾何問題の理解と解決を目的とした図と文の統合理解" 電気学会論文誌C. 114-C. 1201-1207 (1994)

    • Related Report
      1994 Annual Research Report
  • [Publications] 黄瀬浩一: "構文・意味解析を用いた文字認識後処理法" 電子情報通信学会論文誌 D-II. J77-D-II. 2199-2209 (1994)

    • Related Report
      1994 Annual Research Report
  • [Publications] 秋吉裕二: "空白の構造に基づく文書画像の領域分割" 電子情報通信学会技術研究報告パターン認識・理解研究会. PRU94(PRU94-101). 31-38 (1995)

    • Related Report
      1994 Annual Research Report
  • [Publications] 小山乃り子: "適用性を高めた印刷文書の論理構造化の一手法" 1995年電子情報通信学会総合大会論文集. (発表予定). (1995)

    • Related Report
      1994 Annual Research Report

URL: 

Published: 1994-04-01   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi