• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

文書画像の統合理解によるハイパーテキスト化と知的検索

Research Project

Project/Area Number 07780372
Research Category

Grant-in-Aid for Encouragement of Young Scientists (A)

Allocation TypeSingle-year Grants
Research Field 情報システム学(含情報図書館学)
Research InstitutionOsaka Prefecture University

Principal Investigator

黄瀬 浩一  大阪府立大学, 工学部, 助手 (80224939)

Project Period (FY) 1995
Project Status Completed (Fiscal Year 1995)
Budget Amount *help
¥900,000 (Direct Cost: ¥900,000)
Fiscal Year 1995: ¥900,000 (Direct Cost: ¥900,000)
Keywords文書画像理解 / ハイパーテキスト / レイアウト解析 / WWW / 電子図書館 / 図とテキストの統合理解 / HTML / 領域分割
Research Abstract

以下の2点について研究を行った。
1.論文誌のハイパーテキスト化システム
技術論文誌を対象として、文書画像をハイパーテキストデータに自動変換するシステムを構築した。
(1)論理構造化 構文解析的手法により文書画像から論理構造(題名、著者名、章、節などの構造)を抽出する手法を実現した。本手法は、文書画像から得たブロック領域を、56個の書き換え規則を用いたボトムアップチャート法により解析するものである。6論文(61頁)を対象とした実験の結果、論理構造をすべて正しく抽出できた。
リンク生成 ハイパーテキストリンクとして、(a)本文から図表ヘのリンク、(b)本文から章、節へのリンク、(c)参考文献へのリンクを取り上げ、実現した。具体的には、(a),(b)については単語照合を用いた。(c)については137個の書き換え規則を用いて参考文献項目の構文解析を行うことにより構造化したのち、データベース中の書誌情報とリンクを生成した。上記の論文を対象とした実験の結果、(a)〜(c)について、それぞれ88.6%,100%,92.6%の成功率を得た。
2.図とテキストの統合理解と知的検索
文書に含まれる概念図とテキストを統合理解する手法を考案した。本手法は、図認識、自然言語処理の結果を統一的なフレームにより記述し、両者を無矛盾かつ最大に対応付けるように統合するものである。概念図は文書の概要を表すものが多いため、統合の結果に基づいて、文書を知的に検索することが可能となる。
なお、以上のシステム、手法の実験評価には、設備備品として購入したパーソナルコンピュータを使用した。

Report

(1 results)
  • 1995 Annual Research Report
  • Research Products

    (7 results)

All Other

All Publications (7 results)

  • [Publications] Koichi Kise: "Interpretation of Conceptual Diagrams from Line Segments and Strings." Proceedings of the Third International Conference on Document Analysis and Recognition. 960-963 (1995)

    • Related Report
      1995 Annual Research Report
  • [Publications] 黄瀬浩一: "文書画像構造解析のためのインクリメンタルな知識獲得" 情報処理学会論文誌. 36. 2622-2631 (1995)

    • Related Report
      1995 Annual Research Report
  • [Publications] 谷 忠明: "図とテキストの情報を融合した文書の統合理解" 平成7年電気関係学会関西支部連合大会講演論文集. G372 (1995)

    • Related Report
      1995 Annual Research Report
  • [Publications] 黄瀬浩一: "論文誌のハイパーテキスト化の一手法" 平成7年電気関係学会関西支部連合大会講演論文集. G340 (1995)

    • Related Report
      1995 Annual Research Report
  • [Publications] 谷 忠明: "解釈の曖昧性を考慮した図とテキストの統合理解" 1996年電子情報通信学会統合大会講演論文集. (発表予定). (1996)

    • Related Report
      1995 Annual Research Report
  • [Publications] 大開 保: "印刷文書のハイパーテキスト化システム" 1996年電子情報通信学会統合大会講演論文集. (発表予定). (1996)

    • Related Report
      1995 Annual Research Report
  • [Publications] 柳田 修: "背景領域の細線化に基づく文書画像の領域分割" 1996年電子情報通信学会統合大会講演論文集. (発表予定). (1996)

    • Related Report
      1995 Annual Research Report

URL: 

Published: 1995-04-01   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi