文書画像の統合理解によるハイパーテキスト化と知的検索

Research Project

Project/Area Number	07780372
Research Category	Grant-in-Aid for Encouragement of Young Scientists (A)
Allocation Type	Single-year Grants
Research Field	情報システム学(含情報図書館学)
Research Institution	Osaka Prefecture University
Principal Investigator	黄瀬浩一大阪府立大学, 工学部, 助手 (80224939)
Project Period (FY)	1995
Project Status	Completed (Fiscal Year 1995)
Budget Amount *help	¥900,000 (Direct Cost: ¥900,000) Fiscal Year 1995: ¥900,000 (Direct Cost: ¥900,000)
Keywords	文書画像理解 / ハイパーテキスト / レイアウト解析 / WWW / 電子図書館 / 図とテキストの統合理解 / HTML / 領域分割
Research Abstract	以下の2点について研究を行った。 1.論文誌のハイパーテキスト化システム技術論文誌を対象として、文書画像をハイパーテキストデータに自動変換するシステムを構築した。 (1)論理構造化構文解析的手法により文書画像から論理構造(題名、著者名、章、節などの構造)を抽出する手法を実現した。本手法は、文書画像から得たブロック領域を、56個の書き換え規則を用いたボトムアップチャート法により解析するものである。6論文(61頁)を対象とした実験の結果、論理構造をすべて正しく抽出できた。リンク生成ハイパーテキストリンクとして、(a)本文から図表ヘのリンク、(b)本文から章、節へのリンク、(c)参考文献へのリンクを取り上げ、実現した。具体的には、(a),(b)については単語照合を用いた。(c)については137個の書き換え規則を用いて参考文献項目の構文解析を行うことにより構造化したのち、データベース中の書誌情報とリンクを生成した。上記の論文を対象とした実験の結果、(a)〜(c)について、それぞれ88.6%,100%,92.6%の成功率を得た。 2.図とテキストの統合理解と知的検索文書に含まれる概念図とテキストを統合理解する手法を考案した。本手法は、図認識、自然言語処理の結果を統一的なフレームにより記述し、両者を無矛盾かつ最大に対応付けるように統合するものである。概念図は文書の概要を表すものが多いため、統合の結果に基づいて、文書を知的に検索することが可能となる。なお、以上のシステム、手法の実験評価には、設備備品として購入したパーソナルコンピュータを使用した。

Report

(1 results)

1995 Annual Research Report

Research Products
(7 results)

All Other

All Publications (7 results)

[Publications] Koichi Kise: "Interpretation of Conceptual Diagrams from Line Segments and Strings." Proceedings of the Third International Conference on Document Analysis and Recognition. 960-963 (1995)
- Related Report
  1995 Annual Research Report
[Publications] 黄瀬浩一: "文書画像構造解析のためのインクリメンタルな知識獲得" 情報処理学会論文誌. 36. 2622-2631 (1995)
- Related Report
  1995 Annual Research Report
[Publications] 谷忠明: "図とテキストの情報を融合した文書の統合理解" 平成7年電気関係学会関西支部連合大会講演論文集. G372 (1995)
- Related Report
  1995 Annual Research Report
[Publications] 黄瀬浩一: "論文誌のハイパーテキスト化の一手法" 平成7年電気関係学会関西支部連合大会講演論文集. G340 (1995)
- Related Report
  1995 Annual Research Report
[Publications] 谷忠明: "解釈の曖昧性を考慮した図とテキストの統合理解" 1996年電子情報通信学会統合大会講演論文集. (発表予定). (1996)
- Related Report
  1995 Annual Research Report
[Publications] 大開保: "印刷文書のハイパーテキスト化システム" 1996年電子情報通信学会統合大会講演論文集. (発表予定). (1996)
- Related Report
  1995 Annual Research Report
[Publications] 柳田修: "背景領域の細線化に基づく文書画像の領域分割" 1996年電子情報通信学会統合大会講演論文集. (発表予定). (1996)
- Related Report
  1995 Annual Research Report

文書画像の統合理解によるハイパーテキスト化と知的検索

Principal Investigator

黄瀬 浩一 大阪府立大学, 工学部, 助手 (80224939)

¥900,000 (Direct Cost: ¥900,000)

Report

Research Products

[Publications] Koichi Kise: "Interpretation of Conceptual Diagrams from Line Segments and Strings." Proceedings of the Third International Conference on Document Analysis and Recognition. 960-963 (1995)

Related Report

[Publications] 黄瀬浩一: "文書画像構造解析のためのインクリメンタルな知識獲得" 情報処理学会論文誌. 36. 2622-2631 (1995)

Related Report

[Publications] 谷 忠明: "図とテキストの情報を融合した文書の統合理解" 平成7年電気関係学会関西支部連合大会講演論文集. G372 (1995)

Related Report

[Publications] 黄瀬浩一: "論文誌のハイパーテキスト化の一手法" 平成7年電気関係学会関西支部連合大会講演論文集. G340 (1995)

Related Report

[Publications] 谷 忠明: "解釈の曖昧性を考慮した図とテキストの統合理解" 1996年電子情報通信学会統合大会講演論文集. (発表予定). (1996)

Related Report

[Publications] 大開 保: "印刷文書のハイパーテキスト化システム" 1996年電子情報通信学会統合大会講演論文集. (発表予定). (1996)

Related Report

[Publications] 柳田 修: "背景領域の細線化に基づく文書画像の領域分割" 1996年電子情報通信学会統合大会講演論文集. (発表予定). (1996)

Related Report

黄瀬浩一大阪府立大学, 工学部, 助手 (80224939)

[Publications] 谷忠明: "図とテキストの情報を融合した文書の統合理解" 平成7年電気関係学会関西支部連合大会講演論文集. G372 (1995)

[Publications] 谷忠明: "解釈の曖昧性を考慮した図とテキストの統合理解" 1996年電子情報通信学会統合大会講演論文集. (発表予定). (1996)

[Publications] 大開保: "印刷文書のハイパーテキスト化システム" 1996年電子情報通信学会統合大会講演論文集. (発表予定). (1996)

[Publications] 柳田修: "背景領域の細線化に基づく文書画像の領域分割" 1996年電子情報通信学会統合大会講演論文集. (発表予定). (1996)