1993 Fiscal Year Annual Research Report
印刷文書のハイパーテキスト化を指向した文書画像の統合理解に関する研究
Project/Area Number |
05780323
|
Research Institution | Osaka Prefecture University |
Principal Investigator |
黄瀬 浩一 大阪府立大学, 工学部・情報工学科, 助手 (80224939)
|
Keywords | 文書画像処理 / 文書画像理解 / レイアウト解析 / 図面理解 / 知識獲得 / ハイパーテキスト / 文書データベース / ハイパーメディア |
Research Abstract |
1.文書画像の構造解析手法の改良 文書画像の構造解析に用いる知識の記述は容易ではなく、構造解析システムを様々な文書に適用する際の障害となっていた。本研究では、この知識を文書の例から自動獲得する手法を開発した。この手法は、与えられた文書の例から、漸増的に知識を獲得、修正するものである。学会論文誌の第一頁と名刺を対象に知識獲得実験を行い、本手法が様々なレイアウト構造を持つ文書に対して有効なことを確認した。本手法を組み込んだ構造解析システムでは、文書の例をいくつか呈示すれば、自動的に知識を獲得し、文書の論理構造(題名、章、節などの構造)を抽出できる。 2.図の構造化手法の開発 従来の図面理解では、機械図面、回路図など書き方が明確に定まっている図を対象としてきた。ところが技術論文のハイパーテキスト化には、概念図、システム構成図のように書き方が定まっていない図を理解し、情報を構造化して抽出する必要がある。本研究では、このような観点から、図に記述された情報を構造化して抽出する構造化手法を開発した。本手法は、図の表す情報の論理的な構造を抽出するものであり、図の入力省力化、清書などを目的とする従来法とは質的に異なるものである。ベクトル入力した概念図、システム構成図を対象とした実験から、本手法の有効性を確認した。 3.参照構造の抽出手法の開発 図と分の間の参照構造を抽出するためには文の解析・理解が不可欠である。本研究では、対象を簡単な文と図からなる幾何問題とし、参照構造を抽出する統合理解法を開発した。本手法は図と文の個別解析で残る曖昧性を陽に記述し、その結果を統合することにより、曖昧性を解消しつつ参照構造を同定するものである。中学程度の幾何問題を対象に実験を行い、本手法により得られた参照構造に基づいて、図と文からなる幾何問題を計算機により解くことが可能なことを示した。
|
Research Products
(4 results)
-
[Publications] 黄瀬浩一: "レイアウトとコンテントの知識を用いた仮説駆動型文書画像理解" 情報処理学会 論文誌. 34. 1716-1730 (1993)
-
[Publications] Koichi Kise: "Incremental Acquisition of Knowledge about Layout Structures From Examples of Documents" Proc.of 2nd Inter. Conf. on Document Analysis & Recognition. 668-671 (1993)
-
[Publications] 黄瀬浩一: "幾何問題を対象とした図と文の統合理解システム" 平成5年電気関係学会関西支部連合大会論文集. G43 (1993)
-
[Publications] 米田昇巧: "論理構造の抽出を目的とした概念図の構造解析" 1994年電子情報通信学会春季全国大会論文集. (発表予定). (1994)