1993 Fiscal Year Annual Research Report
検索索引を自動生成する自由書式文書画像データベースの構築
Project/Area Number |
03558007
|
Research Institution | KYOTO UNIVERSITY |
Principal Investigator |
池田 克夫 京都大学, 工学部, 教授 (30026009)
|
Co-Investigator(Kenkyū-buntansha) |
渡辺 正子 京都大学, 工学部, 教務職員 (70127158)
大田 友一 筑波大学, 電子・情報工学系, 教授 (50115804)
廣瀬 勝一 京都大学, 工学部, 助手 (20228836)
天野 晃 京都大学, 工学部, 助手 (60252491)
美濃 導彦 京都大学, 工学部, 助教授 (70166099)
|
Keywords | 自由書式文書 / 文書画像 / データベース / 文字認識 / 検索索引 |
Research Abstract |
本研究は,自由書式文書を対象として,データの入力時に人間が介入することなく,検索索引を自動的に生成する文書画像データベースを構築することを目的とする.最終年度である今年度は,以下のような研究を行うと共に,全体のとりまとめを行った. ・同一文字列中の文字は単一色から構成されているという仮定のもとに,カラー文書画像に対して色のクラスタリングを適用することにより,文字パタンを抽出した. ・文字認識結果を仮説として表現することのできる文字ラティスに対して,与えられた文字列の出現位置を同定するアルゴリズムを理論的に考察し,具体的な2種類の実装を示した. ・文字切り出しの評価値として使える文字認識の確信度を改良した.具体的には,類似文字の集合を定義し,これを考慮に入れた確信度を作った.これにより文字切り出し率が向上した. ・ユーザのキーワード想起を支援する文書検索システムを作成した.このシステムは,「話題」を抽出して,データベースの概要を示す.また,キーワードの候補を提示して,候補選択による検索質問の作成を可能にする. ・カタログの仕様一覧表の構造解析,文字認識処理をした後,表の属性に対する値の書式を利用した文字認識後処理をして数字や記号の文字認識処理の正解率を高めた.さらに,その結果をデータベースに登録し,検索実験を行った.
|
Research Products
(6 results)
-
[Publications] 山下哲郎: "シルエット画像からの動物の概略構造認識と種類同定" 信学技報. PRU93-11. 49-56 (1993)
-
[Publications] 矢敷潤: "並行に抽出された要素候補による投票を用いた線画の顔認識" 信学技報. PRU93-12. 57-64 (1993)
-
[Publications] 白崎昭彦: "手書きレイアウト図面を理解する版下レイアウト支援システム" 情処論. 34,No.11. 2265-2276 (1993)
-
[Publications] 神嶌敏弘: "帰納学習を用いた図面部品の抽出・分類規則の形成" 信学技法. PRU93-132. 17-24 (1994)
-
[Publications] 美濃導彦: "制約充足型画像処理" 信学技報. PRU93-25. 57-64 (1993)
-
[Publications] 久保亮二: "カラー文書画像からの写真領域抽出手法" 情報処理学会第48回全国大会. 3M. 2-41 (1994)