• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

1993 年度 実績報告書

検索索引を自動生成する自由書式文書画像データベースの構築

研究課題

研究課題/領域番号 03558007
研究機関京都大学

研究代表者

池田 克夫  京都大学, 工学部, 教授 (30026009)

研究分担者 渡辺 正子  京都大学, 工学部, 教務職員 (70127158)
大田 友一  筑波大学, 電子・情報工学系, 教授 (50115804)
廣瀬 勝一  京都大学, 工学部, 助手 (20228836)
天野 晃  京都大学, 工学部, 助手 (60252491)
美濃 導彦  京都大学, 工学部, 助教授 (70166099)
キーワード自由書式文書 / 文書画像 / データベース / 文字認識 / 検索索引
研究概要

本研究は,自由書式文書を対象として,データの入力時に人間が介入することなく,検索索引を自動的に生成する文書画像データベースを構築することを目的とする.最終年度である今年度は,以下のような研究を行うと共に,全体のとりまとめを行った.
・同一文字列中の文字は単一色から構成されているという仮定のもとに,カラー文書画像に対して色のクラスタリングを適用することにより,文字パタンを抽出した.
・文字認識結果を仮説として表現することのできる文字ラティスに対して,与えられた文字列の出現位置を同定するアルゴリズムを理論的に考察し,具体的な2種類の実装を示した.
・文字切り出しの評価値として使える文字認識の確信度を改良した.具体的には,類似文字の集合を定義し,これを考慮に入れた確信度を作った.これにより文字切り出し率が向上した.
・ユーザのキーワード想起を支援する文書検索システムを作成した.このシステムは,「話題」を抽出して,データベースの概要を示す.また,キーワードの候補を提示して,候補選択による検索質問の作成を可能にする.
・カタログの仕様一覧表の構造解析,文字認識処理をした後,表の属性に対する値の書式を利用した文字認識後処理をして数字や記号の文字認識処理の正解率を高めた.さらに,その結果をデータベースに登録し,検索実験を行った.

  • 研究成果

    (6件)

すべて その他

すべて 文献書誌 (6件)

  • [文献書誌] 山下哲郎: "シルエット画像からの動物の概略構造認識と種類同定" 信学技報. PRU93-11. 49-56 (1993)

  • [文献書誌] 矢敷潤: "並行に抽出された要素候補による投票を用いた線画の顔認識" 信学技報. PRU93-12. 57-64 (1993)

  • [文献書誌] 白崎昭彦: "手書きレイアウト図面を理解する版下レイアウト支援システム" 情処論. 34,No.11. 2265-2276 (1993)

  • [文献書誌] 神嶌敏弘: "帰納学習を用いた図面部品の抽出・分類規則の形成" 信学技法. PRU93-132. 17-24 (1994)

  • [文献書誌] 美濃導彦: "制約充足型画像処理" 信学技報. PRU93-25. 57-64 (1993)

  • [文献書誌] 久保亮二: "カラー文書画像からの写真領域抽出手法" 情報処理学会第48回全国大会. 3M. 2-41 (1994)

URL: 

公開日: 1995-02-08   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi