• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

検索索引を自動生成する自由書式文書画像データベースの構築

研究課題

研究課題/領域番号 03558007
研究種目

試験研究(B)

配分区分補助金
研究分野 情報学
研究機関京都大学

研究代表者

池田 克夫  京都大学, 工学部, 教授 (30026009)

研究分担者 西村 真一  三田工業株式会社, 技術部, 開発研究職
大田 友一  筑波大学, 電子・情報工学系, 教授 (50115804)
廣瀬 勝一 (広瀬 勝一)  京都大学, 工学部, 助手 (20228836)
天野 晃  京都大学, 工学部, 助手 (60252491)
美濃 導彦  京都大学, 工学部, 助教授 (70166099)
渡辺 正子  Kyoto Univ., Integ.Media Env.Exp.Lab., Res.Assist. (70127158)
研究期間 (年度) 1991 – 1993
研究課題ステータス 完了 (1993年度)
配分額 *注記
16,400千円 (直接経費: 16,400千円)
1993年度: 1,100千円 (直接経費: 1,100千円)
1992年度: 4,900千円 (直接経費: 4,900千円)
1991年度: 10,400千円 (直接経費: 10,400千円)
キーワード自由書式文書 / 文書画像 / データベース / 文字認識 / 検索索引 / デ-タベ-ス
研究概要

本研究は,自由書式文書を対象として,データの入力時に人間が介入することなく,検索索引を自動的に生成する文書画像データベースを構築することを目的とする.本研究において得られた成果を以下に示す.
・カラー文書画像処理
同一文字列中の文字は単一色から構成されているという仮定のもとに,カラー文書画像に対して色のクラスタリングを適用した文字パタン抽出法を開発した.また,文字の輪郭に着目し,写真に重ねて書かれた文字を抽出する手法を開発した.文字パタン抽出以外の処理としては,色情報を積極的に利用した写真領域の抽出法を開発した.
・自由書式文書画像からの文字パタンの抽出
文字切り出しの誤りに対処する方法として,切り出した各文字に対して文字認識を行い,単語辞書との照合を行う手法を提案した.また,任意の傾きで書かれた文字パタン列を抽出する手法を開発した.文字認識については,文字の複雑さを表す尺度を定義し,この値と,結果の信頼できる文字認識に必要な解像度の下限との関係を明らかにした.
・文書画像の検索手法
文書画像中の各文字について複数の文字候補を蓄積し,与えられた文字列の出現位置を同定する検索アルゴリズムを提案した.また,文書画像から抽出された単語を基にして,ユーザのキーワード想起を支援する手法を開発した.また,人間とのインタフェースからみた使いやすい検索索引を検討し,カラー文書画像を概略画によって検索する手法を実現した.
・文書画像データベースのための分散並列処理
カラー文書画像データベースシステムの実行環境として,既存のLANのみを用いた分散並列処理環境を構築した.ここでは,画像処理,文字認識処理,構造解析処理といったさまざまなレベルの処理をモジュール化することによって,モジュール単位での並列実行を実現している.

報告書

(4件)
  • 1993 実績報告書   研究成果報告書概要
  • 1992 実績報告書
  • 1991 実績報告書
  • 研究成果

    (44件)

すべて その他

すべて 文献書誌 (44件)

  • [文献書誌] Senda Shuji: "Document Image Retrieval System Using Charcater Candidates Generated by Character Recognition Process" Proceedings of the 2nd ICDAR. 541-546 (1993)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1993 研究成果報告書概要
  • [文献書誌] Takizawa Kei: "Extraction of Character Strings from Unformed Document Images" Proc.of 2nd ICDAR. 660-663 (1993)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1993 研究成果報告書概要
  • [文献書誌] 仙田修司: "文書画像理解のための分散処理方式" 情報処理学会第44回(平成4年前期)全国大会. 1M. 1-233 (1992)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1993 研究成果報告書概要
  • [文献書誌] 滝沢圭: "単語レベルの知識を用いた文字切り出し法" 画像電子学会研究会. 19-24 (1992)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1993 研究成果報告書概要
  • [文献書誌] 仙田修司: "分散並列処理による文書画像データベースシステムの設計" 情報処理学会第45回(平成4年後期)全国大会. 4J. 2-215 (1992)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1993 研究成果報告書概要
  • [文献書誌] 西村真一: "文字認識に必要な解像度についての一検討" 情報処理学会第45回(平成4年後期)全国大会. 2G. 2-279 (1992)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1993 研究成果報告書概要
  • [文献書誌] 有田大作: "書式のない文書画像からの文字パターン列の抽出" 情報処理学会第45回(平成4年後期)全国大会. 2G. 2-281 (1992)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1993 研究成果報告書概要
  • [文献書誌] 森晴信: "概略画を用いたマルチメディア文書画像の検索" 情報処理学会第45回(平成4年後期)全国大会. 2S. 4-201 (1992)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1993 研究成果報告書概要
  • [文献書誌] 仙田修司: "モジュールのパイプライン結合による分散処理の一方式" マルチメディア通信と分散処理. 58-17. 131-138 (1992)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1993 研究成果報告書概要
  • [文献書誌] 滝沢圭: "単語レベルの知識を用いた文字切り出し法" 電子情報通信学会全国大会. D-560. 321 (1993)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1993 研究成果報告書概要
  • [文献書誌] 仙田修司: "カラー画像からの文字パタン抽出法" 情報処理学会第47回(平成5年後期)全国大会. 4L. 2-133 (1993)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1993 研究成果報告書概要
  • [文献書誌] 仙田修司: "文書画像を対象とした未知単語の抽出法" 情報処理学会第48回全国大会. 1M. 2-15 (1994)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1993 研究成果報告書概要
  • [文献書誌] 津田宏治: "自動作成された単語間リンクによる検索質問作成支援" 情報処理学会第48回全国大会. 4E. 4-157 (1994)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1993 研究成果報告書概要
  • [文献書誌] 久保亮二: "カラー文書画像からの写真領域抽出手法" 情報処理学会第48回全国大会. 3M. 2-41 (1994)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1993 研究成果報告書概要
  • [文献書誌] 美濃導彦: "文書画像処理技術の応用-新聞の切抜きと名刺の検索を例として- コンピュータ画像処理,応用実践編2" 総研出版, 127-155 (1991)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1993 研究成果報告書概要
  • [文献書誌] Senda, S.: "Design of a Distributed System for Document Image Understanding" 44th National Convention Record of IPSJ. 1M. 1-233 (1992)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1993 研究成果報告書概要
  • [文献書誌] Takizawa, K.: "Character Segmentation Using Word Collating Checks" Technical Report of IIEEJ. 19-24 (1992)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1993 研究成果報告書概要
  • [文献書誌] Senda, S.: "Design of a Document Image Database System by Distributed Parallel Processing" 45th National Convention Record of IPSJ. 4J. 2-215 (1992)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1993 研究成果報告書概要
  • [文献書誌] Nishimura, S.: "Study on the Requirement of Character-Pattern Resolution for Character Recognition" 45th National Convention Record of IPSJ. 2G. 2-279 (1992)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1993 研究成果報告書概要
  • [文献書誌] Arita, D.: "Extraction of String of Character Patterns from Unformed Document Images" 45th National Convention Record of IPSJ. 2G. 2-281 (1992)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1993 研究成果報告書概要
  • [文献書誌] Mori, H.: "Multimedia Document Image Retrieval Using an Abstract Image" 45th National Convention Record of IPSJ. 2S. 4-201 (1992)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1993 研究成果報告書概要
  • [文献書誌] Senda, S.: "A Distributed Processing Method by Pipeline Connected Modules" IPSJ DPS58-17. 131-138 (1992)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1993 研究成果報告書概要
  • [文献書誌] Takizawa, K.: "Character Segmentation Using Word Collating Checks" IEICE National Convention Record of Information and System. D-560. 321 (1993)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1993 研究成果報告書概要
  • [文献書誌] Senda, S.: "A Method of Extraction of Character Patterns from a Color Image" 47th National Convention Record of IPSJ. 4L. 2-133 (1993)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1993 研究成果報告書概要
  • [文献書誌] Senda, S.: "Document Image Retrieval System Using Character Candidates Generated by Character Recognition Process" Proceedings of the 2nd ICDAR. 541-546 (1993)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1993 研究成果報告書概要
  • [文献書誌] Takizawa, K.: "Extraction of Character Strings form Unformed Document Images" Proc.of 2nd ICDAR. 660-663 (1993)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1993 研究成果報告書概要
  • [文献書誌] Senda, S.: "Extraction Method of Unknown Words form Document Images" 48th National Convention Record of IPSJ. 1M. 2-15 (1994)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1993 研究成果報告書概要
  • [文献書誌] Tsuda, K.: "Query formulation support by automatically generated term-to-term links" 48th National Convention Record of IPSJ. 4E. 4-157 (1994)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1993 研究成果報告書概要
  • [文献書誌] Kubo, R.: "Extraction of Photographic Region from Color Document Images" 48th National Convention Record of IPSJ. 3M. 2-41 (1994)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1993 研究成果報告書概要
  • [文献書誌] 山下哲郎: "シルエット画像からの動物の概略構造認識と種類同定" 信学技報. PRU93-11. 49-56 (1993)

    • 関連する報告書
      1993 実績報告書
  • [文献書誌] 矢敷潤: "並行に抽出された要素候補による投票を用いた線画の顔認識" 信学技報. PRU93-12. 57-64 (1993)

    • 関連する報告書
      1993 実績報告書
  • [文献書誌] 白崎昭彦: "手書きレイアウト図面を理解する版下レイアウト支援システム" 情処論. 34,No.11. 2265-2276 (1993)

    • 関連する報告書
      1993 実績報告書
  • [文献書誌] 神嶌敏弘: "帰納学習を用いた図面部品の抽出・分類規則の形成" 信学技法. PRU93-132. 17-24 (1994)

    • 関連する報告書
      1993 実績報告書
  • [文献書誌] 美濃導彦: "制約充足型画像処理" 信学技報. PRU93-25. 57-64 (1993)

    • 関連する報告書
      1993 実績報告書
  • [文献書誌] 久保亮二: "カラー文書画像からの写真領域抽出手法" 情報処理学会第48回全国大会. 3M. 2-41 (1994)

    • 関連する報告書
      1993 実績報告書
  • [文献書誌] 仙田 修司: "モジュールのパイプライン結合による分散処理の一方式" 情報処理学会研究報告DPS. 92. 131-138 (1992)

    • 関連する報告書
      1992 実績報告書
  • [文献書誌] 滝沢 圭: "単語レベルの知識を用いた文字切り出し法" 画像電子学会研究会. 19-24 (1992)

    • 関連する報告書
      1992 実績報告書
  • [文献書誌] 西村 真一: "文字認識に必要な解像度についての一検討" 情報処理学会第45回全国大会. 2G. 279-280 (1992)

    • 関連する報告書
      1992 実績報告書
  • [文献書誌] 有田 大作: "書式のない文書画像からの文字パターン列の抽出" 情報処理学会第45回全国大会. 2G. 281-282 (1992)

    • 関連する報告書
      1992 実績報告書
  • [文献書誌] 森 晴信: "概略画を用いたマルチメディア文書画像の検索" 情報処理学会第45回全国大会. 2S. 201-202 (1992)

    • 関連する報告書
      1992 実績報告書
  • [文献書誌] 渡辺 憲治,美濃 導彦,池田 克夫: "自由書式文書画像からの"限定キ-ワ-ド"の抽出処理の検討" 第41回情処全大. 5M-5. 206-207 (1990)

    • 関連する報告書
      1991 実績報告書
  • [文献書誌] 葛城 孝次,美濃 導彦,池田 克夫: "自由書式文書からの文字矩形の抽出法" 第41回情処全大. 5M-4. 204-205 (1990)

    • 関連する報告書
      1991 実績報告書
  • [文献書誌] 八木 啓介,美濃 導彦,池田 克夫: "文字写真混在画像からの文字エッジ点候補抽出法" 第41回情処全大. 5M-7. 210-211 (1990)

    • 関連する報告書
      1991 実績報告書
  • [文献書誌] 仙田 修司,美濃 導彦,池田 克夫: "文書画像理解のための分散処理方式" 第44回情処全大. 1M-8. 233-234 (1992)

    • 関連する報告書
      1991 実績報告書

URL: 

公開日: 1991-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi