• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2007 Fiscal Year Annual Research Report

画像特徴量による文書画像の擬似コード化およびその高速検索の研究

Research Project

Project/Area Number 19700079
Research InstitutionHokkaido University

Principal Investigator

寺沢 憲吾  Hokkaido University, 大学院・情報科学研究科, 博士研究員 (10435985)

Keywords画像、文章、音声等認識 / コンテンツ・アーカイブ / アルゴリズム / 局所特徴量 / 文書画像 / ワードスポッティング / 全文検索
Research Abstract

今年度は画像特徴量を用いてOCRを経ることなく文書画像中の文字列を擬似コード化して全文検索を行う手法を開発し、国際会議ICDAR2007で公表した。本手法は従来用いられてきた高次元特徴ベクトルをより取り扱いやすい擬似コード表現(LSPC=Locality Sensitive Pseudo Code)に変換するというものであるが、その際に情報を大きく損なうことがないという点に特長がある。この擬似コードに基づく全文検索は、従来の高次元ベクトルに基づく全文検索に比べて精度は若干劣るものの、検索時間ははるかに高速である。この研究発表は同国際会議において最優秀論文賞(IAPR/ICDAR Best Paper Award)にノミネートされる(全論文中3論文がノミネート)という高い評価を得た。また、本研究では擬似コード化に際してLSH(Locality Sensitive Hashing)を用いたが、本手法を開発する際の副産物として、対象となるベクトルが全てノルム1に正規化されている場合は従来知られているLSHよりも高性能な近傍探索が可能であることに気付き、そのアルゴリズムを開発した。この研究成果をLSHのバリエーションの一つとしてまとめた上で、SLSH(Spherical LSH)として国際会議WADS2007で公表した。LSHは近似的近傍探索アルゴリズムの有力な方法として近年大きな注目を集めているアルゴリズムであり、その部分的改良である本手法は、オリジナルのLSHの開発者や他の近傍探索アルゴリズム研究者から問い合わせを受けるなど注目されている。

  • Research Products

    (2 results)

All 2007

All Presentation (2 results)

  • [Presentation] Locality Sensitive Pseudo-Code for Document Images2007

    • Author(s)
      Kengo Terasawa
    • Organizer
      9th International Conference on Documents Analysis and Recognition (ICDAR2007)
    • Place of Presentation
      Curitiba, Brazil.
    • Year and Date
      20070923-26
  • [Presentation] Spherical LSH for Approximate Nearest Neighbor Search on Unit Hypersphere2007

    • Author(s)
      Kengo Terasawa
    • Organizer
      10th Workshop on Algorithms and Data Structures(WADS2007)
    • Place of Presentation
      Halifax, Canada.
    • Year and Date
      20070815-17

URL: 

Published: 2010-02-04   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi