• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2007 年度 実績報告書

画像特徴量による文書画像の擬似コード化およびその高速検索の研究

研究課題

研究課題/領域番号 19700079
研究機関北海道大学

研究代表者

寺沢 憲吾  北海道大学, 大学院・情報科学研究科, 博士研究員 (10435985)

キーワード画像、文章、音声等認識 / コンテンツ・アーカイブ / アルゴリズム / 局所特徴量 / 文書画像 / ワードスポッティング / 全文検索
研究概要

今年度は画像特徴量を用いてOCRを経ることなく文書画像中の文字列を擬似コード化して全文検索を行う手法を開発し、国際会議ICDAR2007で公表した。本手法は従来用いられてきた高次元特徴ベクトルをより取り扱いやすい擬似コード表現(LSPC=Locality Sensitive Pseudo Code)に変換するというものであるが、その際に情報を大きく損なうことがないという点に特長がある。この擬似コードに基づく全文検索は、従来の高次元ベクトルに基づく全文検索に比べて精度は若干劣るものの、検索時間ははるかに高速である。この研究発表は同国際会議において最優秀論文賞(IAPR/ICDAR Best Paper Award)にノミネートされる(全論文中3論文がノミネート)という高い評価を得た。また、本研究では擬似コード化に際してLSH(Locality Sensitive Hashing)を用いたが、本手法を開発する際の副産物として、対象となるベクトルが全てノルム1に正規化されている場合は従来知られているLSHよりも高性能な近傍探索が可能であることに気付き、そのアルゴリズムを開発した。この研究成果をLSHのバリエーションの一つとしてまとめた上で、SLSH(Spherical LSH)として国際会議WADS2007で公表した。LSHは近似的近傍探索アルゴリズムの有力な方法として近年大きな注目を集めているアルゴリズムであり、その部分的改良である本手法は、オリジナルのLSHの開発者や他の近傍探索アルゴリズム研究者から問い合わせを受けるなど注目されている。

  • 研究成果

    (2件)

すべて 2007

すべて 学会発表 (2件)

  • [学会発表] Locality Sensitive Pseudo-Code for Document Images2007

    • 著者名/発表者名
      Kengo Terasawa
    • 学会等名
      9th International Conference on Documents Analysis and Recognition (ICDAR2007)
    • 発表場所
      Curitiba, Brazil.
    • 年月日
      20070923-26
  • [学会発表] Spherical LSH for Approximate Nearest Neighbor Search on Unit Hypersphere2007

    • 著者名/発表者名
      Kengo Terasawa
    • 学会等名
      10th Workshop on Algorithms and Data Structures(WADS2007)
    • 発表場所
      Halifax, Canada.
    • 年月日
      20070815-17

URL: 

公開日: 2010-02-04   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi