2007 Fiscal Year Annual Research Report
画像特徴量による文書画像の擬似コード化およびその高速検索の研究
Project/Area Number |
19700079
|
Research Institution | Hokkaido University |
Principal Investigator |
寺沢 憲吾 Hokkaido University, 大学院・情報科学研究科, 博士研究員 (10435985)
|
Keywords | 画像、文章、音声等認識 / コンテンツ・アーカイブ / アルゴリズム / 局所特徴量 / 文書画像 / ワードスポッティング / 全文検索 |
Research Abstract |
今年度は画像特徴量を用いてOCRを経ることなく文書画像中の文字列を擬似コード化して全文検索を行う手法を開発し、国際会議ICDAR2007で公表した。本手法は従来用いられてきた高次元特徴ベクトルをより取り扱いやすい擬似コード表現(LSPC=Locality Sensitive Pseudo Code)に変換するというものであるが、その際に情報を大きく損なうことがないという点に特長がある。この擬似コードに基づく全文検索は、従来の高次元ベクトルに基づく全文検索に比べて精度は若干劣るものの、検索時間ははるかに高速である。この研究発表は同国際会議において最優秀論文賞(IAPR/ICDAR Best Paper Award)にノミネートされる(全論文中3論文がノミネート)という高い評価を得た。また、本研究では擬似コード化に際してLSH(Locality Sensitive Hashing)を用いたが、本手法を開発する際の副産物として、対象となるベクトルが全てノルム1に正規化されている場合は従来知られているLSHよりも高性能な近傍探索が可能であることに気付き、そのアルゴリズムを開発した。この研究成果をLSHのバリエーションの一つとしてまとめた上で、SLSH(Spherical LSH)として国際会議WADS2007で公表した。LSHは近似的近傍探索アルゴリズムの有力な方法として近年大きな注目を集めているアルゴリズムであり、その部分的改良である本手法は、オリジナルのLSHの開発者や他の近傍探索アルゴリズム研究者から問い合わせを受けるなど注目されている。
|
Research Products
(2 results)