研究概要 |
古文書ディジタルアーカイブにおける高速な検索手法を確立するために,検索に適した局所的特徴量を明らかにするとともに,検索に適した局所的特徴量を高速に計算するための並列プロセッサへのアルゴリズムの組み込み,および,Locality Sensitive Hashingを応用した高速化手法を研究した.主要な成果は以下のとおりである. 1 古文書のスリット化と固有空間法を用いた検索 文字列画像をスリット状に切り出した画像のシーケンスに固有空間法を適用して低次元化することにより効率的なマッチングが可能にした.江戸末期の毛筆文書画像を対象にキーワードの検索を行った実験で,平均適合率73〜93%を得た. 2 勾配ベクトルの分布情報を用いた検索 特徴量を改良し,勾配ベクトルの分布情報を用いることで,平均適合率は95〜98%に改善することができた. 3 局所特徴量による照合の応用 頻出語句の抽出およびその出現パターンを記述し,特徴量に基づくマッピングを併用することにより,トランスクリプトマッピングを行う手法を開発した. 4 局所的特徴量の並列プロセッサによる高速計算 画像の局所的勾配分布に基づく特徴量を高速に計算するために,MX-1プロセッサによる高速画像処理について検討を行った.並列プロセッサに向いているSURF特徴量について,並列プログラミングにより,リアルタイムに特徴量の計算を実現した. 5 局所的特徴量の確率的(近似的)ハッシングによる高速検索 古文書文字画像データベースから類似の文字を高速に近傍探索し,翻刻を支援するための辞書検索システムについて検討を行った.クエリ文字画像について得られた特徴量をLocality Sensitive Hashingによって近傍探索することで正解を含むグループを発見する方式の有効性を検証した.
|