2011 Fiscal Year Research-status Report
文書の置き方に依存しない文書情報入力システムの構築
Project/Area Number |
23500116
|
Research Institution | University of Fukui |
Principal Investigator |
長谷 博行 福井大学, 工学(系)研究科(研究院), 教授 (90142273)
|
Project Period (FY) |
2011-04-28 – 2014-03-31
|
Keywords | 文書画像処理 / レイアウト解析 / 文字認識 / 文献データベース |
Research Abstract |
本研究は、膨大な日本書籍・雑誌の内容を電子化することを目的として、カメラ画像からの実時間文字認識システムの構築を目指す。特に、任意に傾いた文書にも対応でき、安価なシステムにすることにより、手軽な入力作業を可能にする。このシステムは大量情報の整理・検索への使用を目的とする。一般に普及してきた安価な民生用ハイビジョン規格カメラの解像度は十分ではないため、書籍の横向き入力に対応できるようなシステムにしたい。そのため文字の回転に強い認識方式の開発と、既に開発済のレイアウト解析法を統合して簡易な文書電子化システムを研究開発する。初年度は高性能パソコン、高解像度カメラ等を購入し、実験設備の整備を行った。その環境下で論文誌の全ページを入力し、文書画像の処理の方針を検討した。また、これまで蓄積してきた文書処理プログラムの再利用を目指して、本目的に合うよう修正作業に入った。また、文字認識においては、初年度は膨大な日本語カテゴリ3000 文字種に拡張した場合の、最適なパラメータを実験的に求める。また、同文字種で異なるフォントにおける部分固有空間上の"ふるまい"の違いを利用した認識手法について研究を進める。1年目に行う実験はデータ作成と固有空間生成を行い、あらゆる条件下で認識実験を行い、適切なパラメータを見つけることである。まず、3000文字種の画像データ作成後、任意の角度から認識できるよう回転文字データを生成。次に、カテゴリ毎に固有ベクトルを計算し、固有空間に多様体を生成する。カメラからの画像から文字認識実験を行い、適切なパラメータを取得する。このように、カテゴリ数、記憶量、計算量共膨大なので、高速でメモリ容量の大きなのコンピュータを使って実験を行っている。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
申請書の研究計画にあるように、初年度は環境整備とともに、文字認識のシミュレーションから最適パラメータを求めることにある。そのような手順で研究を進めている。また、文字認識関連の研究発表を2件行った。
|
Strategy for Future Research Activity |
平成24 年度の前半では、これまでの研究成果を考察し、不十分な部分の検討と追加実験を行う。特にこれまで次の問題点が分かっている。この点について検討したい。(1) 類似文字種は部分空間上で必ずしも似たような振る舞いをするわけではない。これまでの英文字からの経験では、例えば、"C"と"G"は形状が似ているが部分空間上では異なった振る舞いをする。また、異なる形状の文字種同士でも同様な振る舞いをするものもある。例えば、"D"、"I"、"S"がそうである。このような事実は日本文字においても生じると考えられる。(2) 本手法は計算量が多いので、計算量を減らす方法を検討したい。2 年目前半では学術的成果が期待できるので、研究成果をまとめ、国内外の学会へ成果発表を行う。また、これらの研究を通して新たに疑問点が出ると思われるので、次の研究の種としたい。(3) さらに、2 年目には、レイアウト解析プログラムと統合してシステムの完成を目指す。
|
Expenditure Plans for the Next FY Research Funding |
消耗品、旅費、学会発表のための投稿に必要な経費として使用する。
|