2012 Fiscal Year Research-status Report
文書の置き方に依存しない文書情報入力システムの構築
Project/Area Number |
23500116
|
Research Institution | University of Fukui |
Principal Investigator |
長谷 博行 福井大学, 工学(系)研究科(研究院), 教授 (90142273)
|
Keywords | 文字認識 / 文書構造 / データベース |
Research Abstract |
本研究課題は、主に二つの課題に分割して推進している。ひとつは「文書の置き方に依存しない」方式を確立するために、日本語回転文字認識の研究を行っており、同一書体であれば99%以上の認識率と±2度の角度推定精度を得ている。この研究成果を、下記の国際学会で発表した。 ・Rotated Japanese Character Recognition,IWAIT2013,2013-01 ・Rotated Kanji Character Recognition,9-28,MVA2013,2013-05 (査読付き) 他方、文書形態解析の研究を進めており、紙の形で古くから保存されている学会論文誌を画像として読み取り、傾きを上記方法で推定して補正し、文書形態解析から論文第一ページを抽出して、論文ごとに振り分け、解析情報からデータベースを構築する予定である。現在、傾き補正、前処理を終え、論文第一ページの検出処理を行っている。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
文書の傾きを検出するための回転文字認識の研究は順調であるが、文書構造解析の研究がやや遅れている。
|
Strategy for Future Research Activity |
紙の形で保存されている学会論文誌をカメラで画像として取得し、本研究の回転文字認識手法により文書の傾きを検出し、それにより補正した文書画像から論文第一ページの判別を行う。論文ごとに振り分ける解析情報を利用して文字列を抽出し、文字認識を経てデータベースを構築する。
|
Expenditure Plans for the Next FY Research Funding |
学会発表, 報告書作成 など
|
Research Products
(2 results)