研究課題/領域番号 |
17K01123
|
研究機関 | 三重大学 |
研究代表者 |
鶴岡 信治 三重大学, 工学研究科, 教授 (30126982)
|
研究分担者 |
高瀬 治彦 三重大学, 工学研究科, 教授 (10283516)
八神 寿徳 三重大学, 地域イノベーション推進機構, 助教 (10402554)
川中 普晴 三重大学, 工学研究科, 准教授 (30437115)
|
研究期間 (年度) |
2017-04-01 – 2020-03-31
|
キーワード | 手書き文字認識 / 深層学習 / 文書画像認識 / 自動採点システム |
研究実績の概要 |
本研究では、筆記者の労力を減らして、パーソナル手書き文字認識システムを構築するために、少数の文字から筆記者の個性(書き癖)を抽出し、多層ニューラルネットを使用し、深層学習法で学習する研究を行っている。過去の深層学習法の研究では使用されていない特徴量(方向頻度分布特徴)を入力層の特徴として使用できるように特徴入力型深層学習法を開発し、文字認識の高精度化を目指している。そしてこの研究成果を使用して、大学生が筆記した答案用紙の手書き文字を認識し、自動採点システムを構築することを目指す。 本年度は、特定の筆記者に書いてもらった手書きひらがな文字を多変量の統計分析により、既に登録してある筆記者の文字から、複数の類似筆記者を選択し、深層学習法により多層ニューラルネットを学習させ、認識実験を行った。その結果、多数の筆記者の書いた文字で学習した汎用辞書による平均認識率92.4%に対して、使用者の文字に近い字形を書く登録されている類似筆記者の文字で学習した専用辞書による平均認識率94.3%に向上した。 また大学生が期末試験時に筆記した答案用紙の自由記述欄を対象として、個別文字行を分離するアルゴリズムを構築し、分離精度を評価する実験を実施し、従来手法では61%であった446行のスキャナで電子化した文書画像を対象に、黒が素周辺分布の谷位置に着目した個別文字行の分離方法を開発し、88%まで向上した。 また文字認識ライブラリーを購入し、自作したプログラムと購入したプログラムの連係動作を確認した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
本研究では、過去の深層学習法の研究では使用されていない特徴量(方向頻度分布特徴)を入力層の特徴として使用できるように特徴入力型深層学習法を開発しているが、従来型の入力層の特徴量向けの深層学習法を当初、改良しながら、文字認識の学習法を研究していたために、試行錯誤を多数行わなければならず、研究はやや遅れている。しかし、多様な学習方法により、認識実験を行ったために、深層学習の振る舞いについての多数の知見を得たので、今後の研究に役立てることができる。
|
今後の研究の推進方策 |
手書き答案画像から個別文字行の分離精度はまだ十分でないので、今後も分離精度を向上させる提案を続ける。また、授業科目で使用している教材を文字認識し、授業専用の重要度を付加したキーワード辞書を作成する。そして、今までに構築した手書き文字認識システムによる個別文字認識の結果を基に、キーワード辞書を使用した文章理解のシステムを構築する。多段階の評価点は、正解例と解答文のキーワード間の対応関係を探索し、統計的な手法により、新規に多段階の評点を付加する方法(総合的な評価点(多段階含意認識法))を提案し、算出方法を考察する。この多段階含意認識法を組み込んだ自動採点システムのユーザーインタフェースを本研究者以外の使用者が使用できるように構築し、教師の採点結果との一致度により性能を評価するシステムを構築し、教師の採点方法を自動学習することを目指す。
|
次年度使用額が生じた理由 |
研究が予定よりやや遅れており、研究成果が予想より遅れたために、研究成果を発表する予定の学会の原稿締切りに間に合わなかったため、予算の余りが出ている。しかし、最近研究成果が出てきたため、既に国際会議に申し込んでおり、論文が採択されており、次年度に予算を執行する予定である。
|