• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2020 年度 実績報告書

多次元構造解析の確立による手書き数式認識の高次化

研究課題

研究課題/領域番号 19H01117
研究機関東京農工大学

研究代表者

中川 正樹  東京農工大学, 工学(系)研究科(研究院), 名誉教授 (10126295)

研究期間 (年度) 2019-04-01 – 2023-03-31
キーワード手書き数式認識 / 構造解析 / 文脈処理 / 深層ニューラルネットワーク / アテンション
研究実績の概要

本研究では,シンボル分割,シンボル認識,位置関係認識に曖昧性を有する2次元構造の手書き数式を対象に,その構造認識,特にその中核の文脈処理のレベルを飛躍的に高めることに挑んでいる.2年間の研究において,まず,研究基盤を構築することができた.手書き数式パターンを試験問題に対する解答として収集するツールの開発や,解答をサーバに集めるシステムを作成した.また,数学10問の問題に対する正答と誤答を含む手書き数式解答200人分 (Dset_Mix) を一部疑似的に作成して公開した.さらに,大学新入試の試行として行われた模擬試験の解答5万人×2年分を入手した.
そして,研究の本体においても多くの成果を挙げることができた.CTC-BLSTMを利用したBidirectional Contextによる数式認識システムの作成;半教師付き学習によるend-to-end手書き数式認識のテストベッドの作成;オンライン入力方式あるいはオフライン入力方式の手書き数式に対して深層ニューラルネットワークによる学習した特徴などを用いたクラスタリング手法の提案;半教師付き学習とCTCに補助学習を導入したオフラインの手書き数式認識率の向上;教師データとして一次元のLaTeXではなく2次元の木構造を用いる手書き数式認識学習方式の利点の明確化などである.
これらをQ1論文誌であるPRLに4件,電子情報通信学会の英文誌に1件,国際会議であるICDAR で1件,その関連ワークショップで2件,そして,ICFHRで2件発表している.
本研究は,発足後に国立教育政策研究所の安野史子教授と独立行政法人・大学入試センターの石岡恒徳教授との連携により,想定以上の手書き数式パターンを入手することができた.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

これまでに,研究基盤として次を実現している:(1)タブレット上に試験問題を表示して解答を得る形で数式を収集するツールを作成した.(2)解答をサーバに収集するシステムを作成した.(3)国立教育政策研究所の安野史子教授との連携で,高校生から数学解答を収集した.(4)数学10問の問題に対する正答と誤答を含む手書き数式解答200人分 (Dset_Mix) を一部疑似的に作成して公開した(正答と誤答を用意し,本物の手書きと人工的に合成したものを合わせて各問200解答用意した).これはオンライン入力形式であり,時系列情報を落とすことで,オフライン方式の手書き数式の認識手法やクラスタリング手法に評価できる.(5)計画にはなかったが大学新入試の試行として行われた模擬試験の解答5万人×2年分を入手した.さらに研究の本体として次の成果を得ている:(1)数式を表現するContext Free Grammarの最適化を試みた.(2)CTC-BLSTMを利用したBidirectional Contextによる数式認識システムを作成した.(3)半教師付き学習によるend-to-end手書き数式認識のテストベッドを作成した.(4)オンライン入力方式あるいはオフライン入力方式の手書き数式に対して,深層ニューラルネットワークにより学習した特徴などを用いたクラスタリング手法を提案した.(5)高次元特徴を効果的に表現するための距離依存表現を提案した.(6)オンライン入力方式の手書き数式に対してBLSTMによるシンボル分割と認識手法を改善した.(7)半教師付き学習とCTCに補助学習を導入し,オフラインの手書き数式認識率を向上させた.(8)教師データとして一次元のLaTeXではなく2次元の木構造を用いる手書き数式認識学習方式の利点を明確化した.

今後の研究の推進方策

本研究は,発足後に国立教育政策研究所の安野史子教授と独立行政法人・大学入試センターの石岡恒徳教授との連携により,想定以上の手書き数式パターンを入手することができた.これらを計画に反映して,今後は次のことを計画している:(1)BLSTMと木構造表現によりシンボルの関係認識と言語モデルを改善する.(2)複数の箇所にAttentionを払うMulti-attentionの方式としてTransformerXL言語モデルを実現し,BLSTMやn-gramに対するTransformerXL言語モデルの効果を評価する.(3)数式の2次元空間構造を学習するためのグラフモデルとMRFモデルを比較検討する.(4)確率文脈自由文法の改善を試みる.
(5)オンライン方式とオフライン方式の手書き数式認識のためのTransformer デコーダを実装し評価する.(6)大学新入試の試行模擬解答パターンは有用であるが,独自のオンライン入力形式の解答パターンの収集を継続する.(7)検討してきている複数の方式を評価し,各方式の効果と限界を明らかにする.その理論的解明を試みる.(8)複数方式を統合することで,認識率がどの程度向上するか実験する.(9)一般的な構造解析問題への普遍化を図る.(10)最適方式を数式認識システムやクラスタリングシステムに組み込む.(11)実際の高校生の手書き数式パターンと大学新入試の試行模擬解答パターンを対象に手書き数式解答の自動採点・採点支援システムを実験する.

  • 研究成果

    (5件)

すべて 2021 2020

すべて 雑誌論文 (2件) (うち査読あり 2件、 オープンアクセス 1件) 学会発表 (3件) (うち国際学会 3件)

  • [雑誌論文] Clustering online handwritten mathematical expressions2021

    • 著者名/発表者名
      [1]Huy Quang Ung, Cuong Tuan Nguyen, Khanh Minh Phan, Vu Tran Minh Khuong and Masaki Nakagawa
    • 雑誌名

      Pattern Recognition Letters,

      巻: Vol. 146, ページ: 267-275

    • DOI

      10.1016/j.patrec.2021.03.027

    • 査読あり
  • [雑誌論文] Clustering of Handwritten Mathematical Expressions for Computer-Assisted Marking2021

    • 著者名/発表者名
      Vu tran minh KHUONG,Khanh Minh PHAN, Huy Quang UNG, Cuong Tuan NGUYEN, Masaki NAKAGAWA
    • 雑誌名

      IEICE TRANS.INF.& SYST.

      巻: E104-D NO.2 ページ: 275-284

    • DOI

      10.1587/TRANSINF.2020EDP7087

    • 査読あり / オープンアクセス
  • [学会発表] Online Handwritten Mathematical Symbol Segmentation and Recognition with Bidirectional Context2020

    • 著者名/発表者名
      Cuong Tuan Nguyen, Thanh-Nghia Truong, Huy Quang Ung and Masaki Nakagawa
    • 学会等名
      ICFHR
    • 国際学会
  • [学会発表] Evaluation of Secure Pad Resilient to Shoulder Hacking2020

    • 著者名/発表者名
      Kokoro Kobayashi , Tsuyoshi Oguni, and Masaki Nakagawa
    • 学会等名
      HCII 2020
    • 国際学会
  • [学会発表] Improvement of End-to-End Offline Handwritten Mathematical Expression Recognition by Weakly Supervised Learning2020

    • 著者名/発表者名
      Thanh-Nghia Truong, Cuong Tuan Nguyen, Khanh Minh Phan, and Masaki Nakagawa
    • 学会等名
      ICFHR
    • 国際学会

URL: 

公開日: 2021-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi