研究課題/領域番号 |
19H01117
|
研究種目 |
基盤研究(A)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
中区分61:人間情報学およびその関連分野
|
研究機関 | 東京農工大学 |
研究代表者 |
中川 正樹 東京農工大学, 学内共同利用施設等, 特任教授 (10126295)
|
研究分担者 |
NGUYENTUAN CUONG 東京農工大学, 工学(系)研究科(研究院), 特任助教 (10814246)
|
研究期間 (年度) |
2019-04-01 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
37,830千円 (直接経費: 29,100千円、間接経費: 8,730千円)
2022年度: 9,620千円 (直接経費: 7,400千円、間接経費: 2,220千円)
2021年度: 8,060千円 (直接経費: 6,200千円、間接経費: 1,860千円)
2020年度: 9,880千円 (直接経費: 7,600千円、間接経費: 2,280千円)
2019年度: 10,270千円 (直接経費: 7,900千円、間接経費: 2,370千円)
|
キーワード | 手書き数式認識 / 構造解析 / 文脈処理 / 深層ニューラルネットワーク / アテンション |
研究開始時の研究の概要 |
本研究では,手書き数式認識の文脈処理(幾何学的,言語的,及び,ある程度の意味的な文脈を内包)と構造認識を高めるために,ゲート付きの再帰ニューラルネットワークの2次元化,複数の部分構造にアテンションを払うend-to-endのDNN,数式全体を複数のマルコフ確率場で覆ってコスト最小化を求める方法の3つを試み,これらの最適な統合も目指す.ここで提案する方式は2次元の手書き数式認識に特化した方法でないことから,手書き数式認識を包含して,より包括的な構造解析的パターン認識の進展を阻んできたノイズを含む多次元構造あるいはグラフ構造の曖昧性解消に資することを目指す.
|
研究成果の概要 |
本研究では,自然言語と違って文脈処理が効きにくく,シンボルの分割と識別,位置関係の識別のすべてに曖昧性が起こる手書き数式認識のために,深層ニューラルネットワークで非明示的に幾何文脈を学習し,それを補うために言語モデルで明示的に言語文脈を評価する方法が優れていることを明らかにした.具体的には,複数の部分構造に「注意」を払うエンコーダ・デコーダモデルの構成,ラベル付き学習パターンの不足を補う半教師付き学習,言語文脈を評価関数に重み付きで加えることで,認識性能が大幅に向上した.さらに,学習パターン数を人工的に拡大するために,手書き数式パターンの自動生成手法も考案し,国際コンテストに提供した.
|
研究成果の学術的意義や社会的意義 |
手書き数式認識は,構造解析的パターン認識の典型的問題であり,本研究成果は,その進展を阻んできたノイズを含む多次元構造解析の曖昧性解消に資する.また,本研究により,手書きによる数式解答の答合せや,数式解答の自動採点・採点支援の土台ができた.自動採点は,受験者が自分の答案に対する採点を確認し,誤採点があれば照会できる仕組みを前提に,機械が手書き認識と採点を行って受験者に返す.採点結果を即時に受験者に返して復習を促すことができ,採点の労力を軽減できる.採点支援には,解答を事前に機械採点やクラスタリングし,また,採点の注意点を明確にすることで,採点者による誤った採点やばらつきを防止できる.
|