研究課題/領域番号 |
21K17761
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分61010:知覚情報処理関連
|
研究機関 | 東京農工大学 |
研究代表者 |
NGUYENTUAN CUONG 東京農工大学, 工学(系)研究科(研究院), 特任助教 (10814246)
|
研究期間 (年度) |
2021-04-01 – 2023-03-31
|
研究課題ステータス |
中途終了 (2022年度)
|
配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2023年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2022年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2021年度: 2,860千円 (直接経費: 2,200千円、間接経費: 660千円)
|
キーワード | Similarity / Transformer / Graph Neural Networks / Minimum Spanning Tree / 距離学習 / Seq2Seq / 手書き数式 / クラスタリング / deep metric learning / clustering / mathematical expression / handwriting |
研究開始時の研究の概要 |
Learning structural representation of data samples through their sub-structures and the relations between these sub-structures is efficient since the sub-structures and relations are shared among the data samples. As supervised learning models requires annotations of these sub-structures and relations, which is costly and unfeasible for some type of data, automatic learning of these sub-structures and relations are necessary. We propose a deep metric learning method based on attention generative model for automatically focus on learning the discriminative local features as the sub-structures.
|
研究実績の概要 |
今年はオンライン手書き数式の類似度とGraph手法で手書き数式認識の研究をした。オンライン手書き数式の類似度では、数式パターンとLatexの列の類似度を推定する手法をである。手書き数式答案の採点や手書き数式検索などの応用がある。この類似度を計算するため、シンボル・位置関係の列の経由で、オンライン手書き数式をRecurrent Neural Networksに入力し、シンボル・位置関係列を出力し、また、LatexからTransformerSeq2Seqを入力し、シンボル・位置関係を出力する。その二つのシンボル・位置関係列をTemporal Classification Lossで、類似度を推定ができた。Graph手法で手書き数式認識では、オンライン手書き数式からRecurrent Neural Networksを入力し、シンボル・位置関係列を出力し、シンボル全体の位置関係を計算することができる。このGraphを数式の標準(Symbol Label Graph)を生成するため、Minimum Spanning Treeアルゴリズムを研究した。Graph手法は手書き数式認識だけではなく、数式の構造まで認識を行い、また、手書き数式の書き順を依存なしで認識ができた。
|