2021 Fiscal Year Research-status Report
Deep metric learning through local attention and generative loss
Project/Area Number |
21K17761
|
Research Institution | Tokyo University of Agriculture and Technology |
Principal Investigator |
NGUYENTUAN CUONG 東京農工大学, 工学(系)研究科(研究院), 特任准教授 (10814246)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | 距離学習 / Seq2Seq / 手書き数式 / クラスタリング |
Outline of Annual Research Achievements |
本研究では,ロカール特徴とそれらの関係を持ち時系列特徴表現による,深層距離学習手法の基礎理論と手書き数式における応用を中心に挑んでいる. 初年度の研究において,研究基盤を構築することができた.まず,オンライン手書き数式の構造的アップローチとオンライン・オフライン手書き数式のencoder-decoderアップローチ両方を構築した.手書き数式パターンは,Wikipediaコーパスから大量のオンラインとオフライン数式パータンを生成することができた. そして,研究の本体においてはEncoder-decoderのモデルで,Seq2Seq距離を利用し,クラスタリングをした.深層学習モデルの特徴やBag-of-Featureの特徴より高い精度ができた. これらをQ1論文誌であるPRLに1件,国際会議であるICDARで2件,その関連ワークショップで2件,そして,ACPRで1件発表している.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
これまでに,研究基盤として次を実現している:(1)手書き数式パターンは,Wikipediaコーパスから大量のオンラインとオフライン数式パータンを生成することができた.(2)データ拡張する方法を構築した. さらに研究の本体として次の成果を得ている:(1)オンライン手書き数式の構造的アップローチ.(2)オンライン・オフライン手書き数式のencoder-decoderアップローチを構築した.(3)CTC-BLSTMを利用したBidirectional Contextによる数式認識システムを作成した.(4)Seq2Seq距離のクラスタリングを実現した.
|
Strategy for Future Research Activity |
本研究は,今後は次のことを計画している:(1)Seq2Seq距離で,大量のデータで半教師学習または教師なし学習方法を実現する.(2)Graph Neural Networksの認識モデルを構築し,クラスタリングを研究する.(3)構造的数式認識モデルでSeq2Seq距離表現し,クラスタリングを研究する.
|