研究課題/領域番号 |
20K11868
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61010:知覚情報処理関連
|
研究機関 | 鹿児島大学 |
研究代表者 |
朱 碧蘭 鹿児島大学, 理工学域工学系, 准教授 (50466918)
|
研究期間 (年度) |
2020-04-01 – 2021-03-31
|
研究課題ステータス |
中途終了 (2020年度)
|
配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2022年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2021年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2020年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
|
キーワード | 手書き認識 / オンライン認識 / 確率モデル / 手書き文字認識 / Deep learning |
研究開始時の研究の概要 |
本研究は,スマートフォンやタブレットなどのタッチベースデバイスから入力される日本語手書き認識について,Deep Learningへ適用するための効率的な方式を検討し,実用的なモデルと手法の確立を目指す.現在,従来のペン入力機器に加えて,スマートフォンやPad型PCなどのタッチ入力の機器が急速に普及しており,自然な入力手段として,オンライン手書き認識技術は重要性を増している.機械学習アルゴリズムの1つであるDeep Learningが各分野のコンペティションで優勝し話題になっている.そこで,Deep Learningへ適用するためのオンライン日本語手書き文字認識システムを目指し,実用的な認識モデルと手法を確立する.
|
研究実績の概要 |
日本語のオンライン手書認識においては,続け字と草書体の手書きにおける誤認識が課題として残っている.Deep Learning手法は近年注目を浴びていて,各分野で最高精度を達成している. Deep Learningによる英語手書き認識も最高精度を達成したが,日本語手書き文字ではDeep Learningを利用したシステムは字種数を約3000文字に限定して,実用的なレベルまで達していない. Deep Learningネットワークの規模限定により4000個以下のクラスター認識が適切であると思われる.大規模な認識による膨大なネットワークの計算においては,コンピュータの計算能力を超える問題と学習データ不足による精度低下の問題がある.7000個以上の字種を含んだ常用日本語文字認識において,Deep Learningによるものはまだ実現されていない. 申請者は漢字間で部首モデルを共有するMarkov Random Field による日本語文字認識方式に成功していた.この知見を活かし,本研究は数百個の部首などの文字属性を識別するDeep Learningシステムを構築することにより,数万個の日本語文字認識を行う手法を提案し,認識精度低下の既存問題を解決する.Deep Learningへの適用を目指した実用的なオンライン日本語手書き文字認識システムを実現する.既存の文字認識手法と最先端の機械学習手法を融合し,欠点を補う統一的な認識モデルを確立する. 本学と中国科学院自動化研究所とニューヨーク州立大学バッファロー校でそれぞれ作成された大規模データベースなどを利用し,既存手法との比較・検討の上に,PDCAサイクルを回して標記の目標を追及した.国際会議や論文誌などの場で研究成果を公表するとともに,研究に必要な意見交換を行った.
|