2023 Fiscal Year Annual Research Report
手話コーパス,深層学習向けラベル付き手話データ半自動生成システムの開発
Project/Area Number |
22H00661
|
Allocation Type | Single-year Grants |
Research Institution | National Institute of Technology, Toyota College |
Principal Investigator |
木村 勉 豊田工業高等専門学校, 情報工学科, 教授 (80225044)
|
Co-Investigator(Kenkyū-buntansha) |
三浦 哲平 豊田工業高等専門学校, 情報工学科, 助教 (20964307)
酒向 慎司 名古屋工業大学, 工学(系)研究科(研究院), 准教授 (30396791)
|
Project Period (FY) |
2022-04-01 – 2026-03-31
|
Keywords | 手話認識 / 深層学習 / アノテーション / 半自動 / データセット |
Outline of Annual Research Achievements |
本研究の目的は,深層学習を用いた手話翻訳システムの開発に必要なアノテーション済みの教師データを半自動的に生成するシステムを作成することである.手話翻訳システムの開発には,手話コーパスの構築や教師あり学習による深層学習向けのアプリケーション済みデータが大量に必要であるが,アノテーションを行うのに手間がかかる.そこで本研究ではラベルがない手話動画に対して,アノテーションを半自動的に行うシステムを開発・公開する.このシステムはアノテーション前の教師データに対して,程度認識が可能な手話認識エンジンを用いて,認識できる単語にはラベル付を行い,認識ができなかった単語は人手でラベル付を行う. 手話認識エンジンについて,今年度は,手話辞書・手話翻訳システムに導入する手話文認識モデルの構造を見直し,認識性能の向上を図った.また,認識モデルへの学習データについても,自然言語処理の2-gramsの考えを導入したデータセットを作成し,認識モデルの学習の影響を調査した.しかしながら,昨年度同様,データセットの数が圧倒的に足りないため,精度が思ったように上がらなかった. GUIについては,クラウド上で再設計を行い,操作性の向上を図るとともに,手話認識エンジンと連携させる仕組みを用意している.また,手話認識エンジンの応用として,認識結果と動画とともに可視化できるツールの開発も行った. さらに,手話を正しく認識するには,読唇も必要となる.これは同じ手話でも意味が異なる語があるためである.口型を読み取ることで意味を把握するため,手話認識には読唇の技術も必要となる.そこで,この読唇についても研究を開始した.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
日本手話のデータセットが足りないため,思ったように精度が上がらなかった. また,GUIにいくつか不具合が見つかったため,再設計を行った.現在は,その問題は解決しており,手話認識エンジンと連携をさせて,運用に向けてブラッシュアップを行う.
|
Strategy for Future Research Activity |
日本手話のデータセットが足りないため,思ったように精度が上がらなかった. まずは海外の手話データセットを用いて,システム開発を図り,並行して日本手話のデータセットの構築を行う.
|