研究課題/領域番号 |
23K21933
|
補助金の研究課題番号 |
22H00661 (2022-2023)
|
研究種目 |
基盤研究(B)
|
配分区分 | 基金 (2024) 補助金 (2022-2023) |
応募区分 | 一般 |
審査区分 |
小区分02060:言語学関連
|
研究機関 | 豊田工業高等専門学校 |
研究代表者 |
木村 勉 豊田工業高等専門学校, 情報工学科, 教授 (80225044)
|
研究分担者 |
三浦 哲平 豊田工業高等専門学校, 情報工学科, 准教授 (20964307)
酒向 慎司 名古屋工業大学, 工学(系)研究科(研究院), 准教授 (30396791)
|
研究期間 (年度) |
2022-04-01 – 2026-03-31
|
研究課題ステータス |
交付 (2024年度)
|
配分額 *注記 |
17,420千円 (直接経費: 13,400千円、間接経費: 4,020千円)
2025年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
2024年度: 3,640千円 (直接経費: 2,800千円、間接経費: 840千円)
2023年度: 5,070千円 (直接経費: 3,900千円、間接経費: 1,170千円)
2022年度: 6,760千円 (直接経費: 5,200千円、間接経費: 1,560千円)
|
キーワード | 手話認識 / 深層学習 / アノテーション / データセット / 半自動 / 手話文章 / ディープラーニング / 教師データ / Conformer / 手話 / 認識 |
研究開始時の研究の概要 |
我々は深層学習を用いた手話翻訳システムを開発しているが,これを実現するには手話認識や意味解析などが必要である.それらには手話コーパスの構築や教師あり学習による深層学習向けのラベル付きデータが大量に必要であるが,ラベル付けには手間がかかる.そこで本研究ではラベルがない手話動画に対して,ラベル付けを半自動的に行うシステムを開発・公開する. 本研究では,このシステムを用いて作成したラベル付き手話データセットを手話言語学研究者や手話工学研究者らに提供し,手話の意味解析や手話認識に関する研究をサポートする.
|
研究実績の概要 |
本研究の目的は,深層学習を用いた手話翻訳システムの開発に必要なアノテーション済みの教師データを半自動的に生成するシステムを作成することである. 手話翻訳システムの開発には,手話コーパスの構築や教師あり学習による深層学習向けのアプリケーション済みデータが大量に必要であるが,アノテーションを行うに手間がかかる.そこで本研究ではラベルがない手話動画に対して,アノテーションを半自動的に行うシステムを開発・公開する.このシステムはアノテーション前の教師データに対して,程度認識が可能な手話認識エンジンを用いて,認識できる単語にはラベル付を行い,認識ができなかった単語は人手でラベル付を行う. 本年度は,コアとなる手話認識エンジンとGUIの設計を行った.手話認識エンジンはConformerをベースとしたネットワークを作成し,学習を行わせている.現在,手話技能検定試験 4級レベルの手話文に対して,約80%程度の認識率を得ている.しかし,教師データは約5,000個であり,そこに含まれる単語は,4級までのすべての単語を含んではいないため,認識できる単語には限りがある(4級までに含まれる約800語彙のうち150語彙程度).そのため,現状ではアプリケーションに組み込むには貧弱である.今年度は教師データを増やして,認識できる語彙数を増加させる. GUIに関しては基本的な構成の設計を終えており,レビューをした後,手話認識エンジンを組み込んで,試作を行う. また,手話翻訳システムが完成した後のアプリへの応用も検討している.具体的には,ウェアラブルな全方位カメラを用いた翻訳システムの開発である.これを用いて日常的に手話翻訳システムが利用できることを目指している.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
新型コロナウイルス感染症のため,教師データの撮影が進まなかったのが,主な原因である.しかしながら,手話認識エンジンの開発は当初の予想より,認識率の高いものができた.
|
今後の研究の推進方策 |
今年度はオンラインで,広く教師データを収集する予定で,多くのデータを収集できると考えている. GUIに関しても基本設計が終わっただけで,試作システムとしても稼働ができていない.認識できる語彙数は少ないが,手話認識エンジンが出来上がっているので,これを組み込んで,試作システムを開発し,検証を行う予定である.
|