研究課題/領域番号 |
23K21933
|
補助金の研究課題番号 |
22H00661 (2022-2023)
|
研究種目 |
基盤研究(B)
|
配分区分 | 基金 (2024) 補助金 (2022-2023) |
応募区分 | 一般 |
審査区分 |
小区分02060:言語学関連
|
研究機関 | 豊田工業高等専門学校 |
研究代表者 |
木村 勉 豊田工業高等専門学校, 情報工学科, 教授 (80225044)
|
研究分担者 |
三浦 哲平 豊田工業高等専門学校, 情報工学科, 准教授 (20964307)
酒向 慎司 名古屋工業大学, 工学(系)研究科(研究院), 准教授 (30396791)
|
研究期間 (年度) |
2022-04-01 – 2026-03-31
|
研究課題ステータス |
交付 (2024年度)
|
配分額 *注記 |
17,420千円 (直接経費: 13,400千円、間接経費: 4,020千円)
2025年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
2024年度: 3,640千円 (直接経費: 2,800千円、間接経費: 840千円)
2023年度: 5,070千円 (直接経費: 3,900千円、間接経費: 1,170千円)
2022年度: 6,760千円 (直接経費: 5,200千円、間接経費: 1,560千円)
|
キーワード | 手話認識 / 深層学習 / アノテーション / データセット / 半自動 / 手話文章 / ディープラーニング / 教師データ / Conformer / 手話 / 認識 |
研究開始時の研究の概要 |
我々は深層学習を用いた手話翻訳システムを開発しているが,これを実現するには手話認識や意味解析などが必要である.それらには手話コーパスの構築や教師あり学習による深層学習向けのラベル付きデータが大量に必要であるが,ラベル付けには手間がかかる.そこで本研究ではラベルがない手話動画に対して,ラベル付けを半自動的に行うシステムを開発・公開する. 本研究では,このシステムを用いて作成したラベル付き手話データセットを手話言語学研究者や手話工学研究者らに提供し,手話の意味解析や手話認識に関する研究をサポートする.
|
研究実績の概要 |
本研究の目的は,深層学習を用いた手話翻訳システムの開発に必要なアノテーション済みの教師データを半自動的に生成するシステムを作成することである.手話翻訳システムの開発には,手話コーパスの構築や教師あり学習による深層学習向けのアプリケーション済みデータが大量に必要であるが,アノテーションを行うのに手間がかかる.そこで本研究ではラベルがない手話動画に対して,アノテーションを半自動的に行うシステムを開発・公開する.このシステムはアノテーション前の教師データに対して,程度認識が可能な手話認識エンジンを用いて,認識できる単語にはラベル付を行い,認識ができなかった単語は人手でラベル付を行う. 手話認識エンジンについて,今年度は,手話辞書・手話翻訳システムに導入する手話文認識モデルの構造を見直し,認識性能の向上を図った.また,認識モデルへの学習データについても,自然言語処理の2-gramsの考えを導入したデータセットを作成し,認識モデルの学習の影響を調査した.しかしながら,昨年度同様,データセットの数が圧倒的に足りないため,精度が思ったように上がらなかった. GUIについては,クラウド上で再設計を行い,操作性の向上を図るとともに,手話認識エンジンと連携させる仕組みを用意している.また,手話認識エンジンの応用として,認識結果と動画とともに可視化できるツールの開発も行った. さらに,手話を正しく認識するには,読唇も必要となる.これは同じ手話でも意味が異なる語があるためである.口型を読み取ることで意味を把握するため,手話認識には読唇の技術も必要となる.そこで,この読唇についても研究を開始した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
日本手話のデータセットが足りないため,思ったように精度が上がらなかった. また,GUIにいくつか不具合が見つかったため,再設計を行った.現在は,その問題は解決しており,手話認識エンジンと連携をさせて,運用に向けてブラッシュアップを行う.
|
今後の研究の推進方策 |
日本手話のデータセットが足りないため,思ったように精度が上がらなかった. まずは海外の手話データセットを用いて,システム開発を図り,並行して日本手話のデータセットの構築を行う.
|