自己教師あり学習手法による手話認識エンジンの開発

研究課題

研究課題/領域番号	23K17511
研究種目	挑戦的研究(萌芽)
配分区分	基金
審査区分	中区分2:文学、言語学およびその関連分野
研究機関	豊田工業高等専門学校
研究代表者	木村勉豊田工業高等専門学校, 情報工学科, 教授 (80225044)
研究分担者	酒向慎司名古屋工業大学, 工学(系)研究科(研究院), 准教授 (30396791) 三浦哲平豊田工業高等専門学校, 情報工学科, 助教 (20964307)
研究期間 (年度)	2023-06-30 – 2026-03-31
研究課題ステータス	交付 (2023年度)
配分額 *注記	6,240千円 (直接経費: 4,800千円、間接経費: 1,440千円) 2025年度: 2,340千円 (直接経費: 1,800千円、間接経費: 540千円) 2024年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円) 2023年度: 2,210千円 (直接経費: 1,700千円、間接経費: 510千円)
キーワード	手話認識 / 深層学習 / 自己教師 / データセット / ディープラーニング / 手話
研究開始時の研究の概要	本研究では，少量のラベル付き手話データでも高い精度が得られる自己教師あり学習の手法を適用し，手話認識システムを開発する．通常，深層学習では，大量のアノテーション済み学習データが必要である．まずは，日常生活などで自由発話を収録し，バリエーションに富んだ手話データを大量に収集する．しかし，このデータに対して，アノテーションを行うのは非常にコストがかかる．そこでアノテーションを行わずに自己教師あり学習を行うことで，手話認識学習モデルを作成する．これを手話認識に応用することで手話認識精度の向上を目指す．
研究実績の概要	本研究の目的は，手話認識システム開発において，少量のラベル付き手話データでも高い精度が得られる自己教師あり学習の手法を適用し，手話認識システムを開発することである．本研究を遂行するにあたって，音声認識で行われている自己教師あり学習の手法を参考にする．本研究ではMeta社が開発したdata2vecをベースに開発する．まず，本研究室が所有する手話動画データをGoogle社が公開しているMediaPipeを使って姿勢推定を行う．そこで得られた関節点などのキーポイントの座標を取得し，これを学習用データとした．今年度の研究では，data2vecが手話認識にも有効であるかどうかを判断することから始めた．しかし今回の研究では，はっきりと有効であるかどうかの判断ができなかった．これは，data2vecをベースに構築したが，これが手話認識に合わなかったのか，それとも本研究室が所有する手話動画のデータセットでは，データ数が十分だったのかが判別できなかったためである．実験に使用した手話データは，単語や手話文をあわせて，約27,000個であった．そのため自己教師あり学習にはデータ数が足りなかった恐れがある．日本手話の深層学習向けのデータセットは公開されているものが少なく，海外の手話データセットに比べて貧弱である．まずは海外手話のデータセットを用いて自己教師あり学習の有用性を確認し，並行して日本手話のデータセットを構築する．
現在までの達成度 (区分)	現在までの達成度 (区分) 4: 遅れている理由概要でも述べた通り，現状では主だった成果が上がっていない．システムが悪いのか，それともデータセットが少ないのが悪いのか，まずはその原因を究明する必要がある．
今後の研究の推進方策	まずは，データセットとして充実している海外手話のデータセットを用いて，システムの構築を図る．それと並行して日本手話のデータを収集して，システムに利用し，検証する．

報告書

(1件)

2023 実施状況報告書

研究成果
(6件)

すべて 2023

すべて雑誌論文 (1件) (うち国際共著 1件、査読あり 1件) 学会発表 (4件) 図書 (1件)

[雑誌論文] Dynamic Hand Gesture Recognition for?Human-Robot Collaborative Assembly2023
- 著者名/発表者名
  Kwolek Bogdan、Shinji Sako
- 雑誌名
  
  22nd International Conference on Artificial Intelligence and Soft Computing
  
  巻: 1 ページ: 112-121
- DOI
  10.1007/978-3-031-42505-9_10
- ISBN
  9783031425042, 9783031425059
- 関連する報告書
  2023 実施状況報告書
- 査読あり / 国際共著
[学会発表] OCRを用いた「やさしい日本語」翻訳アプリの開発に関する研究2023
- 著者名/発表者名
  細田梓，三浦哲平
- 学会等名
  情報処理学会アクセシビリティ研究会
- 関連する報告書
  2023 実施状況報告書
[学会発表] 読唇を用いた日本手話の映像データにおける口型認識2023
- 著者名/発表者名
  梅田唯花，酒向慎司
- 学会等名
  情報処理学会第86回全国大会
- 関連する報告書
  2023 実施状況報告書
[学会発表] 3次元データに基づく手話の時間的構造に関係する呼吸の推定2023
- 著者名/発表者名
  笠間健太郎，酒向慎司
- 学会等名
  情報処理学会第86回全国大会
- 関連する報告書
  2023 実施状況報告書
[学会発表] ディープ・ラーニングを用いた手話認識に関する研究～ 2単語文と手話辞書構造を導入したConformerによる認識～2023
- 著者名/発表者名
  池田康希，木村勉
- 学会等名
  電子情報通信学会福祉情報工学研究会
- 関連する報告書
  2023 実施状況報告書
[図書] しゃべるヒト　ことばの不思議を科学する2023
- 著者名/発表者名
  菊澤律子，吉岡乾編．酒向慎司他
- 総ページ数
  326
- 出版者
  文理閣
- ISBN
  9784892599248
- 関連する報告書
  2023 実施状況報告書

自己教師あり学習手法による手話認識エンジンの開発

研究代表者

木村 勉 豊田工業高等専門学校, 情報工学科, 教授 (80225044)

6,240千円 (直接経費: 4,800千円、間接経費: 1,440千円)

現在までの達成度 (区分)

理由

報告書

研究成果

[雑誌論文] Dynamic Hand Gesture Recognition for?Human-Robot Collaborative Assembly2023

著者名/発表者名

雑誌名

DOI

ISBN

関連する報告書

[学会発表] OCRを用いた「やさしい日本語」翻訳アプリの開発に関する研究2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] 読唇を用いた日本手話の映像データにおける口型認識2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] 3次元データに基づく手話の時間的構造に関係する呼吸の推定2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] ディープ・ラーニングを用いた手話認識に関する研究 ～ 2単語文と手話辞書構造を導入したConformerによる認識 ～2023

著者名/発表者名

学会等名

関連する報告書

[図書] しゃべるヒト ことばの不思議を科学する2023

著者名/発表者名

総ページ数

出版者

ISBN

関連する報告書

木村勉豊田工業高等専門学校, 情報工学科, 教授 (80225044)

[学会発表] ディープ・ラーニングを用いた手話認識に関する研究～ 2単語文と手話辞書構造を導入したConformerによる認識～2023

[図書] しゃべるヒト　ことばの不思議を科学する2023