• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2023 Fiscal Year Annual Research Report

手話コーパス,深層学習向けラベル付き手話データ半自動生成システムの開発

Research Project

Project/Area Number 22H00661
Allocation TypeSingle-year Grants
Research InstitutionNational Institute of Technology, Toyota College

Principal Investigator

木村 勉  豊田工業高等専門学校, 情報工学科, 教授 (80225044)

Co-Investigator(Kenkyū-buntansha) 三浦 哲平  豊田工業高等専門学校, 情報工学科, 助教 (20964307)
酒向 慎司  名古屋工業大学, 工学(系)研究科(研究院), 准教授 (30396791)
Project Period (FY) 2022-04-01 – 2026-03-31
Keywords手話認識 / 深層学習 / アノテーション / 半自動 / データセット
Outline of Annual Research Achievements

本研究の目的は,深層学習を用いた手話翻訳システムの開発に必要なアノテーション済みの教師データを半自動的に生成するシステムを作成することである.手話翻訳システムの開発には,手話コーパスの構築や教師あり学習による深層学習向けのアプリケーション済みデータが大量に必要であるが,アノテーションを行うのに手間がかかる.そこで本研究ではラベルがない手話動画に対して,アノテーションを半自動的に行うシステムを開発・公開する.このシステムはアノテーション前の教師データに対して,程度認識が可能な手話認識エンジンを用いて,認識できる単語にはラベル付を行い,認識ができなかった単語は人手でラベル付を行う.
手話認識エンジンについて,今年度は,手話辞書・手話翻訳システムに導入する手話文認識モデルの構造を見直し,認識性能の向上を図った.また,認識モデルへの学習データについても,自然言語処理の2-gramsの考えを導入したデータセットを作成し,認識モデルの学習の影響を調査した.しかしながら,昨年度同様,データセットの数が圧倒的に足りないため,精度が思ったように上がらなかった.
GUIについては,クラウド上で再設計を行い,操作性の向上を図るとともに,手話認識エンジンと連携させる仕組みを用意している.また,手話認識エンジンの応用として,認識結果と動画とともに可視化できるツールの開発も行った.
さらに,手話を正しく認識するには,読唇も必要となる.これは同じ手話でも意味が異なる語があるためである.口型を読み取ることで意味を把握するため,手話認識には読唇の技術も必要となる.そこで,この読唇についても研究を開始した.

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

日本手話のデータセットが足りないため,思ったように精度が上がらなかった.
また,GUIにいくつか不具合が見つかったため,再設計を行った.現在は,その問題は解決しており,手話認識エンジンと連携をさせて,運用に向けてブラッシュアップを行う.

Strategy for Future Research Activity

日本手話のデータセットが足りないため,思ったように精度が上がらなかった.
まずは海外の手話データセットを用いて,システム開発を図り,並行して日本手話のデータセットの構築を行う.

  • Research Products

    (6 results)

All 2023

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (4 results) Book (1 results)

  • [Journal Article] Dynamic Hand Gesture Recognition for?Human-Robot Collaborative Assembly2023

    • Author(s)
      Kwolek Bogdan, Shinji Sako
    • Journal Title

      Artificial Intelligence and Soft Computing: 22nd International Conference Proceedings,

      Volume: 1 Pages: 112~121

    • DOI

      10.1007/978-3-031-42505-9_10

    • Peer Reviewed
  • [Presentation] OCRを用いた「やさしい日本語」翻訳アプリの開発に関する研究2023

    • Author(s)
      細田 梓,三浦 哲平
    • Organizer
      情報処理学会 アクセシビリティ研究会
  • [Presentation] 読唇を用いた日本手話の映像データにおける口型認識2023

    • Author(s)
      梅田 唯花,酒向 慎司
    • Organizer
      情報処理学会第86回全国大会
  • [Presentation] データに基づく手話の時間的構造に関係する呼吸の推定2023

    • Author(s)
      笠間 健太郎,酒向 慎司,
    • Organizer
      情報処理学会第86回全国大会
  • [Presentation] ディープ・ラーニングを用いた手話認識に関する研究 ~ 2単語文と手話辞書構造を導入したConformerによる認識 ~2023

    • Author(s)
      池田 康希,木村 勉
    • Organizer
      電子情報通信学会 福祉情報工学研究会
  • [Book] しゃべるヒト ことばの不思議を科学する2023

    • Author(s)
      菊澤律子,吉岡乾編.酒向慎司他
    • Total Pages
      326
    • Publisher
      文理閣
    • ISBN
      978-4-89259-924-8

URL: 

Published: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi