2023 Fiscal Year Research-status Report
Construction of an assistive technology and recording technology platform for sign language dialogues using ego-view video
Project/Area Number |
23K11197
|
Research Institution | Nagoya Institute of Technology |
Principal Investigator |
酒向 慎司 名古屋工業大学, 工学(系)研究科(研究院), 准教授 (30396791)
|
Project Period (FY) |
2023-04-01 – 2026-03-31
|
Keywords | 手話 / 全方位カメラ / 手話認識 / ボディトラッキング |
Outline of Annual Research Achievements |
全方位カメラによる歪みのある映像から、複雑な手指の動作を含んだ上半身の3次元ポーズを推定する技術について、既に提案済みの基礎技術をさらに発展させるアルゴリズムについて検討を進めた。これにより、一人称視点映像によるボディトラッキングの高度化と、手話認識以外への応用についても検討を進めることができた。また、これまでに申請者らが作成した手話データベース[14]を用いて、手話の身体動作の自然性に関する調査を目的として、手話のリズムに着目した呼吸状態の取得方法について検討し、手話のモーションデータから部分的ではあるが呼吸情報が取得できることが示された。その他、手話認識やその技術を支える手話コーパス拡張を念頭においた手話データベースへのアノテーション自動化の取り組みとして、手話の非手指情報(マウジング・マウスジェスチャ)の分類や検出について初歩的な検討を行い、手話の表現におけるマウジングの表出パターンなどを調査することができた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
全方位カメラによる歪みのある映像から、複雑な手指の動作を含んだ上半身の3次元ポーズを推定する技術について、既に提案済みの基礎技術をさらに発展させるアルゴリズムについて検討を進め、国際共著論文による国際会議発表を行った。また、これまでに申請者らが作成した手話データベース[14]を用いて、手話の身体動作の自然性に関する調査を目的として、手話のリズムに着目した呼吸状態の取得方法について検討した。その他、手話認識やその技術を支える手話コーパス拡張を念頭においた手話データベースへのアノテーション自動化の取り組みとして、手話の非手指情報(マウジング・マウスジェスチャ)の分類や検出について初歩的な検討を行った。これらの取り組みについて情報処理学会全国大会にてそれぞれ研究発表を行った。
|
Strategy for Future Research Activity |
本申請技術は手話者の3次元身体動作を推定するため、その結果から任意視点の対面カメラによる映像を生成することが可能である。従って、対面撮影のデータを前提に構築された既存の手話認識の学習モデルを活用したモデル学習方法を導入することで、一人称視点映像による手話データを大量に収集することなく、既存の手話認識の学習モデルと組み合わせて手話認識を行う方法について検討する。実験データや学習済みモデルが公開されている海外の研究事例を活用し、既存の対面映像を想定した手話認識モデルに対して、一人称視点映像から仮想的な対面映像に変換することで、既存の学習モデルを用いた手話認識が可能であることを実験によって検証する。また、一人称視点映像による3次元身体動作の追跡技術を応用し、手話の対話シーン全体を効率的に記録するプロトタイプシステムを開発し、試験的に実環境でのデータ収集についても検討を進める。
|
Causes of Carryover |
(未使用額が発生した状況)導入を予定していた実験用計算機の機種見直しにより若干の未使用額が生じた。 (次年度における未使用額の使途内容)次年度はクラウドサービス(AmazonEC2)の利用が見込まれるため、未使用額はその経費に充てることとしたい。
|