• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2023 Fiscal Year Annual Research Report

Feature space learning for manipulating complicated motions

Research Project

Project/Area Number 21K19822
Research InstitutionToyohashi University of Technology

Principal Investigator

栗山 繁  豊橋技術科学大学, 工学(系)研究科(研究院), 教授 (20264939)

Co-Investigator(Kenkyū-buntansha) 向井 智彦  東京都立大学, システムデザイン研究科, 准教授 (10432296)
Project Period (FY) 2021-07-09 – 2024-03-31
Keywords3次元運動操作 / キャラクタ・アニメーション / 音声駆動型身振り制御 / 多重解像度・階層的パッチ照合 / 生成的動作制御
Outline of Annual Research Achievements

最終年度は、発話音声を操作手段とみなした場合の身振り動作を、それらの特徴量の照合により生成する手法を検討した。ただし今回は、ニューラルネットワークによる潜在変数への埋め込みを経ずに、データから直接計算される特徴量を多重時間解像度で構成し、一定のフレーム間隔で区切られた動作、音声のパッチ間での類似度をそれらの距離の重み和によって計算した。そして、素材データのパッチ単位での階層的な置換により、発話音声から動作を生成する手法を提案した。
音声と動作の距離に対する重みを解像度毎に変化させることにより、自然かつ音声と同期が取れた動作が得られた。具体的には、粗い解像度では音声間の距離を重視して同期を保ち、同時に生成動作の多様性も獲得する。また、詳細な解像度では動作間の距離を重視することにより、素材データの特徴の復元精度が保たれた。
以上の研究成果を国内の学術会議で口頭発表した内容に対して、優秀研究発表賞が授与された。
一方、生成動作においては足先の接地点が静止姿勢に対しても若干滑るという欠点が発見された。この問題に対しては、パッチ間の照合に用いる距離を上半身と下半身で分離して個別に計算し、下半身では音声に関する距離を除外することにより足先が滑る量を軽減できた。この成果に関しては、令和6年度以降に国内または国外の学会で発表する計画である。
研究期間全体に関しては、令和3、4年度に様々な歩容動作を手指動作で対話的に操作するための深層学習のモデルを提案し、その一定の効果を確認した。令和5年度においては操作手段を発話音声に変更したが、身振り動作に対しては潜在空間を介さなくとも、操作手段との異なるドメイン間での距離を多重解像度で階層的に計算してパッチ間を統合的に照合することにより、柔軟かつ頑健な対話的操作が得られた。この従来の常識に捉われない発見は、挑戦的な萌芽研究として相応しい成果であると考えられる。

  • Research Products

    (5 results)

All 2024

All Journal Article (1 results) (of which Peer Reviewed: 1 results,  Open Access: 1 results) Presentation (4 results) (of which Int'l Joint Research: 1 results)

  • [Journal Article] Orientation-aware leg movement learning for action-driven human motion prediction2024

    • Author(s)
      Gu Chunzhi、Zhang Chao、Kuriyama Shigeru
    • Journal Title

      Pattern Recognition

      Volume: 150 Pages: 110317~110317

    • DOI

      10.1016/j.patcog.2024.110317

    • Peer Reviewed / Open Access
  • [Presentation] 音声駆動型モーションマッチングを用いた身振り動作生成2024

    • Author(s)
      栗山 繁
    • Organizer
      情報処理学会コンピュータグラフィックスとビジュアル情報学研究会 (CGVI) 第193回研究発表会
  • [Presentation] 3次元キーポイントのスワイプ操作に基づいた顔画像編集2024

    • Author(s)
      西川隆盛、高橋遼、顧淳祉、栗山繁
    • Organizer
      情報処理学会第86回全国大会
  • [Presentation] Facial Animation Retargeting by Unsupervised Learning of Graph Convolutional Networks2024

    • Author(s)
      Yuhao Dou and Tomohiko Mukai
    • Organizer
      Nicograph International 2024
    • Int'l Joint Research
  • [Presentation] Human Facial Animation Retargeting by Unsupervised Neural Network2024

    • Author(s)
      Yuhao Dong and Tomohiko Mukai,
    • Organizer
      情報処理学会コンピュータグラフィックスとビジュアル情報学研究会

URL: 

Published: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi