本研究の目的は,人間の動作の生成過程と推論過程を深層ニューラルネットワークによりモデル化し,モーションキャプチャシステムにより収録された動作データを用いて学習することで両過程を明らかにすることである. これまでに,Generative Adversarial Networks(GAN)とVariational AutoEncoder(VAE)を使用した動作生成モデルを構築した.GANは多様で自然な動作データを生成できる生成モデルと現実の動作データか生成された動作データかを識別する識別モデルから成る.本研究では,これらにより人物動作の生成過程と推論過程を表現した.また,VAEでは,動作の生成過程と推論過程をそれぞれ深層ニューラルネットワークにより表現し,動作データから推論と生成を行い,元のデータが得られればよいという基準で深層ニューラルネットワークのパラメータを推定する.本研究では,VAEを使用して人物動作の生成過程と推論過程を明らかにした.2021年度には,VAEを使用した動作生成モデルの改良を行った.具体的には,Recurrent Neural Network(RNN)を用いて動作の時間方向の依存関係を表現すると同時に,多階層のConvolutional Neural Network(CNN)により動作特徴を抽出し,抽出した動作特徴をVAEにより低次元の潜在空間に確率分布として表現することができるモデルを構築した.実験により,提案モデルは多様な動作を生成可能であることを確認した. 3次元コンピュータグラフィックスを使用した映画やゲームには人型のキャラクタが登場することが多く,キャラクタの動作を生成・制御・編集することは重要なタスクである.本研究で提案した動作生成モデルによりキャラクタアニメーションの制作が容易になることが期待できる.
|