本年度は、動画セグメンテーションモデルの作成に取り組んだ。このモデルは、畳み込みニューラルネットワーク(CNN)によるエンコーダ-デコーダモデルを採用しており、オートエンコーダ型モデルの一種であると考えることもできる。エンコーダ部分では、入力された動画データから画像特徴量を抽出し、デコーダ部分では抽出された特徴量をもとに、セグメンテーションされた画像を生成する。 さらに、本研究ではフレーム間画像の差分を取り、モデルの入力とする工夫を行った。この手法により、動画の各フレーム間での変化をより効果的に捉えることができ、モデルの予測精度が向上することが示された。フレーム間画像の差分を取ることで、動画の構造や動きを表現する特徴量が強調され、時系列モデリングの精度が向上したといえる。 今後の研究においては、この差分を取る手法が他のデータやモデルに対しても効果があるのか検討したいと考えている。異なる種類の動画データや異なるアーキテクチャのニューラルネットワークに対して、同様の手法を適用し、その性能向上を評価する。また、差分を取る手法の改良や拡張にも取り組み、時系列モデリングの精度向上を目指す。 本研究により、オートエンコーダ型モデルを応用した動画セグメンテーションモデルを構築し、フレーム間画像の差分を取る手法の有効性が示された。今後の研究により、この手法の汎用性や応用範囲を広げることが今後の課題である。
|