研究課題/領域番号 |
19K12039
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61010:知覚情報処理関連
|
研究機関 | 千葉大学 |
研究代表者 |
川本 一彦 千葉大学, 大学院工学研究院, 教授 (30345376)
|
研究期間 (年度) |
2019-04-01 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2021年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2020年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
2019年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
|
キーワード | 状態空間モデル / 深層学習 / 解きほぐし / 状態空間表現 / 動画生成 / 行動認識 / 動画像理解 / 深層マルコフモデル / 一人称行動認識 |
研究開始時の研究の概要 |
本研究では,深層学習モデルと状態空間モデルを統合し,行動認識,複数人物追跡,あるいは動画生成といったコンピュータビジョン分野における動画像理解タスクへ応用展開する.深層学習(ディープラーニング)は,画像認識等の知的情報処理を実現するための強力な方法である.一方,状態空間モデルは,時系列解析やシステム制御・同定に広く利用されている.これら2つのモデルを統合することにより,知的情報処理を含む時系列解析法を発展させることができる.
|
研究成果の概要 |
深層学習と状態空間モデルの統合に基づく動画理解の課題に取り組みました。まず、深層マルコフモデルを導入し、カオスダイナミクスの予測、行動認識や動画生成のための深層モデルも開発した。次に、時系列と空間データを扱う2D畳み込みニューラルマルコフモデルを開発し、動画生成や行動認識の深層モデルを開発した。そして、動画生成の制御を可能にする深層モデルの構築に取り組み、ゼロショット画像生成を開発しました。さらに、動画像に含まれる静的特徴と動的特徴を分離する逐次変分オートエンコーダを開発した。以上の研究により、本研究のの有効性を実証した。
|
研究成果の学術的意義や社会的意義 |
深層学習モデルと状態空間モデルの統合により、コンピュータビジョンにおける動画像理解タスクを適切にモデル化でき、行動認識、人物追跡、動画生成といったタスクがより精度高く、効率的に行えるようになる。これは、監視システム、自動運転車、ロボティクスなどの分野に貢献できる。また、動画生成技術は、エンターテイメントや広告への応用も期待できる。
|