研究課題/領域番号 |
21K17772
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分61010:知覚情報処理関連
|
研究機関 | 中部大学 |
研究代表者 |
平川 翼 中部大学, AI数理データサイエンスセンター, 講師 (60846690)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
2023年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2022年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2021年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
|
キーワード | 深層学習 / Transformer / Network Pruning / 大規模事前学習モデル / 基盤モデル / 再帰型ニューラルネットワーク / 移動エントロピー / 時系列データ処理 / 動画像認識 / 特徴抽出 / 力学系カオス |
研究開始時の研究の概要 |
近年の画像認識技術の発達に伴い,動画像を用いた認識が盛んに行われている.このうち,畳み込みニューラルネットワークの技術的・理論的発展により,動画像フレームから有用な特徴を抽出することが可能となっているが,時間方向の特徴抽出に関しては,有用な特徴抽出が困難であるという問題が存在する. この問題を解決するために,力学系カオスの概念を導入し,動画像の時間方向のデータ遷移を表現することのできる深層学習のネットワーク構造を開発する.開発した手法を様々な動画像認識タスクへ適用することで,動画像認識の高精度化を実現する.
|
研究成果の概要 |
本研究課題では,深層学習モデル,とりわけ動画像データのような時間的な情報遷移が必要となる深層学習モデルに対して重要となる特徴抽出ないしは特徴抽出を行うパラメータの抽出を行う手法を提案した.具体的には,従来から系列データに対して深層学習モデルで広く用いられていたLong Short-Term Memory (LSTM) および近年高い認識精度を達成し広く用いられているTransformerおよびVision Transformer (ViT) に対する有効な特徴抽出のための枝刈り手法を提案した.
|
研究成果の学術的意義や社会的意義 |
本プロジェクトにおいて開発した枝刈り技術は,深層学習モデル内の冗長なパラメータを削除することで,近年,大規模化するネットワークモデルをコンパクト化・省電力化することが可能な技術である.そのため,高性能な画像認識モデルを大規模な計算機を用いることなく様々な画像認識データに対して適用することが可能となる.
|