研究課題/領域番号 |
19K20290
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分61010:知覚情報処理関連
|
研究機関 | 東京大学 |
研究代表者 |
椋田 悠介 東京大学, 先端科学技術研究センター, 講師 (50830874)
|
研究期間 (年度) |
2019-04-01 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2022年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2021年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2020年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2019年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
|
キーワード | Invariance / Feature Learning / Machine Learning / Computer Vision / 特徴学習 / 不変性 / 画像認識 / 機械学習 / パターン認識 / 群畳み込み / 対称性 / 動画像認識 / 群表現論 |
研究開始時の研究の概要 |
本研究では回転、鏡映のような動画像自身の持つ意味合いを変えないと期待される変換に対して不変な動画像特徴量の学習アルゴリズムを作ることを目指す。そのために動画像の意味を保つ変換のなす群と呼ばれる代数構造に着目し、その群構造を踏まえた基本的なベクトルである群表現の重ね合わせとして特徴量を構築することにより、変換の特徴量への影響を容易に計算、分離できるようにする。結果として得られる特徴量モデルがコンパクトになり、少数の動画像からでも高精度な識別が可能になることを目指す。
|
研究成果の概要 |
共変性を持ったNeural NetworksであるEquivariant Neural Networksに対するモデル構造の拡張と学習手法を提案した。モデル構造の拡張として、画像の局所情報をまとめ上げて一つの大域特徴を作り上げる特徴量コーディング手法の共変な拡張を提案した。新たな学習手法として、Equivariant Neural Networksに対して自己教師付き学習を行うための共変な損失であるequivariant pretext labelsとinvariant contrastive lossを提案した。
|
研究成果の学術的意義や社会的意義 |
提案手法はDeep Neural Networksに対して共変性の事前知識を陽に組み込むためのEquivariant Neural Networksを活用するための枠組みになっている。提案手法により通常のDeep Neural Networksより高性能でかつ性質がより明らかな認識が行えることが期待される。理論的にも不変な特徴量の有効性の理由の一端となる性質を証明し、不変な特徴量に対する理解の促進につながった。
|