2017 Fiscal Year Annual Research Report
不変性に基づく高速な特徴学習手法の提案とその動画像認識への応用
Project/Area Number |
17J05725
|
Research Institution | The University of Tokyo |
Principal Investigator |
椋田 悠介 東京大学, 情報理工学系研究科, 特別研究員(DC2)
|
Project Period (FY) |
2017-04-26 – 2019-03-31
|
Keywords | 特徴抽出 / 機械学習 / パターン認識 |
Outline of Annual Research Achievements |
近年、計算機でパターン認識に用いられるデータ量は大規模になっており、効率的なパターン認識のためには、データの識別的な情報を数値列で表す特徴抽出技術の高速化が必須である。本研究ではデータに関する不変性の事前知識を用いて識別的でコンパクトな特徴量を構築することを目指す。 具体的には、微小位置不変性の事前知識を用いたコンパクトなプーリング窓の設計手法の開発、低ランク性の事前知識を用いた低次元な共分散エンコーディング手法の提案を行った。 1つの画像や動画像から取れる局所的な特徴量をその値と特徴量の位置を考慮して纏め上げる手法をプーリングと呼ぶ。我々はプーリング窓の設計は重みつきプーリング手法の重みの設計と同一視されること、この時のプーリング重みを画像平面から画像特徴空間への関数からなる内積空間における次元削減として導けることを示した。画像や動画像の微小位置変化不変性の事前知識を考慮したガウス重みつき内積を用いるプーリング手法を提案した。提案手法によりプーリングサイズを小さくしてもより高い精度で画像や動画の識別を行うことが可能になった。この手法に関する論文が画像認識に関する国際学会であるICCV2017のワークショップに採択された。 画像や動画像内の局所特徴の統計量を用いてより高次元の特徴量を構築する手法をエンコーディングと呼ぶ。局所特徴の高次元、少サンプル性を考慮したエンコーディング手法として我々は局所特徴から計算される共分散行列が低ランク正定値対称行列になると仮定し、その行列からなる多様体上で識別する手法を提案した。提案手法により、画像、動画像、言語の識別においてより次元にロバストに識別を行うことができることを示した。 この他に、高速なランダム特徴に関する研究を行い、この成果は機械学習に関する国内学会であるIBISMLと人工知能に関する国際学会であるAAAI2018に採択された。
|
Research Progress Status |
翌年度、交付申請を辞退するため、記入しない。
|
Strategy for Future Research Activity |
翌年度、交付申請を辞退するため、記入しない。
|
Research Products
(3 results)