2014 Fiscal Year Annual Research Report
膨大な画像データを用いた超多クラス一般物体認識システムの構築
Project/Area Number |
24680017
|
Research Institution | The University of Tokyo |
Principal Investigator |
原田 達也 東京大学, 情報理工学(系)研究科, 教授 (60345113)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Keywords | 画像認識 / コンピュータビジョン / 人工知能 / ビッグデータ |
Outline of Annual Research Achievements |
本年度は,大規模な画像を用いた認識システムに必要となるオンライン学習について,有用な知見を得た.近年,機械学習や自然言語の分野では収束が速いオンライン学習手法がいくつも提案されているが,高次元かつ密なデータとなる画像特徴において有効であるかどうか分からなかった.そこで,従来提案されているオンライン学習手法を,最新の画像特徴群に適用して徹底的に検証した.その結果,1次のアルゴリズムも2次のアルゴリズムも重み学習時に平均化のテクニックを用いることで,ほぼ同等の性能が出ることが分かった.また古典的なパーセプトロンでも平均化のテクニックを用いることで,最新のオンライン学習手法と同等の性能が出ることが分かった.また計算効率を考えた場合には,膨大なクラス識別には一般的に用いられる一対多の設定よりも,マルチクラス設定が有効であることを示した.この成果はコンピュータビジョンのトップカンファレンスであるCVPRに採択されている.
物体検出においても,複数のクラスを同時に検出する高精度な手法を開発した.従来の物体検出手法は一対多の問題設定であり,検出器が物体ごとに独立に学習されるが,本研究ではある物体の検出器を学習する際に,他の物体検出器のスコアを参照して,多数の物体検出においてバランスの取れた検出結果を返す手法となっている.また,各物体の検出器の学習において,物体毎に誤検出しやすいハードネガティブサンプルを収集して,検出精度を高めている.この成果を用いて画像認識や人工知能で最も注目を集めている国際的大規模画像認識コンペティション(ILSVRC2014)に参加し,30以上のチームが参加する中で4位の成績を収めた.
|
Research Progress Status |
26年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
26年度が最終年度であるため、記入しない。
|
Causes of Carryover |
26年度が最終年度であるため、記入しない。
|
Expenditure Plan for Carryover Budget |
26年度が最終年度であるため、記入しない。
|