研究課題/領域番号 |
19H01115
|
研究機関 | 東京大学 |
研究代表者 |
原田 達也 東京大学, 先端科学技術研究センター, 教授 (60345113)
|
研究期間 (年度) |
2019-04-01 – 2023-03-31
|
キーワード | 画像認識 / 機械学習 |
研究実績の概要 |
本研究では,少数データからの高精度な画像認識アルゴリズムの構築を目指しているが,本年度は敵対的生成ネットワーク(GAN)を用いた画像生成研究に注力した.GANの内部では画像の生成モデルを学習すると同時に画像の分類器を学習することが可能なだけではなく,新しく生成した画像を分類器の学習に用いることで学習時の正則化の効果も期待できる. しかしながら,実世界では多様かつ曖昧な基準に基づいてデータを収集する場合,訓練データ中にクラスの重複やクラス情報にノイズが混入する問題が頻繁に発生するにもかかわらず,従来の生成モデルの学習方法はクラス間の重複やノイズを無視するため,生成モデルが適切に学習されない問題があった.従って,このようなクラス情報に問題があるデータから生成モデルを学習できることは実用上重要である. 本年度は,データ中にクラスの重複が生じる場合を想定し,クラスの特異性を制御可能な生成モデルの構築を目的として,クラス区別(class-distinct)画像生成とクラス相互(class-mutual)画像生成という新たな問題を提起した.この問題を解決するために,本研究では補助分類器敵対的生成ネットワーク(AC-GAN)の生成入力と目的関数を再設計し,追加の教師データや人の手による修正なしにこの問題を解決するclassifier’s posterior GAN(CP-GAN)と呼ばれる新規手法を開発した. また,クラス情報にノイズが含まれる場合を想定し,本年度はラベルノイズロバスト敵対的生成ネットワーク(rGANs)と呼ばれる新しいGANの手法を提案した.特に,AC-GANとラベルノイズロバスト分類モデルとの橋渡しモデルであるrAC-GANと,条件付敵対的生成ネットワーク(cGAN)の拡張モデルであり,分類器に依存せずにこの問題を解決するrcGANの2つのバリエーションを提案した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
本年度の当初の予定を,生成モデルに着目して研究を進めるとしていた.生成モデルを利用することで,今まで観測されていないデータを生み出すことが可能となり,少量の教師信号のみでも高精度の予測モデルが構築できる可能性があるためである.具体的には,ノイズの含まれるラベル付きデータしか利用できない状況でも,クリーンなラベル条件付き生成器を学習可能な手法を構築することを目標としていた.この研究は大きな成果を上げ,IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR)のオーラル(採択率5.6%),British Machine Vision Conference (BMVC 2019)においてスポットライトオーラル(採択率8.6%)に選ばれて,当該分野からも高い評価を受けている.
|
今後の研究の推進方策 |
今後は,引き続き生成モデルに着目して研究を進める.生成モデルを利用することで,今まで観測されていないデータを生み出すことが可能となり,少量の教師信号のみでも高精度の予測モデルが構築できる可能性がある.実際に,最近では高品質な画像を生成することが可能になりつつあるが,そのような生成モデルの訓練においても大規模かつノイズの含まれていないデータセットを必要とする.訓練データにノイズが含まれている場合,ノイズも再現する生成器が学習されるため大きな問題となっている.今年度はクラスが混合したデータからの学習に着目したが,今後はより一般的な様々な種類のノイズの影響を極力受けないニューラルネットワークを用いた生成器の学習手法を開発する.また,画像認識において,2次元画像から実世界の3次元構造を推定する問題は根源的な課題としてあげられる.この問題を解くストレートな手法は物体の2次元画像と物体の3次元構造が対となった学習データから推定モデルを訓練することが考えられるが,物体の3次元構造のある教師データの構築は困難な場合が多い.そこで,今後は3次元の教師データがなくとも2次元の画像のみから物体の3次元構造を推定する手法の構築を目指す.
|