2020 Fiscal Year Research-status Report
Data augmentation and domain adaptation using the latent space of the deep generative model
Project/Area Number |
19K12164
|
Research Institution | Ritsumeikan University |
Principal Investigator |
西川 郁子 立命館大学, 情報理工学部, 教授 (90212117)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | 深層生成モデル / 潜在空間 / 異常検知 / ドメイン適応 / データ拡張 |
Outline of Annual Research Achievements |
深層生成モデルの潜在変数空間の設計と利用を中心に研究を進めた。生成モデルとして主に、自己符号化器(auto-encoder:AE)や変分自己符号化器(variational auto-encoder :VAE)など、また、敵対的(adversarial)な学習を用いた。以下に2項目に分けて概要を示す: 1.教師なし異常検知:生成器の潜在空間に正常データの特徴量を獲得することで、教師なし異常検知を実現する。[1-1] AEでは、入力データの再構築誤差を基準に異常の有無を判定するが、異常領域の検出のために、誤差を減少させるように入力データを逐次修正する方法で検出精度を向上させた。[1-2] VAEでは、潜在空間に十分になめらかな低次元の分布関数として正常データ分布を獲得するため、潜在空間上での位置も異常検知に用いることができる。[1-3] 正常データで敵対的生成ネットワーク(generative adversarial networks :GAN)を訓練し、正常データの生成器を構築した上で、逆関数としての符号化器を獲得することで、より精緻な正常データ分布を獲得し、異常検知に用いた。 2.教師なしドメイン適応:潜在空間における分布に注目することで、ソースドメインで学習した認識器を、ターゲットドメインに適応させる。異なるドメイン間で対応するデータ分布を近づけることで実現する。[2-1]分布間の輸送距離最小化で実現するWasserstein距離の有効性を検証した。[2-2]分布間の密度比に基づくJSダイバージェンスを用いて、ターゲットドメインのデータごとに帰属クラスを推定する手法を開発し、特にパーシャルドメイン適応での有効性を確認した。[2-3]潜在空間を、タスク固有の特徴量とドメイン固有の特徴量に分割した上で、疑似的に教師ありターゲットデータを生成する方法を開発し、有効性を検証した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
上述の各項目について、現在までの進捗状況を示す。 1.教師なし異常検知:[1-1] AEでは異常データの再構築誤差が大きくなるが、データ正常部分の再構築も異常部分の影響を受けるため、異常領域の検出精度が悪化する。そこに着目して、再構築誤差を極小化するよう入力データを修正することで、異常領域の検出精度向上を目指し、工業製品の公開画像データで検証した。同時に、画像類似度指標であるSSIMを画素単位で定義し、精度向上をはかった。[1-2,3]潜在空間の位置を利用することで、形状が時間的に変化する時系列データにおける時間異常の定量化を実現した。生物動態データに適用し、発生過程での遺伝子機能推定に用いた。 2.教師なしドメイン適応:分布間の輸送距離最小化に基づくWasserstein距離と、分布間の密度比に基づくJSダイバージェンス、それぞれの特性を活かした手法を提案した。[2-1]画像セグメンテーションに適用し、Wasserstein距離によるドメイン適応の有効性を検証した。[2-2] JSダイバージェンスに基づく判別器(discriminator)により、ターゲットドメインのデータごとのクラス帰属率を推定する方法を提案し、パーシャルドメイン適応において既存手法に対する優位性を公開データセットで検証した。
|
Strategy for Future Research Activity |
現在までの課題をさらに進め、各種課題で検証し、最終年度としてまとめる。 1.教師なし異常検知:理論的基盤も含めた、一般的な枠組みの構築を目指す。その上で、現在まで共同研究として進めている生物動態データを用いた遺伝子機能解析、新たに共同研究を始める医療画像データに対する疾患部位の検出、公開データセットでの他手法との比較などを進める。 2.教師なしドメイン適応:より一般的なオープンセットでのドメイン適応でも有効な枠組みの構築を目指す。コントラスティブ学習やメトリック学習などの利点も検証する。その上で、現在まで共同研究として進めている地図画像に対するセグメンテーション、新たに共同研究を始める医療画像データに対する計測環境に応じたドメイン適応、センサアレイ情報に基づく行動識別における個人や環境に応じたドメイン適応などにも適用し、有効性を検証する。
|
Causes of Carryover |
十分な計算機環境の整備を予定していたが、現有の研究室資源で目的が達成できたこと、大学への入構や研究室の利用が制限される期間が続いたため、今年度の執行は控え、次年度における最新の機器設備の導入のために繰り越すことを判断した。さらに、複数の国際会議での研究成果の発表のために、国外旅費や論文掲載料の執行を予定していたが、いずれもオンライン開催や、査読後に採択されたものだけが抄録として出版されるといった形態に移行し、会議参加費のみの執行などとなった。同時に、共同研究機関との打合せも、全てオンラインでの実施を余儀なくされ、国内旅費もほぼ発生しなかった。次年度は、少しずつオンライン以外での会議開催や対面打合せが再開することを期待しつつ、慎重に検討する。また、遠隔でも利用可能な計算機環境を整備し、最新の機器を導入する。
|