本研究では、DNNが学習した内部表現を評価・改善することで、DNNの頑健性に取り組むことを提案した。DNNの内部表現の評価については、特徴の伝達性が敵対的攻撃への頑健性につながることを発見した。つまり、特徴の伝達性が高いほど、敵対的な攻撃に対する頑健性が高いことを発見した。また、複数層のDNNをまとめてグラフで評価・可視化し、多次元空間での形状を容易に点検できるK-spectrumを提案した。DNNの内部表現の改善に関しては、提案にあるように、ネットワークの頑健性を向上させるGANを用いたシステムを開発した。 この研究の成果は、雑誌やプロシーディングスに掲載され、合計で13以上の論文がある。
|