研究課題/領域番号 |
20K21788
|
研究機関 | 東京大学 |
研究代表者 |
品川 高廣 東京大学, 情報基盤センター, 准教授 (40361745)
|
研究期間 (年度) |
2020-07-30 – 2022-03-31
|
キーワード | マルウェア / 深層学習 |
研究実績の概要 |
大量に出現する新しいマルウェアの分析は、セキュリティアナリストにとって大きな負担となっている。通常、マルウェアプログラムには多くの亜種が存在するため、マルウェアの亜種を既知のファミリーに自動的に分類することは、アナリストの負担軽減に大きく貢献する。マルウェアの画像を用いて深層学習により亜種を分類することは、マルウェアの自動分類のための興味深いアプローチであるが、異なる深層学習モデルと微調整パラメータが分類精度に与える影響については十分に検討されていない。 本研究では、24種類のImageNet事前学習モデルと5種類の微調整パラメータ、合計120種類のモデルを用いて、微調整された深層学習モデルの網羅的な研究を行った。実験の結果、完全再学習したEfficientNetB4は、Malimgデータセットで98.96%という最高の分類精度を達成し、1/4再学習したEfficientNetB4モデルは、Drebinデータセットの上位20クラスで91.03%という最高の精度を達成した。また、2020年5月のデータセットで学習した上記のモデルを用いて、VirusTotal November 2020のデータセットに含まれるマルウェアの亜種の検出を試みた結果、Windows向けのマルウェアは1,490個検出され、抽出率は21.07%、汚染率は12.61%、Android向けのマルウェアは58個検出され、抽出率は100%、汚染率は57.66%となった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
深層学習を用いたマルウェア検知に関して順調に研究が進んでおり、最初の論文を既に投稿済みである。
|
今後の研究の推進方策 |
研究結果を踏まえて、評価をさらに充実させて投稿済みの論文を発展させるほか、深層学習の適用の仕方や適用先についてさらなる検討をおこなって、次の論文投稿を目指していく予定である。
|
次年度使用額が生じた理由 |
当初は深層学習のために新しい物品購入をおこなう予定であったが、実際に発売された物品を検討したところ想定した使い方をすることは簡単ではないことが分かったため、既存の低速な物品を再利用しつつ翌年度に使用する人件費を増やして人海戦術により当初予定の実験をこなすこととしたため。
|