本研究は,難読化の中でよく使われている名前難読化を対象にその性能を評価した.評価のため,命令列と引数の型をもとに元のメソッドの動詞の推薦を行なった.その結果,約40%の動詞が復元できた.この数値は完全な形ではないにせよ難読化により隠した情報が暴露する可能性を表し,名前難読化に一定の脆弱性があることを示せたと言える. この実現にはバイナリソフトウェアの解析が必要となる.難読化されたソフトウェアのソースコードは公開されないためである.そこでこの技術を応用し,バイナリを対象にしたソフトウェア同士の比較の規模拡大にも取り組んだ.その結果,閾値が0.2の時,従来の40%程度の時間で比較できるようになった.
|