2007 Fiscal Year Annual Research Report
Project/Area Number |
19700051
|
Research Institution | Iwate University |
Principal Investigator |
中谷 直司 Iwate University, 工学部, 助教 (20322969)
|
Keywords | コンピュータウイルス / 未知コンピュータウイルス / 可視化 / 機械学習 / Paul Graham Bayes |
Research Abstract |
本研究では過去のコンピュータウイルスの機能をベイズ学習アルゴリズムなどで学習し、その学習結果に基づいたウイルス検出を行うことで、現状では未解決な未知ウイルス検出手法の確立を目指す。ただし、学習情報として与える「コンピュータウイルスの機能」の抽出には研究の余地が多分に存在するため、本研究では情報抽出手法と学習手法の問題を切り分けることを目的に、コンピュータウイルスの機能を的確に表現し、ノンウイルスとウイルスを明確に識別可能なバイナリファイルの可視化を目標とする。 本年度は過去の研究である程度のウイルス検出結果が得られることが確認されている、抽出するウイルスの機能としてバイナリファイル中の文字列を利用した場合の可視化を試みた。可視化した結果からウイルスの間にはある程度の類似性が見られ、特に亜種ウイルス同士ではその傾向が強いことがわかった。しかし、バイナリファイル中の文字列をすべて可視化するとウイルスと一般の実行ファイルの間にもかなりの共通部分があり、ウイルスをウイルスとして正しく認識するには全体の傾向ではなく突出した少数の特徴に着目する必要があることが明らかになった。このことは、ウイルス検出に少数の特徴に着目し判定するPaul Graham Bayesを使った過去の研究が有効であったことを示すが、逆に亜種のように少数の特徴が共通するウイルス以外では未知ウイルスの検出が難しく、一般の実行ファイルをウイルスと誤検出する可能性も高くなることがわかった。そこで、過去のウイルスを学習する段階で一般の実行ファイルと共通する部分を学習データから除外する手法を試みたところ、検出率が上がり誤検出率が低下することが確認されたが、この手法はまだ改善の余地が残されていると考えられ今後も研究を続けていく予定である。
|