多数のソフトウェアの集合に対して高速にコードクローンを検出する手法を提案した.約3億行のソースコードから2時間程度でメソッドレベルのコードクローンを検出することができた.従来はファイル単位のクローンしか検出できておらず,提案手法を用いることにより従来は検出されることがなかった多数のクローンが検出できることがわかった.また,開発履歴データを解析することにより高速にコードクローンの変遷を追跡する手法を考案した.5,000リビジョンの開発履歴データから3時間程度で追跡が行えることを確認した.また従来手法では追跡できなかった多数のコードクローンが追跡できていることも確認した.
|