最初は検査プロジェクトに対していくつかの基準で似ているプロジェクトを選択し、プロジェクト間のデータ調整を行う事で最適な再利用ができるのではないかと考えた。そこで再利用の検討を行ったが、プロジェクトの特性の相違や、予測アルゴリズムの選択等に大きく影響する事がわかった。 次に新たにデータマイニング手法を適用して、最適な予測器を見出すという手法を考えた。ソフトウェア欠陥予測ツールは訓練プロジェクト、利用するメトリクス、予測のアルゴリズムを決める事で予測器を作る。与えられた検査プロジェクトに対して適切な予測器を選ぶマイニング手法を提案し、その適切性を実証した。
|