Research Abstract |
本年度は,予測精度の高いモデルを構築ためのフレームワークを確立するために,(1)モデル構築に用いるデータセットから,特異なデータ(外れ値)を除外する方法を新たに考案するとともに,(2)モデル構築前に,データの層別を行う最適な方法を明らかにした. (1)類似性に基づくソフトウェア開発工数見積り方法(Analogy法)における外れ値除去法の効果を,三つのプロジェクトデータセット(ISBSGデータ,Kitchenhamデータ,Desharnaisデータ)を用いて実験的に比較した。比較対象の外れ値除去法は,これまで提案されている4種類の外れ値除去法(k-means法を用いた除去法,LTSを用いた除去法,Cookの距離を用いた除去法,Mantel相関を用いた除去法)と,本論文で新たに提案する除去法である.提案方法は,Analogy法の特性を考慮して,類似プロジェクトにおいて工数(生産性)が極端に異なる類似プロジェクトを外れ値とみなし,見積り時の計算から除外する.実験の結果,提案方法は比較した外れ値除去法の中で平均的に最も高い見積り精度を示し,どのデータセットを用いた場合でも見積り精度が大きく低下することはなく,ABRE(Absolute Balanced Relative Error)平均値で最大28.8%の改善が見られた. (2)重回帰分析によるソフトウェア開発工数見積において,データに含まれるカテゴリ変数に対し,ダミー変数化を行った場合,層別を行った場合,階層線形モデルを適用した場合の見積精度を比較した,NASAのソフトウェア開発プロジェクトを用いて工数予測モデルを構築し,ABRE(Absolute Balanced Relative Error)に基づいて精度を比較した.その結果,ダミー変数化して重回帰分析した場合と,階層線形モデルを用いた場合では,一方の精度が高いとまではいえなかった.また,データを層別して重回帰分析した場合,その他の方法と比べ,精度が高くならなかった.
|