本研究の目的は,ソフトウェアの保守とシステム運用それぞれの効率が高まるように,計画立案を支援することである.そのためのアプローチとして,企業横断的に(複数の企業から)収集したデータを用いて,それぞれの作業効率ベンチマークの作成,及び効率予測モデルの作成を行う.今年度は,効率予測モデルの作成に有用であるトービットモデルの検討,及びモデル構築時に考慮すべき外れ値の影響について明らかにした.以下に詳細を述べる. 数学的モデルにより予測する場合,目的変数の最小値が0となる場合があるが,その場合,従来の最小二乗法に基づく重回帰分析では適切なモデルが構築されず,予測値が負の値となる可能性がある.そこで,トービットモデルを用いてソフトウェアプロジェクト予測モデルを構築し,その効果を確かめた.トービットモデルは,目的変数の最小値が0であることを前提としたモデルである.ISBSGデータセットを用いて,最小二乗法に基づく重回帰モデル,トービットモデル,対数変換を適用した最小二乗法に基づく重回帰モデル,対数変換を適用したトービットモデルの4つの手法の予測精度を評価した.その結果,対数変換を適用したトービットモデルは比較的高い精度を示し,BRE中央値が93%となった. 予測モデル構築時において外れ値は除去されることが多い.ただし,外れ値がどの程度予測精度に影響するのかは明らかではない.そこでデータセットに外れ値を実験的に追加し,外れ値の見積もり精度に対する影響を分析した.外れ値の割合,外れ値の程度,外れ値の存在する変数,外れ値の存在するデータセットの4つを変化させて予測精度を評価した結果,開発規模に外れ値が含まれていても,外れ値の割合が10%で,外れ値の程度が100%の場合,あまり予測精度が低下しないことなどがわかった.
|