研究概要 |
本年度は,データに最適なモデルの選定を行うことを可能とするために,データセットの性質に適した予測モデルを明らかにするとともに,複数の予測手法から最適なモデルを選択するための新たな指標を考案した. コスト超過プロジェクトの発見には,線形判別分析などの判別予測法が用いられる.コスト超過プロジェクトが減少し,コスト非超過プロジェクトの割合が増加した場合における,各種判別予測方法の精度変化を分析した.その結果,コスト超過プロジェクトの割合にかかわらず,協調フィルタリングの予測精度が最も高く,汎用的に適用することができことがわかった.また,コスト超過プロジェクトとコスト非超過プロジェクトの割合に差が少ない場合は,線形判別分析を用いると比較的高い精度が得られ,コスト超過プロジェクトが少ない(35%以下)場合,マハラノビス・タグチ法を予測に用いると比較的高い精度が得られることがわかった. 予測モデルを構築する際,(線形判別分析など)複数のモデル候補から最適なモデルを選択したり,説明変数の候補から最適な変数を選択したりする必要がある.ブートストラップ法によりモデル・変数選択に用いる指標値(F1値や相関係数)の分散を推定し,指標値の大小と分散の大小の両方を考慮してモデルを構築する方法を提案した.提案方法では以下の手順でモデルを構築する. (1)ブートストラップ法により,予測モデル,説明変数選択のための(F1値や相関係数などの)指標の大きさと分散を求める. (2)指標の大きさと分散に基づいてシャープレシオを求め,シャープレシオが大きくなるようにモデルを構築する.
|