研究概要 |
本研究では,ソフトウェア開発プロジェクトに対する先進的プロジェクト管理法を開発するための知見を得ることを目指している.なお,本研究の特徴は一つの企業だけでなく複数の企業の開発現場で収集された大規模な開発データを利用することにある.そのため43.8%もの欠損が含まれているデータを相手にするので,本年度の目的は欠損率を変化させながら,最適なメトリクスの選択と予測精度の向上を実現することであった.なお,データは情報処理推進機構ソフトウェア・エンジニアリング・センター(IPA/SEC)から提供されたものを利用している. (1)目標とする欠損率を有するデータの作成:収集されたメトリクスデータを,欠損数の大きい順に並び替えた.引き続き,先頭から順番にメトリクスを削除して,データ全体の欠損率を目標値に近づけた.欠損率の妥当な値が事前には判明しないため,20%,15%,10%,5%,0%の5つを目標値に選んで以降の(2),(3)を検討した. (2)メトリクスの選択:(1)で求めた5種類のメトリクスデータ毎に,相関ルールマイニングを適用して,プロジェクト状況に大きな変化を与えるメトリクスの選択・抽出を行った. (3)予測精度の算出:(2)で選択したメトリクスに基づいて,(1)で求めたデータから切り出しを行った.引き続き,ベイズ識別器を適用して,予測精度を算出した.その結果,最も高い予測精度が得られたのは欠損率を10%とした場合で,7個のメトリクスが選択され,82.8%の精度であった.この精度の値は,欠損の削除やメトリクスの選択を行わないで予測を行う場合に比べ,十分に高い予測精度を示すものであった.
|