ソフトウェア開発プロジェクトの成果物である出荷されたソフトウェア製品の運用信頼性を,その出荷前のできるだけ早い時期に推定する問題において,構築した推定モデルに与えるデータセットの質が悪いことに,本年度は着目した.過去の(他の研究者によるものも含めた)研究では,多変量解析の要領で,ソフトウェアプロジェクトにおいて計測・記録される情報の中から説明変数を選び,目的変数を出荷後からある期間内に発生したソフトウェア故障数として,モデルの推定を行うといった簡易な方法によってそのモデルの適合性等を評価した.結果としては単純な線形回帰ではなく,非線形であることがモデルには求められること,また機械学習による予測モデルの方が総じて予測性能が高いことが示された.しかしながら,これらのモデルの同定に用いるデータセットが,実のところ信用が置けないものも含まれていることが看過できない問題として顕れてきた.利用したデータセットは,数百社を超える一般の企業の協力を得て採取された膨大なものであるが,ソフトウェア開発に携わる実務家が多忙な業務の合間に時間を割いて採取する形式のものについては,非常にノイズが多いと見做さざるを得ないものもあり,そのためモデルの精度が上がらないのではと推察された.そこで,データ(情報)採取にコスト・時間が掛からず実務家に負担を強いないで採取される外形的なデータや,正確な定量的な値を要求せず,大・中・小のような荒い定性的なデータを用いて,信頼性予測が行えるかについて,モデルを開発し検討した.その結果,機械学習(ニューラルネットワーク)に基づく手法がかなりよい予測を行えることが示された.この成果は一般論文誌での公表等には至らなかったが,一部は本学理工学研究科の修士論文「ソフトウェアプロジェクトデータに基づく運用信頼性の予測に関する研究」(著者:荻原佑実,研究協力者)としてまとめられた.
|