令和3年度は研究実施計画に挙げた均質化と多重化の融合に取り組んだ。前年度まで、プロジェクトデータの均質化手法(古いプロジェクトデータを直近のプロジェクトデータと似通った特徴を持つように変更する)及び古いプロジェクトデータのうち均質性が高いものを簡易な転移学習で取り込む方法を検討した。類似した関心を持つ不具合モジュール予測の研究で提案された手法をサーベイして、実装が公開されている一部の手法を工数見積り向けに改修し予備調査を行った。
上記の結果を踏まえて、多重化と均質化を組み合わせた場合の有効性についてより詳細に分析・評価した。まず、実装が公開されている手法のみが評価の対象となっていることから先行研究で採用された主要なアプローチを網羅できているか分析した。具体的には、不具合予測モジュール予測分野の先行研究やサーベイ論文を参照して、工数見積り向けに改修した手法が主要なアプローチの全てを網羅していることを確認した。評価実験では、工数見積り研究でよく使用される複数のデータセットを用いた。また、これらのデータセットの時間的・適用分野的な特徴の違いを考慮した実験条件を設定した。実証実験の結果、過去のプロジェクトデータ資産の活用が有効であることが一部の手法で確認できた。この結果は不具合モジュール予測分野で確認された成果とある程度整合的であることも確認できた。また、工数見積りでは特にアンサンブル学習法の利用が大きな役割を果たすことが確認された。この成果は原著論文として採録済みである。
|