研究課題
本研究の目的は,与えられたソフトウェア開発データに対し,特徴量の類似する研究用データを人工的に生成する方法を確立することである.2019年度は,様々なデータマイニング方法を用いた評価,および,データ増減による効果の評価を行った.前者については,統計モデル,近傍法,樹木モデル,集団学習法,アソシエーションルールマイニングなどを用いた評価を行った.後者については,データ増減による効果の評価として,データから生成されるモデルの適合度および予測性能の関係を実験的に明らかにした.さらに,より限られた特徴量しか得られない場合を想定したデータ生成についても検討を行った.また,これまでの成果をまとめて学術論文誌(IEICE Trans. Information and Systems)へ投稿し,採録決定となっている.2017~2019年度の研究により,様々な尺度が混在するソフトウェア開発データに対し,データの機密性を保持したまま,類似の特徴量を持つデータセットを人工的に生成することが可能となった.また,得られるデータセットは,様々なデータマイニング法による分析に適用可能であり,特にデータ件数が多い場合には,元のデータと類似する分析結果や予測性能が得られることが分かった.本研究の成果により,生成データを広く公開することが可能となり,予測モデルの性能評価,ベンチマーキング,データ処理技術の評価等に活用でき,実証的ソフトウェア工学の研究分野の発展に寄与できると期待される.
すべて 2020 2019
すべて 雑誌論文 (2件) (うち査読あり 2件)
IEICE Transactions on Information and Systems
巻: - ページ: -
Proc. 20th IEEE/ACIS International Conference on Software Engineering, Artificial Intelligence, Networking and Parallel/Distributed Computing
巻: - ページ: 501-506