2018 Fiscal Year Research-status Report
ソフトウェア開発に関する機密データからの研究用データの生成
Project/Area Number |
17K00102
|
Research Institution | Okayama University |
Principal Investigator |
門田 暁人 岡山大学, 自然科学研究科, 教授 (80311786)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | 実証的ソフトウェア工学 / データ機密保護 / データマイニング |
Outline of Annual Research Achievements |
本研究の目的は,与えられたソフトウェア開発データに対し,特徴量の類似する研究用データを人工的に生成する方法を確立することである.平成30年度は,前年度に開発したデータ生成方法の拡張と評価を進めた.まず,歪度と尖度の変換を伴うデータ生成方法について,その効果を実験的に評価した.実験では,多数のソフトウェア開発プロジェクトデータセットを用いて,歪度と尖度の変換がソフトウェア開発工数予測モデルに与える影響について,モデルの適合度と予測性能の両面から評価を行った.その結果,データセットによっては歪度と尖度の変換がモデルの適合度および予測性能の影響を与えることが分かり,変換の必要性を確認できた.また,外れ値を含むデータセットの再現については,まず,外れ値の大きさと割合を定量化する方法を提案した.そして,定量化の結果に基づいて,平均値から乖離の大きい値を生成し,データセットに含める方法を提案した.また,欠損値の再現については,個々の変数について欠損値を生成した後,変数間の欠損値のパターンを再現するようにデータの入れ替えを行う方法を提案した.ただし,欠損値のパターンを再現することにより,変数間の値の関係が再現されなくなる恐れがあるため,その両者の再現のバランスをとる方法についても検討した. また,これまでの成果とまとめて,2つの国際会議APSEC2018およびQuASoQ2018にて論文発表を行った.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
平成30年度以降の研究実施計画として,(1)歪度と尖度を利用したデータ生成方法について,さらなる評価を進める,(2)外れ値・欠損値の再現方法の確立を目指す,(3)様々なデータマイニング方法を用いた評価を行う,(4)データ増減による効果の評価を行う,を予定していた.(1)(2)については平成30年度中に実施できており,(3)(4)についても現在進めている. 以上のことから研究実施計画に従っておおむね順調に進呈していると考える.
|
Strategy for Future Research Activity |
平成31年度は,様々なデータマイニング方法を用いた評価,および,データ増減による効果の評価を行う.前者については,特に外れ値除去方法やアソシエーションルールマイニングを用いた評価を行う.さらに,データ増減による効果の評価として,データから生成されるモデルの適合度および予測性能の関係を実験的に明らかにする.
|
Research Products
(2 results)