2016 Fiscal Year Research-status Report
品質指向ソフトウェア開発のためのデータマイニング型プロセス支援技術の開発と改善
Project/Area Number |
15K01208
|
Research Institution | Hosei University |
Principal Investigator |
木村 光宏 法政大学, 理工学部, 教授 (20263486)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 多変量解析 / ソフトウェアプロジェクト / 統計的特徴づけ |
Outline of Annual Research Achievements |
第2年目となる今年度においては,引き続き,IPA/SECとの契約に基づいて,当該研究代表者に貸与されているソフトウェアプロジェクトに関するデータセットを利用することとした.これは2005年から2012年までの間に,国内24社の企業が,実際に開発を行ったソフトウェア開発プロジェクトについて,開発形態がどのようなものであったか,出荷するソフトウェアが対象とする業務の種類,使用言語の種類などのプロジェクトの外形的性質,また定量化されたデータである,出荷後1か月以内の不具合の数などが一覧表の形式となっているものである.その規模は3089件のプロジェクトに対して,611項目について各社の担当者から得られた回答からなるものである. 本研究の主題である,ソフトウェアプロジェクトの効率性を高めるための科学的方策の立案について,今年度の検討においては特に,データマイニングの観点から進め,興味のある研究項目としては,「どのようなソフトウェアプロジェクトが成功しにくいか」を判別したい,というものであった.これについては昨年度あるいはそれ以前の研究によって,上記のデータセットが,非常に欠測が多いことや定性的に答えるよう指示されたものがかなり多いことなどの特徴を持つことから,準備的研究である,欠測値の補完方法や定性的データによる多変量解析手法の,RandomForestの利用による精緻化などを行ってきた.これらを踏まえ,ソフトウェアプロジェクトが多くの定性的・定量的データで表されるとき,失敗プロジェクトあるいは成功プロジェクトがどのような変量によって特徴づけられるかについて検討を行ってきている.特に多変量データで,周辺度数が扱いにくい分布形状となっているようなものの処理法について検討した.現時点において公表されるべき結果までは到達しておらず,今年度発表された研究成果は周辺・派生的研究のものとなった.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
ソフトウェアプロジェクトの成功可否を特徴づける変量は何かについて,モデリングとデータ解析を試行錯誤的に,また継続的に行っているところであり,次年度3年目において一定の成果を得られるものと考えられる.
|
Strategy for Future Research Activity |
関連研究のサーベイを引き続き行いながら,大規模データセットにおけるデータマイニングの手法を検討しつつ,多変量データのアイテムにおける統計的特徴づけについて具体的なモデリングと解析を一定レベルまで完成させ,成果をまとめる.
|
Causes of Carryover |
今年度については研究成果概要等に記載した通り,主要な研究成果を対外に公開するまでには至らなかった.次年度初頭において一定の結果をまとめ,成果発表・論文投稿などを積極的に行うため,一部の使用を差し控えたことによって差額が生じたものであり,次年度の研究成果発表に合算して使用する所存である.
|
Expenditure Plan for Carryover Budget |
海外での研究発表を2件ないし3件行う.また比較的著名な,アクセス数の期待できる英文学会誌に研究成果を投稿し,採録となった場合は,より広く公開されることを狙って,多少経費がかさむOpen Accessのための追加費用も支払うことに充てるなどして,成果が広く公表されるよう,有効活用を図りたい.
|
Research Products
(5 results)