本研究では大局的に不具合を引き起こす原因となる語彙群を明らかにすべく,大規模な語彙情報を収集する実験設備を整えた上で研究を実施した.具体的には,クラウド上に配置した語彙収集データベースと学習・予測システムによって,ソフトウェア開発からデータを自動的に収集しながら,不具合予測結果を返す機構を開発した.これにより,世界中で開発されている多数のオープンソースソフトウェアのリポジトリから大規模に語彙情報を収集することを目指す.
最終年度は,前年度までに開発した機構を用いて大規模に収集したソースコード語彙から新規のソフトウェア開発における不具合予測を実施した.同義語の分析を行うことにより,収集したデータをプロジェクトを超えて再利用することが可能となるため,予測精度の向上を目指した研究開発を実施した. これまでに開発してきたシステムを基に実際に動作する予測システムを開発し,入力となるソースコードを本研究で利用可能な語彙の列に変換しながら,適宜予測を行う実験を実施した.
|