研究課題/領域番号 |
25220003
|
研究機関 | 大阪大学 |
研究代表者 |
井上 克郎 大阪大学, 情報科学研究科, 教授 (20168438)
|
研究分担者 |
楠本 真二 大阪大学, 情報科学研究科, 教授 (30234438)
松下 誠 大阪大学, 情報科学研究科, 准教授 (60304028)
石尾 隆 奈良先端科学技術大学院大学, 先端科学技術研究科, 准教授 (60452413)
岡野 浩三 信州大学, 学術研究院工学系, 准教授 (70252632)
肥後 芳樹 大阪大学, 情報科学研究科, 准教授 (70452414)
|
研究期間 (年度) |
2013-05-31 – 2018-03-31
|
キーワード | プログラム解析 / オープンソースソフトウェア / ソフトウェアライブラリ / 機械学習 |
研究実績の概要 |
昨年度から引き続いて、ソフトウェア資産の分析ならびに効果的な利活用に関する研究課題に対して、主に以下のような成果を得た。本課題を遂行するにあたり、国内はもとより国外の研究者とも積極的な情報交換を行い、国内外で積極的な成果発表を行った。 ソフトウェア開発の効率を向上させるため、ライブラリなどのAPIが利用されている。一方で、巨大化・複雑化したAPIの利用は必ずしも容易ではない。そこでAPIの理解を支援するコード検索手法を提案した。本手法は「変数のデータフロー」を指定し、APIの理解に有益なコード例を検索でき、検索対象となるソースコードを既存のコード検索エンジンから取得することで多様なAPIの検索に対応し、有限オートマトンを利用した軽量なアルゴリズムを用いることでウェブアプリケーションとしての実装を実現している点が特徴的である。評価実験では、提案手法がAPIの理解を有効に支援する場合があることや、検索クエリの記述が比較的容易であること、検索時間が実用的な範囲に収まることを確認した。 ソースコードの解析対象中にはしばしば自動生成ファイルが含まれるため、それらは通常前処理段階で除外される。自動生成ファイルは特有のコメント文を含むことが多いため、文字列検索を用いて特定されるが、コメント文が消された場合に対応できない。またソースファイルが自動生成ファイルであるかを目視で特定するコストは大きすぎる。そこで、機械学習を用いて任意の自動生成ファイルを自動的に特定する手法を提案した。本手法はソースファイルの構文情報を学習することで自動生成ファイルであるかどうかを判定する。4 つの自動生成プログラムから生成された自動生成ファイル群を対象に評価実験を行った結果、90%以上の高い精度で自動生成ファイルを特定できることを確認した。
|
現在までの達成度 (段落) |
平成29年度が最終年度であるため、記入しない。
|
今後の研究の推進方策 |
平成29年度が最終年度であるため、記入しない。
|