2023 年度実施状況報告書

自動修正適合性：新しいソフトウェア品質指標の創成と普及

研究課題

研究課題/領域番号	21K18302
研究機関	大阪大学
研究代表者	肥後芳樹大阪大学, 大学院情報科学研究科, 教授 (70452414)
研究分担者	林晋平東京工業大学, 情報理工学院, 准教授 (40541975) 松本真佑大阪大学, 大学院情報科学研究科, 助教 (90583948)
研究期間 (年度)	2021-07-09 – 2025-03-31
キーワード	自動プログラム修正 / ミューテーションテスティング / 大規模言語モデル / コードクローン
研究実績の概要	2023年度は，2022年度に作成した大規模な機能等価メソッドのデータベースを利用して，大規模言語モデルに基づくコードクローン検出技術の検出精度向上に取り組んだ．大規模言語モデルを用いたコードクローン検出は，構文的な類似度が低いコードクローンに対して従来の検出技術よりも高い精度での検出ができることが知られている．しかしながら，GPT-3.5-turboやGPT-4では，構文的な類似度が低いコードクローンの精度が十分に高いとはいえない．またLlama2ではほぼ全てのメソッドペアをコードクローンとして判断してしまっているのが現状である．そこで，本研究ではこれらの大規模言語モデルに対して，機能等価メソッドをファインチューニングに用いることにより，コードクローンの検出精度向上を試みた．その結果，GPT-3.5-turboについては，誤検出は減ったが検出漏れが増えた．また，Llama2についても同様の傾向が見られ，全体の検出精度が向上したことが確認できた．また，この機能等価メソッドデータベースを利用して自動修正適合性の計測も行った．機能等価なメソッドペアの両者に対して自動修正適合性を計測し，どのような場合にその値が異なるのかを調査した．その結果，Java言語については，if文を連続して書くよりは三項演算子を使うことで値が高くなることや，簡単な条件を持つif文を複数書くよりはそれらの条件を1つにした（条件が複雑になった）if文を1つだけ記述する方が値が高くなること等がわかった．この実験結果から，どのように人間がプログラムを記述すれば，自動プログラム修正技術によってバグ修正が行いやすくなるのかをある程度明らかにすることができた．
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由特に問題は起こっておらず，研究は順調に進んでいる．
今後の研究の推進方策	2024年度については，CやPythonについても機能等価なメソッド/関数のデータベースについて取り組む予定である．そして作成したデータベースはGitHub等で公開し，他の研究者もこのデータベースを利用できるようにする．また，2023年度に実施した大規模言語モデルを利用したコードクローン検出技術を機能等価メソッドデータベースを利用して精度向上する試みはまだ実験の規模が小さく，十分な成果が出ているとはいえない．2024年度については，より大規模な実験をさまざまなモデルを利用して行う．また，自動修正適合性がソースコードのバグ修正や機能追加でどのように変遷していくのかについても調査を行う予定である．これにより，自動修正適合性という品質指標の観点からソフトウェア進化を評価することができると考えている．
次年度使用額が生じた理由	2023年度下期に購入予定だった実験用ワークステーションの購入が2024年度にずれ込んでしまったため．また，2024年度下期に国際会議で発表予定だったが，急遽別の国際会議に出すことになりそれが2024年5月に開催であるため．

研究成果
(13件)

すべて 2024 2023 その他

すべて雑誌論文 (3件) (うち査読あり 3件) 学会発表 (9件) (うち国際学会 5件) 備考 (1件)

[雑誌論文] Dataset of Functionally Equivalent Java Methods and Its Application to Evaluating Clone Detection Tools2024
- 著者名/発表者名
  Yoshiki Higo
- 雑誌名
  
  IEICE Transactions on Information and Systems
  
  巻: E107-E ページ: -
- 査読あり
[雑誌論文] 自動プログラム生成におけるプログラム依存を考慮した交叉の提案2024
- 著者名/発表者名
  渡辺大登、?本真佑、肥後芳樹、楠本真二、倉林利行、切貫弘之、丹野治門
- 雑誌名
  
  情報処理学会論文誌
  
  巻: 65 ページ: 718--728
- DOI
  10.20729/00233254
- 査読あり
[雑誌論文] SemanticCloneBenchを用いた深層学習に基づくコードクローン検出手法の評価2024
- 著者名/発表者名
  鶴智秋, 松下誠, 肥後芳樹
- 雑誌名
  
  電子情報通信学会論文誌D
  
  巻: J107-D ページ: 1394--1398
- 査読あり
[学会発表] Osmy: A Tool for Periodic Software Vulnerability Assessment and File Integrity Verification using SPDX Documents2024
- 著者名/発表者名
  Rio Kishimoto
- 学会等名
  the 31th of the International Conference on Software Analysis, Evolution and Reengineering (SANER2024)
- 国際学会
[学会発表] Autorepairability: A New Software Quality Characteristic2024
- 著者名/発表者名
  Pongpop Lapvikai
- 学会等名
  the 31th of the International Conference on Software Analysis, Evolution and Reengineering (SANER2024
- 国際学会
[学会発表] 機能等価メソッドデータセットを利用したLLMによるコードクローン検出の精度向上2024
- 著者名/発表者名
  井上龍太郎
- 学会等名
  信学技報
[学会発表] Impacts of Program Structures on Code Coverage of Generated Test Suites2023
- 著者名/発表者名
  Ryoga Watanabe
- 学会等名
  the 24th International Conference on Product-Focused Software Process Improvement
- 国際学会
[学会発表] Do Exceptional Behavior Tests Matter on Spectrum-Based Fault Localization?2023
- 著者名/発表者名
  Haruka Yoshioka
- 学会等名
  the 24th International Conference on Product-Focused Software Process Improvement (PROFES2023)
- 国際学会
[学会発表] PyVerDetector: A Chrome Extension Detecting the Python Version of Stack Overflow Code Snippets2023
- 著者名/発表者名
  Shiyu Yang
- 学会等名
  the 31st IEEE/ACM International Conference on Program Comprehension (ICPC2023)
- 国際学会
[学会発表] 自動テスト生成技術を利用した機能等価メソッドデータセットの構築2023
- 著者名/発表者名
  肥後芳樹
- 学会等名
  ソフトウェアエンジニアリングシンポジウム2023
[学会発表] 大規模データセットと多種ミューテーション演算子を利用した欠陥限局に適するプログラム構造の再調査2023
- 著者名/発表者名
  久保光生
- 学会等名
  ソフトウェアエンジニアリングシンポジウム2023
[学会発表] 例外処理を検査するテストが実行経路に基づく欠陥限局手法に与える影響の調査2023
- 著者名/発表者名
  吉岡遼
- 学会等名
  ソフトウェアエンジニアリングシンポジウム2023
[備考] FEMPDataset (機能等価メソッドペアデータセット)
- URL
  https://github.com/YoshikiHigo/FEMPDataset

2023 年度 実施状況報告書

自動修正適合性：新しいソフトウェア品質指標の創成と普及

研究代表者

肥後 芳樹 大阪大学, 大学院情報科学研究科, 教授 (70452414)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] Dataset of Functionally Equivalent Java Methods and Its Application to Evaluating Clone Detection Tools2024

著者名/発表者名

雑誌名

[雑誌論文] 自動プログラム生成におけるプログラム依存を考慮した交叉の提案2024

著者名/発表者名

雑誌名

DOI

[雑誌論文] SemanticCloneBenchを用いた深層学習に基づくコードクローン検出手法の評価2024

著者名/発表者名

雑誌名

[学会発表] Osmy: A Tool for Periodic Software Vulnerability Assessment and File Integrity Verification using SPDX Documents2024

著者名/発表者名

学会等名

[学会発表] Autorepairability: A New Software Quality Characteristic2024

著者名/発表者名

学会等名

[学会発表] 機能等価メソッドデータセットを利用したLLMによるコードクローン検出の精度向上2024

著者名/発表者名

学会等名

[学会発表] Impacts of Program Structures on Code Coverage of Generated Test Suites2023

著者名/発表者名

学会等名

[学会発表] Do Exceptional Behavior Tests Matter on Spectrum-Based Fault Localization?2023

著者名/発表者名

学会等名

[学会発表] PyVerDetector: A Chrome Extension Detecting the Python Version of Stack Overflow Code Snippets2023

著者名/発表者名

学会等名

[学会発表] 自動テスト生成技術を利用した機能等価メソッドデータセットの構築2023

著者名/発表者名

学会等名

[学会発表] 大規模データセットと多種ミューテーション演算子を利用した欠陥限局に適するプログラム構造の再調査2023

著者名/発表者名

学会等名

[学会発表] 例外処理を検査するテストが実行経路に基づく欠陥限局手法に与える影響の調査2023

著者名/発表者名

学会等名

[備考] FEMPDataset (機能等価メソッドペアデータセット)

URL

2023 年度実施状況報告書

肥後芳樹大阪大学, 大学院情報科学研究科, 教授 (70452414)