2023 Fiscal Year Research-status Report

Autorepairability: creating and disseminating a new software quality indicator

Research Project

Project/Area Number	21K18302
Research Institution	Osaka University
Principal Investigator	肥後芳樹大阪大学, 大学院情報科学研究科, 教授 (70452414)
Co-Investigator(Kenkyū-buntansha)	林晋平東京工業大学, 情報理工学院, 准教授 (40541975) 松本真佑大阪大学, 大学院情報科学研究科, 助教 (90583948)
Project Period (FY)	2021-07-09 – 2025-03-31
Keywords	自動プログラム修正 / ミューテーションテスティング / 大規模言語モデル / コードクローン
Outline of Annual Research Achievements	2023年度は，2022年度に作成した大規模な機能等価メソッドのデータベースを利用して，大規模言語モデルに基づくコードクローン検出技術の検出精度向上に取り組んだ．大規模言語モデルを用いたコードクローン検出は，構文的な類似度が低いコードクローンに対して従来の検出技術よりも高い精度での検出ができることが知られている．しかしながら，GPT-3.5-turboやGPT-4では，構文的な類似度が低いコードクローンの精度が十分に高いとはいえない．またLlama2ではほぼ全てのメソッドペアをコードクローンとして判断してしまっているのが現状である．そこで，本研究ではこれらの大規模言語モデルに対して，機能等価メソッドをファインチューニングに用いることにより，コードクローンの検出精度向上を試みた．その結果，GPT-3.5-turboについては，誤検出は減ったが検出漏れが増えた．また，Llama2についても同様の傾向が見られ，全体の検出精度が向上したことが確認できた．また，この機能等価メソッドデータベースを利用して自動修正適合性の計測も行った．機能等価なメソッドペアの両者に対して自動修正適合性を計測し，どのような場合にその値が異なるのかを調査した．その結果，Java言語については，if文を連続して書くよりは三項演算子を使うことで値が高くなることや，簡単な条件を持つif文を複数書くよりはそれらの条件を1つにした（条件が複雑になった）if文を1つだけ記述する方が値が高くなること等がわかった．この実験結果から，どのように人間がプログラムを記述すれば，自動プログラム修正技術によってバグ修正が行いやすくなるのかをある程度明らかにすることができた．
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 特に問題は起こっておらず，研究は順調に進んでいる．
Strategy for Future Research Activity	2024年度については，CやPythonについても機能等価なメソッド/関数のデータベースについて取り組む予定である．そして作成したデータベースはGitHub等で公開し，他の研究者もこのデータベースを利用できるようにする．また，2023年度に実施した大規模言語モデルを利用したコードクローン検出技術を機能等価メソッドデータベースを利用して精度向上する試みはまだ実験の規模が小さく，十分な成果が出ているとはいえない．2024年度については，より大規模な実験をさまざまなモデルを利用して行う．また，自動修正適合性がソースコードのバグ修正や機能追加でどのように変遷していくのかについても調査を行う予定である．これにより，自動修正適合性という品質指標の観点からソフトウェア進化を評価することができると考えている．
Causes of Carryover	2023年度下期に購入予定だった実験用ワークステーションの購入が2024年度にずれ込んでしまったため．また，2024年度下期に国際会議で発表予定だったが，急遽別の国際会議に出すことになりそれが2024年5月に開催であるため．

Research Products
(13 results)

All 2024 2023 Other

All Journal Article (3 results) (of which Peer Reviewed: 3 results) Presentation (9 results) (of which Int'l Joint Research: 5 results) Remarks (1 results)

[Journal Article] Dataset of Functionally Equivalent Java Methods and Its Application to Evaluating Clone Detection Tools2024
- Author(s)
  Yoshiki Higo
- Journal Title
  
  IEICE Transactions on Information and Systems
  
  Volume: E107-E Pages: -
- Peer Reviewed
[Journal Article] 自動プログラム生成におけるプログラム依存を考慮した交叉の提案2024
- Author(s)
  渡辺大登、?本真佑、肥後芳樹、楠本真二、倉林利行、切貫弘之、丹野治門
- Journal Title
  
  情報処理学会論文誌
  
  Volume: 65 Pages: 718--728
- DOI
  10.20729/00233254
- Peer Reviewed
[Journal Article] SemanticCloneBenchを用いた深層学習に基づくコードクローン検出手法の評価2024
- Author(s)
  鶴智秋, 松下誠, 肥後芳樹
- Journal Title
  
  電子情報通信学会論文誌D
  
  Volume: J107-D Pages: 1394--1398
- Peer Reviewed
[Presentation] Osmy: A Tool for Periodic Software Vulnerability Assessment and File Integrity Verification using SPDX Documents2024
- Author(s)
  Rio Kishimoto
- Organizer
  the 31th of the International Conference on Software Analysis, Evolution and Reengineering (SANER2024)
- Int'l Joint Research
[Presentation] Autorepairability: A New Software Quality Characteristic2024
- Author(s)
  Pongpop Lapvikai
- Organizer
  the 31th of the International Conference on Software Analysis, Evolution and Reengineering (SANER2024
- Int'l Joint Research
[Presentation] 機能等価メソッドデータセットを利用したLLMによるコードクローン検出の精度向上2024
- Author(s)
  井上龍太郎
- Organizer
  信学技報
[Presentation] Impacts of Program Structures on Code Coverage of Generated Test Suites2023
- Author(s)
  Ryoga Watanabe
- Organizer
  the 24th International Conference on Product-Focused Software Process Improvement
- Int'l Joint Research
[Presentation] Do Exceptional Behavior Tests Matter on Spectrum-Based Fault Localization?2023
- Author(s)
  Haruka Yoshioka
- Organizer
  the 24th International Conference on Product-Focused Software Process Improvement (PROFES2023)
- Int'l Joint Research
[Presentation] PyVerDetector: A Chrome Extension Detecting the Python Version of Stack Overflow Code Snippets2023
- Author(s)
  Shiyu Yang
- Organizer
  the 31st IEEE/ACM International Conference on Program Comprehension (ICPC2023)
- Int'l Joint Research
[Presentation] 自動テスト生成技術を利用した機能等価メソッドデータセットの構築2023
- Author(s)
  肥後芳樹
- Organizer
  ソフトウェアエンジニアリングシンポジウム2023
[Presentation] 大規模データセットと多種ミューテーション演算子を利用した欠陥限局に適するプログラム構造の再調査2023
- Author(s)
  久保光生
- Organizer
  ソフトウェアエンジニアリングシンポジウム2023
[Presentation] 例外処理を検査するテストが実行経路に基づく欠陥限局手法に与える影響の調査2023
- Author(s)
  吉岡遼
- Organizer
  ソフトウェアエンジニアリングシンポジウム2023
[Remarks] FEMPDataset (機能等価メソッドペアデータセット)
- URL
  https://github.com/YoshikiHigo/FEMPDataset

2023 Fiscal Year Research-status Report

Autorepairability: creating and disseminating a new software quality indicator

Principal Investigator

肥後 芳樹 大阪大学, 大学院情報科学研究科, 教授 (70452414)

Current Status of Research Progress

Reason

Research Products

[Journal Article] Dataset of Functionally Equivalent Java Methods and Its Application to Evaluating Clone Detection Tools2024

Author(s)

Journal Title

[Journal Article] 自動プログラム生成におけるプログラム依存を考慮した交叉の提案2024

Author(s)

Journal Title

DOI

[Journal Article] SemanticCloneBenchを用いた深層学習に基づくコードクローン検出手法の評価2024

Author(s)

Journal Title

[Presentation] Osmy: A Tool for Periodic Software Vulnerability Assessment and File Integrity Verification using SPDX Documents2024

Author(s)

Organizer

[Presentation] Autorepairability: A New Software Quality Characteristic2024

Author(s)

Organizer

[Presentation] 機能等価メソッドデータセットを利用したLLMによるコードクローン検出の精度向上2024

Author(s)

Organizer

[Presentation] Impacts of Program Structures on Code Coverage of Generated Test Suites2023

Author(s)

Organizer

[Presentation] Do Exceptional Behavior Tests Matter on Spectrum-Based Fault Localization?2023

Author(s)

Organizer

[Presentation] PyVerDetector: A Chrome Extension Detecting the Python Version of Stack Overflow Code Snippets2023

Author(s)

Organizer

[Presentation] 自動テスト生成技術を利用した機能等価メソッドデータセットの構築2023

Author(s)

Organizer

[Presentation] 大規模データセットと多種ミューテーション演算子を利用した欠陥限局に適するプログラム構造の再調査2023

Author(s)

Organizer

[Presentation] 例外処理を検査するテストが実行経路に基づく欠陥限局手法に与える影響の調査2023

Author(s)

Organizer

[Remarks] FEMPDataset (機能等価メソッドペアデータセット)

URL

肥後芳樹大阪大学, 大学院情報科学研究科, 教授 (70452414)