2023 年度実施状況報告書

プログラミング初学者の支援に向けたバグ自動修正・生成技術の創出

研究課題

研究課題/領域番号	22K18630
研究機関	九州大学
研究代表者	亀井靖高九州大学, システム情報科学研究院, 教授 (10610222)
研究期間 (年度)	2022-06-30 – 2025-03-31
キーワード	プログラミング教育 / 自動デバッグ / デバッグ支援 / バグ埋め込み / コンパイルエラー
研究実績の概要	昨年度から継続して今年度も，学習者の実行ログに対して，深層学習モデルや大規模言語モデルを適用し，コンパイルエラーを自動修正する技術の性能評価を行った．大規模言語モデルの著しい進歩の動向を注視しながら，主に下記の実績が得られた．１．大規模言語モデルに対する修正性能の調査：昨年度，初学者支援ツールへのGPT-3.5の適用に向けた初期評価として，九州大学の学生のデータを用いて調査を行った．その結果，GPT-3.5は先行研究である自動プログラム修正技術よりも10%以上高い精度での修正を行うことがわかった．今年度は，さらにその調査を深堀し，GPT3.5を用いてプログラム修正が可能であったもの，修正ができなかったものに対して目視調査を行った．調査の結果，GPT3.5はスコープや未定義変数に関するエラーの修正に苦戦することがわかった．また，GPT3.5は関数名や変数名を修正の内容を決定するために使用している可能性があることがわかった．２．大規模言語モデルのプロンプトの影響に関する調査：大規模言語モデルの特徴の1つに，入力として与えるプロンプトによって，出力に違いが出ることがある．本調査では，競技プログラミングコンテストのAtCoder Beginner Contestの難易度がA, B, C, Dから合計756問を収集して，GitHub Copilotの性能に影響を与えるプロンプトの項目を調べた．調査の結果，問題文が最も性能に影響を与えることがわかった．また，入力例か入出力の仕様が大きい影響を与えることがわかった．
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由「プログラミング初学者のつまずきの減らし」のコア部分であるコンパイルエラーの自動修正に対して昨年度に得られた結果を深堀し，修正できるものとできないものの分類を行うことができた．また，その内容を研究会において発表できた．それ以外の内容に関しても国際会議で発表予定であり，研究の進捗として順調に進展していると考える．
今後の研究の推進方策	現在までの進捗状況は，おおむね順調に進展している．ただし，大規模言語モデルの著しい進歩に関する動向を把握し，適宜，研究の推進方策を見直す．また，今年度でも行ったように，今後も国内外の研究会に積極的に参加し（オンライン開催を含む），多面的に意見を取り入れることで問題の早期解決を目指す．デバッグ問題の自動生成のための疑似バグ生成に関しても注力したい．
次年度使用額が生じた理由	2023年3月での国内研究会におけるフィードバックに基づいて，最終年度に向けた実験機器を購入しようと計算機等の購入を先延ばししたため，物品費を一部繰り越しした．また，最終年度では国際会議での発表を目指しているが，社会情勢の変化に伴って，国際会議の出張旅費が予想以上に高くなってきていることから旅費のために温存した．次年度は，国内外の打ち合わせ，及び，成果発表，また，計算機の購入に用いる予定である．

研究成果
(16件)

すべて 2024 2023 その他

すべて国際共同研究 (2件) 雑誌論文 (4件) (うち国際共著 4件、査読あり 4件、オープンアクセス 4件) 学会発表 (9件) (うち招待講演 1件) 備考 (1件)

[国際共同研究] University of Waterloo(カナダ)
- 国名
  カナダ
- 外国機関名
  University of Waterloo
[国際共同研究] USI(スイス)
- 国名
  スイス
- 外国機関名
  USI
[雑誌論文] Repeated Builds During Code Review: An Empirical Study of the OpenStack Community2023
- 著者名/発表者名
  Maipradit Rungroj、Wang Dong、Thongtanunam Patanamon、Kula Raula Gaikovina、Kamei Yasutaka、McIntosh Shane
- 雑誌名
  
  Proc. of the IEEE/ACM International Conference on Automated Software Engineering (ASE)
  
  巻: 1 ページ: 153-165
- DOI
  10.1109/ASE56229.2023.00030
- 査読あり / オープンアクセス / 国際共著
[雑誌論文] The Human Side of Fuzzing: Challenges Faced by Developers during Fuzzing Activities2023
- 著者名/発表者名
  Nourry Olivier、Kashiwa Yutaro、Lin Bin、Bavota Gabriele、Lanza Michele、Kamei Yasutaka
- 雑誌名
  
  ACM Transactions on Software Engineering and Methodology
  
  巻: 33 ページ: 1～26
- DOI
  10.1145/3611668
- 査読あり / オープンアクセス / 国際共著
[雑誌論文] Understanding the Role of Images on Stack Overflow2023
- 著者名/発表者名
  Wang Dong、Xiao Tao、Treude Christoph、Kula Raula Gaikovina、Hata Hideaki、Kamei Yasutaka
- 雑誌名
  
  Proc. of the IEEE/ACM International Conference on Mining Software Repositories (MSR)
  
  巻: 1 ページ: 377-388
- DOI
  10.1109/MSR59073.2023.00059
- 査読あり / オープンアクセス / 国際共著
[雑誌論文] TraceJIT: Evaluating the Impact of Behavioral Code Change on Just-In-Time Defect Prediction2023
- 著者名/発表者名
  Issei Morita, Yutaro Kashiwa, Masanari Kondo, Jeongju Sohn, Shane McIntosh, Yasutaka Kamei, Naoyasu Ubayash
- 雑誌名
  
  Prof. of the IEEE International Conference on Software Analysis, Evolution and Reengineering (SANER)
  
  巻: 1 ページ: 1-10
- 査読あり / オープンアクセス / 国際共著
[学会発表] 量子プログラムにおけるSATDの分類と評価2024
- 著者名/発表者名
  中村悠人，石本優太，勝部瞭太，佐藤直人，小川秀人，近藤将成，亀井靖高，鵜林尚靖
- 学会等名
  KBSE
[学会発表] GitHub Copilotを用いたコード生成におけるプロンプト削除の影響調査2024
- 著者名/発表者名
  戸井裕規，小栁慶，野口広太郎，近藤将成，亀井靖高，鵜林尚靖
- 学会等名
  SIGSE
[学会発表] 大学プログラミング教育で発生したコンパイルエラーに対する GPT-3.5 による修正の特徴分析2024
- 著者名/発表者名
  宇都宮魁斗，近藤将成，亀井靖高，鵜林尚靖
- 学会等名
  SIGSS
[学会発表] TraceJIT:Just-In-Time バグ予測におけるソフトウェアのふるまいの変化が与える影響の調査2023
- 著者名/発表者名
  森田一成，柏祐太郎，近藤将成，Jeongju Sohn，Shane McIntosh，亀井靖高，鵜林尚靖
- 学会等名
  情報処理学会九州支部若手の会
[学会発表] GitHub Copilotを用いたコード生成におけるプロンプト削除の影響調査2023
- 著者名/発表者名
  戸井裕規，小栁慶，野口広太郎，近藤将成，亀井靖高，鵜林尚靖
- 学会等名
  情報処理学会九州支部若手の会
[学会発表] プログラム自動修正に向けた行単位のバグ予測手法の拡張とその評価2023
- 著者名/発表者名
  和田寛太，森田一成，近藤将成，亀井靖高，鵜林尚靖
- 学会等名
  FOSE
[学会発表] GitHub Copilotを用いたコード推薦における入力言語の影響調査2023
- 著者名/発表者名
  小栁慶，野口広太郎，王棟，近藤将成，亀井靖高，鵜林尚靖
- 学会等名
  FOSE
[学会発表] 初学者のためのデバッグ作業支援に向けた大規模言語モデルの初期評価2023
- 著者名/発表者名
  宇都宮魁斗，秋山楽登，近藤将成，亀井靖高，鵜林尚靖
- 学会等名
  FOSE
[学会発表] 自動プログラム修正のこれまでとこれから2023
- 著者名/発表者名
  亀井靖高
- 学会等名
  情報処理学会九州支部若手の会
- 招待講演
[備考] 研究室ホームページ(PDF公開)
- URL
  https://posl.ait.kyushu-u.ac.jp/~kamei/publications.html

2023 年度 実施状況報告書

プログラミング初学者の支援に向けたバグ自動修正・生成技術の創出

研究代表者

亀井 靖高 九州大学, システム情報科学研究院, 教授 (10610222)

現在までの達成度 (区分)

理由

研究成果

[国際共同研究] University of Waterloo(カナダ)

国名

外国機関名

[国際共同研究] USI(スイス)

国名

外国機関名

[雑誌論文] Repeated Builds During Code Review: An Empirical Study of the OpenStack Community2023

著者名/発表者名

雑誌名

DOI

[雑誌論文] The Human Side of Fuzzing: Challenges Faced by Developers during Fuzzing Activities2023

著者名/発表者名

雑誌名

DOI

[雑誌論文] Understanding the Role of Images on Stack Overflow2023

著者名/発表者名

雑誌名

DOI

[雑誌論文] TraceJIT: Evaluating the Impact of Behavioral Code Change on Just-In-Time Defect Prediction2023

著者名/発表者名

雑誌名

[学会発表] 量子プログラムにおけるSATDの分類と評価2024

著者名/発表者名

学会等名

[学会発表] GitHub Copilotを用いたコード生成におけるプロンプト削除の影響調査2024

著者名/発表者名

学会等名

[学会発表] 大学プログラミング教育で発生したコンパイルエラーに対する GPT-3.5 による修正の特徴分析2024

著者名/発表者名

学会等名

[学会発表] TraceJIT:Just-In-Time バグ予測におけるソフトウェア のふるまいの変化が与える影響の調査2023

著者名/発表者名

学会等名

[学会発表] GitHub Copilotを用いたコード生成におけるプロンプト削除の影響調査2023

著者名/発表者名

学会等名

[学会発表] プログラム自動修正に向けた行単位のバグ予測手法の拡張とその評価2023

著者名/発表者名

学会等名

[学会発表] GitHub Copilotを用いたコード推薦における入力言語の影響調査2023

著者名/発表者名

学会等名

[学会発表] 初学者のためのデバッグ作業支援に向けた大規模言語モデルの初期評価2023

著者名/発表者名

学会等名

[学会発表] 自動プログラム修正のこれまでとこれから2023

著者名/発表者名

学会等名

[備考] 研究室ホームページ(PDF公開)

URL

2023 年度実施状況報告書

亀井靖高九州大学, システム情報科学研究院, 教授 (10610222)

[学会発表] TraceJIT:Just-In-Time バグ予測におけるソフトウェアのふるまいの変化が与える影響の調査2023