• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2022 Fiscal Year Research-status Report

多様なプログラミング言語に対応可能なコードクローン検出ツールの開発

Research Project

Project/Area Number 20K11745
Research InstitutionRitsumeikan University

Principal Investigator

吉田 則裕  立命館大学, 情報理工学部, 教授 (00582545)

Project Period (FY) 2020-04-01 – 2024-03-31
Keywordsコードクローン
Outline of Annual Research Achievements

コードクローンとは,ソフトウェア開発中にコピーアンドペーストなどにより作成された類似したコード片である.コードクローンは,ソフトウェア保守を困難にする要因の1つであるため,検出し管理する必要がある.1990年代以降,数多くのコードクローン検出ツールが提案されたが,そのほとんどは限られたプログラミング言語のみに対応し,対応言語を増加させることが難しい.プログラミング言語は,頻繁に新規開発や文法の更新が行われるため,対応言語を柔軟に追加可能なコードクローン検出ツールが必要であると考えられる.研究代表者は以前に,対象言語の文法の一部を正規表現として抽出し,対応言語を柔軟に増加できるコードクローン検出ツールを開発した.しかし,正規表現では表現能力が不足しているため,対応できない言語がある.加えて,トークン列の照合に基づきコードクローンを検出するため,ステートメントの追加や削除を行ったコードクローンを検出する能力はない.

そこで,多様なプログラミング言語に対応可能であり,ステートメントの追加・削除を許容するコードクローン検出ツールを実装した. 具体的には,パーサジェネレータの1つであるANTLRを使用してソースコード正規化を行い,Token Bagモデルを基にコード片の類似度を計算することによって,検出可能なコードクローンの種類を増加させることを試みた.

研究成果を論文にまとめ,国際会議30th IEEE/ACM International Conference on Program Comprehension (ICPC 2022)に投稿し,採録されたため発表を行った.また,大規模ソースコード集合CodeNetを用いた評価実験に取り組んだ.

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

BigCloneBench等のコードクローン検出ツールのベンチマークであるのみでは十分な評価実験を行うことができないことがわかり,大規模ソースコード集合CodeNetを対象とした追加実験を行っている.この追加実験を行うことになったため,評価実験に想定よりも時間を要している.

Strategy for Future Research Activity

大規模ソースコード集合CodeNetを対象とした追加実験を引き続き行うことで,十分な評価実験および考察を行う予定である.また,評価実験の結果をまとめ,ジャーナル論文を投稿予定である.

Causes of Carryover

提案手法を評価するベンチマークとしてBigCloneBenchを用いることにしていたが,BigCloneBenchだけでは十分な評価を行うことが出来ないことがわかった.そのため,大規模ソースコード集合CodeNetを用いた評価を追加することを目的として,実験的評価のための物品購入費や評価方法について様々な研究者と議論するための旅費を使用する.

  • Research Products

    (3 results)

All 2022

All Journal Article (1 results) (of which Peer Reviewed: 1 results,  Open Access: 1 results) Presentation (2 results) (of which Int'l Joint Research: 1 results)

  • [Journal Article] コードクローン検索手法の調査2022

    • Author(s)
      崔 恩瀞、藤原 裕士、吉田 則裕、水野 修
    • Journal Title

      コンピュータ ソフトウェア

      Volume: 39 Pages: 3_47~3_59

    • DOI

      10.11309/jssst.39.3_47

    • Peer Reviewed / Open Access
  • [Presentation] MSCCD: Grammar Pluggable Clone Detection Based on ANTLR Parser Generation2022

    • Author(s)
      Wenqing Zhu, Norihiro Yoshida, Toshihiro Kamiya, Eunjong Choi, Hiroaki Takada
    • Organizer
      30th IEEE/ACM International Conference on Program Comprehension (ICPC 2022)
    • Int'l Joint Research
  • [Presentation] コードクローン検出に基づくIoTを対象とした自動パッチ生成2022

    • Author(s)
      大野 堅太郎, 吉田 則裕, 朱 文青, 高田 広章
    • Organizer
      日本ソフトウェア科学会 第29回ソフトウェア工学の基礎ワークショップ (FOSE 2022)

URL: 

Published: 2023-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi