• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

多様なプログラミング言語に対応可能なコードクローン検出ツールの開発

Research Project

Project/Area Number 20K11745
Research Category

Grant-in-Aid for Scientific Research (C)

Allocation TypeMulti-year Fund
Section一般
Review Section Basic Section 60050:Software-related
Research InstitutionRitsumeikan University (2022-2023)
Nagoya University (2020-2021)

Principal Investigator

吉田 則裕  立命館大学, 情報理工学部, 教授 (00582545)

Project Period (FY) 2020-04-01 – 2025-03-31
Project Status Granted (Fiscal Year 2023)
Budget Amount *help
¥3,770,000 (Direct Cost: ¥2,900,000、Indirect Cost: ¥870,000)
Fiscal Year 2022: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2021: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2020: ¥1,690,000 (Direct Cost: ¥1,300,000、Indirect Cost: ¥390,000)
Keywordsコードクローン / 構文解析 / プログラミング言語
Outline of Research at the Start

コードクローンとは,ソースコード中の一部分(コード片)のうち,他のコード片と類似しているものを指す.これまで,数多くのコードクローン検出ツールが開発されてきたが,対応言語を追加するための拡張を行うことが難しいという問題点があった.目的に合わせ多種多様なプログラミング言語が開発・使用されるようになってきており,対応言語を柔軟に増やすことができないことは,コードクローン検出ツールの普及を阻害している.そこで本研究では,柔軟に変更可能な構文解析機構を持つコードクローン検出ツールを開発する.

Outline of Annual Research Achievements

コードクローンとは,ソフトウェア開発中にコピーアンドペーストなどにより作成された類似したコード片である.コードクローンは,ソフトウェア保守を困難にする要因の1つであるため,検出し管理する必要がある.1990年代以降,数多くのコードクローン検出ツールが提案されたが,そのほとんどは限られたプログラミング言語のみに対応し,対応言語を増加させることが難しい.プログラミング言語は,頻繁に新規開発や文法の更新が行われるため,対応言語を柔軟に追加可能なコードクローン検出ツールが必要であると考えられる.研究代表者は以前に,対象言語の文法の一部を正規表現として抽出し,対応言語を柔軟に増加できるコードクローン検出ツールを開発した.しかし,正規表現では表現能力が不足しているため,対応できない言語がある.加えて,トークン列の照合に基づきコードクローンを検出するため,ステートメントの追加や削除を行ったコードクローンを検出する能力はない.

そこで,多様なプログラミング言語に対応可能であり,ステートメントの追加・削除を許容するコードクローン検出ツールを実装した. 具体的には,パーサジェネレータの1つであるANTLRを使用してソースコード正規化を行い,Token Bagモデルを基にコード片の類似度を計算することによって,検出可能なコードクローンの種類を増加させることを試みた.

実装したコードクローン検出を,様々なプログラミング言語で記述されているIoTシステムのプログラムに適用した.今後,IoTシステムにおいてコードクローンが適切に管理されているか分析を行う予定である.

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

有効性の追加検証を行うため,様々なプログラミング言語で記述されているIoTシステムのプログラムに適用することとなった.そのための実験対象の選定等準備に想定より時間を要している.

Strategy for Future Research Activity

有効性の追加検証を行うため,様々なプログラミング言語で記述されているIoTシステムのプログラムに適用する.実験対象の準備や適用方法についての検討は完了したため,適用や適用結果の分析については効率的に行うことが出来ると考えている.

Report

(4 results)
  • 2023 Research-status Report
  • 2022 Research-status Report
  • 2021 Research-status Report
  • 2020 Research-status Report
  • Research Products

    (9 results)

All 2022 2021 2020

All Journal Article (5 results) (of which Peer Reviewed: 5 results,  Open Access: 5 results) Presentation (4 results) (of which Int'l Joint Research: 1 results)

  • [Journal Article] A Survey of Approaches for Code Clone Search2022

    • Author(s)
      崔 恩瀞、藤原 裕士、吉田 則裕、水野 修
    • Journal Title

      Computer Software

      Volume: 39 Issue: 3 Pages: 3_47-3_59

    • DOI

      10.11309/jssst.39.3_47

    • ISSN
      0289-6540
    • Year and Date
      2022-07-22
    • Related Report
      2022 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] Determining Cross-Polytope Locality-Sensitive Hashing Parameters for Code Clone Detection2021

    • Author(s)
      徳井 翔梧、吉田 則裕、崔 恩瀞、井上 克郎
    • Journal Title

      Computer Software

      Volume: 38 Issue: 4 Pages: 4_60-4_82

    • DOI

      10.11309/jssst.38.4_60

    • NAID

      130008132031

    • ISSN
      0289-6540
    • Year and Date
      2021-10-22
    • Related Report
      2021 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] Comparing Deep Learning-based Approaches for Source Code Classification2021

    • Author(s)
      藤原 裕士, 崔 恩瀞, 吉田 則裕, 井上 克郎
    • Journal Title

      電子情報通信学会論文誌D 情報・システム

      Volume: J104-D Issue: 8 Pages: 622-635

    • DOI

      10.14923/transinfj.2020JDP7068

    • ISSN
      1880-4535, 1881-0225
    • Year and Date
      2021-08-01
    • Related Report
      2021 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] A Dynamic Improvement of a Training Dataset for Source Code Classification Using Deep Learning2021

    • Author(s)
      藤原 裕士, 崔 恩瀞, 吉田 則裕, 井上 克郎
    • Journal Title

      電子情報通信学会論文誌D 情報・システム

      Volume: J104-D Issue: 4 Pages: 275-284

    • DOI

      10.14923/transinfj.2020PDP0005

    • ISSN
      1880-4535, 1881-0225
    • Year and Date
      2021-04-01
    • Related Report
      2021 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] CCFinderSW: Clone Detection Tool with Flexible Multilingual Tokenization2020

    • Author(s)
      瀬村 雄一、吉田 則裕、崔 恩瀞、井上 克郎
    • Journal Title

      電子情報通信学会論文誌D 情報・システム

      Volume: J103-D Issue: 4 Pages: 215-227

    • DOI

      10.14923/transinfj.2019PDP0025

    • ISSN
      1880-4535, 1881-0225
    • Year and Date
      2020-04-01
    • Related Report
      2020 Research-status Report
    • Peer Reviewed / Open Access
  • [Presentation] MSCCD: Grammar Pluggable Clone Detection Based on ANTLR Parser Generation2022

    • Author(s)
      Wenqing Zhu, Norihiro Yoshida, Toshihiro Kamiya, Eunjong Choi, Hiroaki Takada
    • Organizer
      30th IEEE/ACM International Conference on Program Comprehension (ICPC 2022)
    • Related Report
      2022 Research-status Report
    • Int'l Joint Research
  • [Presentation] コードクローン検出に基づくIoTを対象とした自動パッチ生成2022

    • Author(s)
      大野 堅太郎, 吉田 則裕, 朱 文青, 高田 広章
    • Organizer
      日本ソフトウェア科学会 第29回ソフトウェア工学の基礎ワークショップ (FOSE 2022)
    • Related Report
      2022 Research-status Report
  • [Presentation] 深層学習を用いたコードクローン検出器のベンチマーク間精度調査2022

    • Author(s)
      福家 範浩, 藤原 裕士, 吉田 則裕, 崔 恩瀞, 井上 克郎
    • Organizer
      "情報処理学会第210回 ソフトウェア工学研究発表会"
    • Related Report
      2021 Research-status Report
  • [Presentation] 深層学習を用いたコードクローン検出器の汎化性能に関する調査2021

    • Author(s)
      福家 範浩, 藤原 裕士, 吉田 則裕, 崔 恩瀞, 井上 克郎
    • Organizer
      情報処理学会 第207回 ソフトウェア工学研究発表会
    • Related Report
      2020 Research-status Report

URL: 

Published: 2020-04-28   Modified: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi