研究課題/領域番号 |
20K11745
|
研究機関 | 名古屋大学 |
研究代表者 |
吉田 則裕 名古屋大学, 情報学研究科, 准教授 (00582545)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
キーワード | コードクローン / 構文解析 / プログラミング言語 |
研究実績の概要 |
コードクローンとは,ソフトウェア開発中にコピーアンドペーストなどにより作成された類似したコード片である.コードクローンは,ソフトウェア保守を困難にする要因の1つであるため,検出し管理する必要がある.1990年代以降,数多くのコードクローン検出ツールが提案されたが,そのほとんどは限られたプログラミング言語のみに対応し,対応言語を増加させることが難しい.プログラミング言語は,頻繁に新規開発や文法の更新が行われるため,対応言語を柔軟に追加可能なコードクローン検出ツールが必要であると考えられる.研究代表者は以前に,対象言語の文法の一部を正規表現として抽出し,対応言語を柔軟に増加できるコードクローン検出ツールを開発した.しかし,正規表現では表現能力が不足しているため,対応できない言語がある.加えて,トークン列の照合に基づきコードクローンを検出するため,ステートメントの追加や削除を行ったコードクローンを検出する能力はない. そこで,多様なプログラミング言語に対応可能であり,ステートメントの追加・削除を許容するコードクローン検出ツールを実装した. 具体的には,パーサジェネレータの1つであるANTLRを使用してソースコード正規化を行い,Token Bagモデルを基にコード片の類似度を計算することによって,検出可能なコードクローンの種類を増加させることを試みた.本ツールは,まず構文定義記述から構文解析器を生成する機能で,ソースコード正規化器を自動的に生成する.その次に,生成された正規化器を用いて,ソートコードに構文解析を行い,Token Bagを抽出する.その後,コード片間の類似度を計算する.実験的評価として,主要プログラミング言語への適用可能性や検出精度に関する実験を行い,両者とも良好な結果を得た.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
実験的評価にまだ不十分な点があるものの,同分野の共同研究者から助言や指導学生の協力により,おおむね順調に進展している.
|
今後の研究の推進方策 |
2022年度5月に国際会議発表を予定している.国際会議発表で得られるであろう専門家の意見をもとに,提案手法や評価実験について再検討を行う予定である.
|
次年度使用額が生じた理由 |
新型コロナウィルスの感染拡大による影響で,国内外の学会が中止またはオンライン化され,旅費の大部分が不要となったためである.次年度は積極的に国際会議への参加や発表を行う予定である.
|