研究課題/領域番号 |
21K11831
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分60050:ソフトウェア関連
|
研究機関 | 愛媛大学 |
研究代表者 |
阿萬 裕久 愛媛大学, 総合情報メディアセンター, 教授 (50333513)
|
研究分担者 |
天嵜 聡介 岡山県立大学, 情報工学部, 准教授 (00434978)
横川 智教 岡山県立大学, 情報工学部, 准教授 (50382362)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2023年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2022年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2021年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
|
キーワード | 変数名 / メソッド名 / コードレビュー / 開発者特性 / 統計解析 / ソフトウェア品質 / 人的要素 / 定量的分析 / 自動評価 |
研究開始時の研究の概要 |
本研究では,プログラミングにおいてその作業者が影響すると思われる特徴,特に経験や好みによって違いが出やすい特徴に着目する.そして,そのような特徴が品質に及ぼす影響を定量データ分析の立場から明らかにしつつ,自然言語処理技術や機械学習技術を活用することで人手による評価に近い,意味的な側面に踏み込んだ評価を自動化することを目指す. 例えば,変数に付けられた名前の評価や,より良い名前の推薦を自動的に行える仕組みを開発していく.
|
研究実績の概要 |
2022 年度も前年度に引き続き,プログラム中の変数名とメソッド名(関数名)に注目した研究を実施した. まず,変数名については,前年度に開発・公開したツールを活用し,約 1800 件の Java オープンソース開発プロジェクトからソースコード中の変数データを収集した.さらに Python 向けのツールも開発し,約2400 件の Python オープンソース開発プロジェクトからもデータ収集を行った.そして,複数の単語を合成して作られた説明的な名前(複合語)に注目し,類似しているが異なる変数が混在している場合のソースコードの可読性低下に着目した研究を進め,本分野のトップジャーナルの一つである Empirical Software Engineering に論文を投稿した.査読者からは好意的なコメントを得ている一方,いくつか追加で説明すべき事項も指摘を受けており,現在,改訂版を再提出して再度の査読を受けているところである.収集した研究データ並びに開発したツールはいずれも Web 上で公開している. 次に,メソッド名に関してはこれまでに行ってきた機械学習技術の応用について,国内ジャーナルにて論文を発表できた.さらに,その後の発展として,学習並びに評価に利用可能なデータセットが欠如している点に着目し,ソースコードの変更履歴を活用することで自動的に不適切と思われるメソッド名を抽出してデータセット化することを提案した.そして,その一部の成果を国内のワークショップで発表するとともに,研究代表者の研究室 Web サイトでデータセットを公開した. また,以上のものとは別の視点として,ソースコードの書き方にも着目し,コーディング規約チェックツールを活用したデータ分析についても研究を行い,国内の研究会で発表を行った.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
昨年度に比べて移動制限が緩和され,国際会議や国内でのワークショップ・研究会には参加しやすくなってきていることもあり,当初の計画に近いレベルで活発に研究発表・聴講が可能になりつつある.査読付き論文数は 9 と昨年度の約 2 倍に増えてきており,上述したようにトップジャーナルへの投稿もできているため,研究はおおむね順調に進展していると考える.
|
今後の研究の推進方策 |
現在,研究分担者と共著で国際会議へ 4 件投稿中であり,もう 1 件も投稿準備中である.これらが採録されれば国際会議の場で発表を行い,研究の洗練化を図っていく予定である.仮に不採録となっても,査読コメントを参考に改善を行っていく.
また,現在査読中の国際ジャーナル論文が採録されれば本課題については大きな成果となるが,それに付随してより多くの研究者・技術者に研究成果を還元すべく,公開しているツールの改良にも着手する.
|