研究実績の概要 |
本研究課題では、次の2件の研究発表を行った。 1件目は、辻 優太郎,神谷 年洋, "SCDVモデルを利用する技術用語に対応した自然言語文書検索の提案", ソフトエア工学の基礎29 日本ソフトウェア科学会 FOSE2022, pp. 223-224, ライブ論文 (2022-11-11)、である。この発表では、機械学習モデルの一つであるSCDVを用いて自然言語テキストの分散表現化を行う際に、異なる分野のコーパスを用いて学習した2つのモデルを利用することで、文書検索の精度が上がることを、実験的に確認した。特に一方のコーパスはIT技術に関する文書を選んだものであり、ソフトウェア開発において必要な文書の精度を向上させる効果が見込めるものである。 2件目は、研究期間内にアクセプトされ5月の国際会議にて発表を行った、Wenqing Zhu, Norihiro Yoshida, Toshihiro Kamiya, Eunjong Choi, Hiroaki Takada: "MSCCD: Grammar Pluggable Clone Detection Based on ANTLR Parser Generation", Proceedings of the 30th IEEE/ACM International Conference on Program Comprehension (ICPC 2022), pp. 460-470. May 2022、である。この発表ではANTLRのパーザーを利用することで、コードクローン検出ツールが多くのプログラミング言語に適用可能となることを示した。この研究は、機械学習を応用した手法を開発したというものではなく、その手前の、機械学習モデルの訓練データを生成する方法として利用できるという観点からの進捗である。
|