• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Extracting syntactical structures in programs by using machine learning

Research Project

Project/Area Number 19K22840
Research Category

Grant-in-Aid for Challenging Research (Exploratory)

Allocation TypeMulti-year Fund
Review Section Medium-sized Section 60:Information science, computer engineering, and related fields
Research InstitutionThe University of Tokyo

Principal Investigator

Chiba Shigeru  東京大学, 大学院情報理工学系研究科, 教授 (80282713)

Project Period (FY) 2019-06-28 – 2023-03-31
Project Status Completed (Fiscal Year 2022)
Budget Amount *help
¥6,500,000 (Direct Cost: ¥5,000,000、Indirect Cost: ¥1,500,000)
Fiscal Year 2020: ¥2,600,000 (Direct Cost: ¥2,000,000、Indirect Cost: ¥600,000)
Fiscal Year 2019: ¥3,900,000 (Direct Cost: ¥3,000,000、Indirect Cost: ¥900,000)
Keywordsプログラミング言語 / ソフトウェア工学 / 機械学習 / モジュール化 / ソフトウエア工学 / 開発環境
Outline of Research at the Start

プログラミング言語の文法を GitHub 等のレポジトリから得たコーパスを機械学習することによって得ることができるだろうか、という問いに答えるのが本研究の目的である。プログラミング言語は人工言語であるので、普通、文法は既知であり、わざわざコーパスから探索的に抽出する必要はない。本研究では、いわゆる通常の形式文法に制限されない様々な新しい「文法」を考え、その獲得方法と応用を研究する。例えばプログラミング言語のコーディング規約や、ライブラリ関数の呼び出し順のようなものを文法とみなして取り扱う手法を研究する。

Outline of Final Research Achievements

We conducted research on programming supports by using language models based on machine learning, which is significantly advanced in these years. By utilizing language models, we extract the broad sense of "syntactical structures" in programming languages, and we apply them to practical programming supports. Specifically, we focused on extracting and applying certain syntactical structures of the order of method calls, which is found in programming using a library, syntactical structures common to different programming languages, and certain syntactical structures observed in modularization for programs.

Academic Significance and Societal Importance of the Research Achievements

現在、言語モデルは大規模化することで、本研究が用いていたような小規模なモデルでは達成できなかったような精度を実現できている。本研究は、モデル自体の研究ではなく、モデルの機能を実用的なプログラミング支援に活かす方法を探る研究であった。本研究の成果は、大規模化した言語モデルと組み合わせることで、さらなる性能向上が期待でき、現実世界のプログラミングの支援技術の向上に貢献できると考えられる。これは社会基盤として安心安全なITシステムの実現の一助になる技術である。

Report

(5 results)
  • 2022 Annual Research Report   Final Research Report ( PDF )
  • 2021 Research-status Report
  • 2020 Research-status Report
  • 2019 Research-status Report
  • Research Products

    (7 results)

All 2022 2021 2020 2019

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (6 results)

  • [Journal Article] An Anomaly-Based Approach for Detecting Modularity Violations on Method Placement2022

    • Author(s)
      Yoda Kazuki、Nakamaru Tomoki、Akiyama Soramichi、Chiba Shigeru
    • Journal Title

      Proc. of the 22nd IEEE International Conference on Software Quality, Reliability, and Security (QRS 2022)

      Volume: N/A Pages: 287-298

    • DOI

      10.1109/qrs57517.2022.00038

    • Related Report
      2022 Annual Research Report
    • Peer Reviewed
  • [Presentation] Attempts on Finding Cross-Language Code Clones based on Text and AST Information2022

    • Author(s)
      Feng Dai, Shigeru Chiba
    • Organizer
      39th JSSST Conference
    • Related Report
      2022 Annual Research Report
  • [Presentation] Java システムにおけるパッケージ誤りのニューラルネットワークを用いた検出手法2021

    • Author(s)
      依田 和樹, 中丸 智貴, 穐山 空道, 山崎 徹郎, 千葉 滋
    • Organizer
      日本ソフトウェア科学会第38回大会
    • Related Report
      2021 Research-status Report
  • [Presentation] Attempts on using syntax trees to improve programming language translation quality by machine learning2021

    • Author(s)
      Feng Dai, Shigeru Chiba
    • Organizer
      38th JSSST Conference
    • Related Report
      2021 Research-status Report
  • [Presentation] コード内にコメントを入れる時に適切なコメントを例示するシステムの開発2021

    • Author(s)
      白石 誠, 千葉 滋
    • Organizer
      日本ソフトウェア科学会第38回大会
    • Related Report
      2021 Research-status Report
  • [Presentation] 教師ラベルなし単言語学習データのみでのcross-languageコードクローン検出の試み2020

    • Author(s)
      劉 宇澤, 千葉 滋
    • Organizer
      日本ソフトウェア科学会第37回大会
    • Related Report
      2020 Research-status Report
  • [Presentation] 機械学習手法を用いた動的型付け言語のコード補完に向けて2019

    • Author(s)
      松永 智將, 千葉 滋
    • Organizer
      日本ソフトウェア科学会第36回大会
    • Related Report
      2019 Research-status Report

URL: 

Published: 2019-07-04   Modified: 2024-01-30  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi