研究課題/領域番号 |
19K22840
|
研究種目 |
挑戦的研究(萌芽)
|
配分区分 | 基金 |
審査区分 |
中区分60:情報科学、情報工学およびその関連分野
|
研究機関 | 東京大学 |
研究代表者 |
千葉 滋 東京大学, 大学院情報理工学系研究科, 教授 (80282713)
|
研究期間 (年度) |
2019-06-28 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
6,500千円 (直接経費: 5,000千円、間接経費: 1,500千円)
2020年度: 2,600千円 (直接経費: 2,000千円、間接経費: 600千円)
2019年度: 3,900千円 (直接経費: 3,000千円、間接経費: 900千円)
|
キーワード | プログラミング言語 / ソフトウェア工学 / 機械学習 / モジュール化 / ソフトウエア工学 / 開発環境 |
研究開始時の研究の概要 |
プログラミング言語の文法を GitHub 等のレポジトリから得たコーパスを機械学習することによって得ることができるだろうか、という問いに答えるのが本研究の目的である。プログラミング言語は人工言語であるので、普通、文法は既知であり、わざわざコーパスから探索的に抽出する必要はない。本研究では、いわゆる通常の形式文法に制限されない様々な新しい「文法」を考え、その獲得方法と応用を研究する。例えばプログラミング言語のコーディング規約や、ライブラリ関数の呼び出し順のようなものを文法とみなして取り扱う手法を研究する。
|
研究成果の概要 |
近年、大きく進歩した機械学習に基づく言語モデルによるプログラミング支援の研究をおこなった。言語モデルを用いて、プログラミング言語がもつ広い意味での「文法構造」を抽出し、それを実用的なプログラミング支援に応用する研究をおこなった。具体的には、ライブラリを利用したプログラミングに現れる、メソッドの呼び出し順というある種の文法や、異なるプログラミング言語に共通する文法構造、プログラムのモジュール分割に見られるある種の文法構造、を抽出し応用に活かす手法の研究をおこなった。
|
研究成果の学術的意義や社会的意義 |
現在、言語モデルは大規模化することで、本研究が用いていたような小規模なモデルでは達成できなかったような精度を実現できている。本研究は、モデル自体の研究ではなく、モデルの機能を実用的なプログラミング支援に活かす方法を探る研究であった。本研究の成果は、大規模化した言語モデルと組み合わせることで、さらなる性能向上が期待でき、現実世界のプログラミングの支援技術の向上に貢献できると考えられる。これは社会基盤として安心安全なITシステムの実現の一助になる技術である。
|