Project/Area Number |
22K12291
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 62030:Learning support system-related
|
Research Institution | Wakayama University |
Principal Investigator |
村川 猛彦 和歌山大学, システム工学部, 准教授 (90304154)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥3,120,000 (Direct Cost: ¥2,400,000、Indirect Cost: ¥720,000)
Fiscal Year 2024: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2023: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2022: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
|
Keywords | プログラミング / 学習支援 / 大規模言語モデル / C言語 / ソフトウェア解析 / 学習支援システム / 大学教育 |
Outline of Research at the Start |
初学者向けプログラミング学習において、語(トークン)を適切に並べて文を構成する能力の養成が求められている。本研究では、ソースプログラムに共通して出現する「頻出パターン」に着目し、その抽出および学習支援システムへの適用を行う。C言語のfor文の場合、頻出パターンは「for(;;)」で表される。大規模なソースプログラム群からの頻出パターンの取得を試み、頻出パターンを入力に与えてソースプログラム群における出現を検出するソフトウェアも自作する。データベースを含む学習支援システムは、平成31年度より科研費の助成を受けて開発・公開したものを更新する形で構築し、大学の授業での利用を通じて有効性を実証する。
|
Outline of Annual Research Achievements |
大規模言語モデルを使用し,C言語の頻出パターンの手がかりになる情報や,ソースプログラムを生成することを試みた.公開されている大規模言語モデルからLlama2を選定して使用し,2022年度の授業で使用したC言語のソースプログラムによるファインチューニングを適用したものと,適用しなかったものとで,様々なプロンプトを与えてソースプログラムを生成させたところ,ファインチューニング適用有のものが不備(構文エラーなど)が少ないことを確認した.大規模言語モデルからのC言語の頻出パターン取得は,プロンプトを与えても望むものが得られず,目視に基づいて初学者が学ぶことになる10種類の頻出パターンを取得した.各頻出パターンをプロンプトに与えてソースプログラムを生成させると,switch文ではおおむね意味のあるソースプログラムが得られたが,do-while文については適切でなかった.1回の生成に,ファインチューニング適用無では30秒程度,適用有では2分程度を要し,対話型による生成・活用には課題があることも確認した. 学習支援に関して,生成AIの一つであるChatGPTを用いて初学者向けの日本語プログラム解説文の生成を実施した.与えるプログラムに行番号や実行結果を添え,コードブロック形式の出力を抑制することで,プログラムを単に与えて解説文を生成させるよりも明瞭な解説文を生成できることを確認した.エラトステネスの篩についてソースプログラムと解説文(人手と本手法の2種類)を学部生に読んでもらった結果,生成した解説文は学習支援に十分な内容であることを確認し,実用への足がかりを得ることができた.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究実施計画に述べた事項はおおむね達成できているため.
|
Strategy for Future Research Activity |
大規模言語モデルや生成AIを活用した「頻出パターンの取得」「学習支援システムの更新および利用」を進めていく.成果を取りまとめながら,国内・海外で成果発表を積極的に行う.
|