2022 Fiscal Year Research-status Report
プログラム作成・修正過程の分散表現開発と学習支援発話の生成
Project/Area Number |
20K12101
|
Research Institution | Osaka Electro-Communication University |
Principal Investigator |
竹内 和広 大阪電気通信大学, 情報通信工学部, 教授 (20440951)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Keywords | 学習支援システム / ソフトウェア工学 / プログラム解析 |
Outline of Annual Research Achievements |
2022年度は、これまでの研究開発の成果に基づいて、学習支援発話の生成に関わる研究開発と、それに伴うプログラム作成・修正過程の表現モデルの修正・拡張を行った。前年度および2022年度は大規模言語モデルの公開が爆発的に進展した研究分野の変化期にもあたり、そのような大規模言語モデルを使って、本課題の基盤となるプログラム作成過程データベースとそれに基づく学習支援発話が体系的に整理された教示概念に基づいて生成できるように、プログラム作成・修正過程の表現をさらに改良した。 具体的には、プログラム作成・修正過程の解析に関しては、今まで本課題で開発してきた拡張AST(Abstract Syntax Tree)をさらに詳細化し、プログラム編集時に存在するASTに解析できない状態の編集意図を推定するために必要なプログラム解析の枠組みを開発した。これは、現在の大規模言語モデルによる言語生成のための特徴文脈になり難い部分でもあるため、学習者に対する学習支援に細かく対応できるように拡張ASTに意味的な情報を付与する研究を実施した。 他方、支援発話の生成に関しては、教示概念が自然言語で記述されているプログラムの教科書を題材に、教示概念を人手でフレーム知識に整理した。社会状況から研究初年度より試作システムの開発・運用の計画の変更を余儀なくされ、試作システムの構築について、開発中のシステムの内部表現を自然言語の質問・応答形式に対応付けたデータとして作成・確認ができるように研究開発を進めてきた。このことが幸いし、一般的な大規模言語モデルを、専門的で個別的な文脈に対応させる研究として、本研究の学習支援発話の生成部分を位置づけ可能となった。具体的には、プログラムの教示概念を整理したフレーム知識に基づいて、大規模言語モデルを活用して個別のユーザ状態に適応した発話生成・対話管理をする研究を実施した。
|
Current Status of Research Progress |
Current Status of Research Progress
4: Progress in research has been delayed.
Reason
本来は2022年度が当初計画の研究最終年度であったが、研究開始当初から、新型コロナウィルス感染症蔓延を防止する観点から、研究計画時に想定していた授業での試作システムの運用および学術交流が極めて制限される形になってしまったことにより、研究実施の方法を当初計画から変更することを余儀なくされた。また、そのような状況がどれだけ継続するかも分からない状況であったため、研究開始当初から当初計画のシステム実践運用の斬新的な研究・開発の計画を見直し、2021年度には研究・開発の実施を試作システムの実践運用ではなく、システム中の知識・状態を可視化して評価できるようにシステム試作・開発の方針を変更して研究実施を行ってきた。 以上のように社会状況に適応して研究計画実施の方向転換をするためには、一定の逡巡期間が必要であったため、研究当初の2020年度の時点で既に研究進捗状況は遅れた状況にあったが、2021年度そして2022年度の状況も、当初計画の目的を達成した状態とは言い難い状況のまま推移した。しかし、この研究計画の見直しは、研究実績の概要にも記したように、近年の大規規模言語モデルの発展に幸いにも整合する形となり、当初計画の目的に即して、大規模言語モデルを利用して、教示概念に対応し、より学習支援の度合いの高い支援発話生成の研究実施を進めることにつながった。また、プログラム作成・修正過程の解析についても、従来のプログラム概念との対応付けより、より精密な分析が可能な枠組みに発展させられる可能性が出てきている。 以上のように、当初計画の研究目的については、より研究分野における現況に即した形で進められていると考えているが、現在までの進捗状況は当初計画に鑑みて「遅れている」と判断せざるを得ない。
|
Strategy for Future Research Activity |
当初計画で研究知見の共有と関連研究者との情報共有のために想定していた、国際会議および国内会議が、研究当初の2020年度から2022年度まで中止やオンライン開催となることが相次いだ。そのような中で、オンラインでの国際・国内会議の発表はある程度積み重ねてきたが、実際に試作システムを研究者に見てもらい、意見収集する機会は十分に得られなかったと認識している。 また、社会情勢の変化に対応して試作システム構築ができるように、試作システム開発の方針を変更したことにより、当初計画よりも明示的にシステムの内部状態や使用する知識の可視化ができるようになった。このことにより、自然言語及びプログラミング言語の大規模言語モデルを活用した研究実施が可能となり、当初計画の目的達成の進捗としては期間延長を申請した通り、遅れていると言わざるを得ないが、研究としてはより基盤的な発展の柔軟性が高いものになったと考えている。 具体的な今後の研究の推進方策としては、プログラム作成・修正過程の解析に関しては、今まで研究開発してきたプログラムの分散表現をプログラミング言語の大規模言語モデルと対応可能にすることにより、より精緻な学習者プログラムの分析ができるように研究を推進したい。支援発話の生成に関しては、試作システムの内部状態や使用する知識の可視化に伴い、プログラムの問題に対応する教示概念をフレーム知識に整理することを蓄積してきた。この枠組みを利用して、自然言語の大規模言語モデルを使用し、よりプログラム問題の教示概念知識を精緻化・拡張化する方向と、学習支援発話の生成を向上させる方向の二方向で研究を推進していきたい。また、このような研究成果を、当初計画で想定していたように、研究知見の共有と情報交換を積極的に行い、研究目的の達成と研究成果の社会還元が進むように適切に研究を進めていきたい。
|
Causes of Carryover |
研究初年度の2020年度から2022年度に至るまでに新型コロナウィルス感染症の蔓延防止の観点から、当初計画で想定していた国内外の学会における情報収集・交換の機会が中止となったり、オンライン化されたりすることが相次ぎ、計画した旅費使用を十分に実施ことができなかった。 また、社会状況の変化に柔軟に対応できるように、当初計画の試作システム開発・運用の方針・計画を変更したため、状況変化に対応して頑健に研究実施が進められるようになった。このことは、当初想定していなかった大規模言語モデルの活用も可能となった反面、当初計画した人件費・謝金について使用時期が遅れることとなった。 以上のような理由から当初計画にあった研究期間の延長を申請し、2023年度は、研究目的に即して、試作システムの改善・改良を実施し、国内外の学会において、研究開発で得られた知見を公表・情報交換することで、適切に予算執行を実施していく計画である。
|