研究課題
本研究では,先に提案したコーディングスタイル特徴を用いたソースコード盗用発見手法を自然言語文書に適用し,記述スタイル特徴に基づく授業課題レポート盗用発見手法を提案している.本手法では同一の作成者により作成された複数のレポート文書から抽出した表記上の特徴を記述スタイルモデルに学習させ,「これまでの書き方との違い」という観点に基づき授業課題レポート文書における盗用発見を行う.本年度はモデルを用いて表現した記述スタイル特徴を学習データとして用いた学生のレポート文書に見られる傾向と照合しながら,適切なbasing point tokenを選出し判別精度および説明力の向上を図るなど,本手法のアルゴリズムやモデルの構造を中心とした改良を行った.実験結果より,記述スタイルモデルによる作成者認証が概ね正しく行われていること,学習済みモデルのパラメータから読みとれる作成者特徴が目視による確認結果と一致することが分かった.また,決定木やSkip-Gramモデルの適用に向けて予備調査を行った.手法への実装にまでは至らなかったものの,本手法により提示する記述特徴を利用者に分かりやすく提示するための新たなアイディアの着想につながった.この他,本研究で得られた知見を学習者行動分析やプログラミング授業支援システムに適用する試みを行い,得られたフィードバックをもとに本手法の課題を整理した.これまでに得られた成果をまとめ,査読付き国際会議および学術雑誌論文として発表した.
すべて 2020 2019
すべて 雑誌論文 (2件) (うち査読あり 2件、 オープンアクセス 2件) 学会発表 (2件) (うち国際学会 2件) 図書 (1件)
電気学会論文誌C
巻: 第140巻, 第2号 ページ: pp.235-241
https://doi.org/10.1541/ieejeiss.140.235
巻: 第139巻, 第11号 ページ: pp.1241-1247
https://doi.org/10.1541/ieejeiss.139.1241