研究課題/領域番号 |
20K03135
|
研究機関 | 大阪産業大学 |
研究代表者 |
大野 麻子 大阪産業大学, 工学部, 准教授 (90550369)
|
研究期間 (年度) |
2020-04-01 – 2024-03-31
|
キーワード | 記述スタイル特徴 / 盗用発見 / 機械学習 / 知的学習システム / 教育工学 / 作成者認証 / 書き方のクセ / 授業課題レポート |
研究実績の概要 |
本研究では授業課題レポート作成者の「記述特徴」(書き方の「クセ」)を記述スタイルモデルに学習させ、作成者認証を行うことで内容の類似したレポート文書における盗用を発見する手法を提案している。従来の内容に基づく類似性検出で危惧される、レポート内単語の偶然の一致による誤判定リスクの軽減が期待される一方で、本手法には作成者認証における前処理として過去に作成した複数のレポート文書を予めモデルに学習させておく必要があるというデメリットがある。 この問題を解決するため、作成者の記述特徴の一つとしてWord文書をXML解析することで得られる書式情報を定量化し、説明変数として用いる手法を新たに提案した。本年度は実際の授業で提出されたレポート文書を対象とした評価実験を行い、90%の精度でレポート作成者の識別を行えることを確認し、査読付き学術雑誌に論文が掲載された。また、作成者識別結果の可視化に関する検討の一つとして、k-means法によるクラスタリングを行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
2022年度はコロナ禍の影響が収まってきたものの対面による学会参加や打ち合わせは控え、オンラインによる学会発表や意見交換を行った。前年度から新たに着手したWord書式情報の定量表現について、決定木を用いて作成者特徴に基づく分類ルールを可視化すると共に、ランダムフォレストにより約90%の精度で作成者識別が行えることを確認した。これらの成果をまとめた論文を投稿し、査読付き学術雑誌に採録された。 また、国内学会および国際会議にて口頭発表を行った。このうち国際会議にて報告した内容を発展させ、レター論文として投稿した論文の採録が決定している。よって本研究の進捗状況は概ね順調であるといえる。
|
今後の研究の推進方策 |
k-means法によるクラスタリングの試みについて、2023年度7月に開催される国際会議にて報告を予定している。また、他の検討事項についても良い結果が出れば年度内に報告し、議論を行う。最後に、これまでの成果や議論の内容を整理し、総括する。
|
次年度使用額が生じた理由 |
当初2023年3月に国際会議INTED2023にて口頭発表を予定していたが、家庭の事情により参加が困難となったため、次年度の2023年7月に開催の国際会議EDULEARN23での発表に変更した。このため、次年度(2023年度)予算にて旅費や参加費の支出を行う必要が生じた。具体的にはEDULEARN23の開催地スペイン国への旅費、宿泊費、日当および参加費として使用することを計画している。
|