研究課題/領域番号 |
20K03135
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分09070:教育工学関連
|
研究機関 | 大阪産業大学 |
研究代表者 |
大野 麻子 大阪産業大学, 工学部, 准教授 (90550369)
|
研究期間 (年度) |
2020-04-01 – 2024-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
2,860千円 (直接経費: 2,200千円、間接経費: 660千円)
2022年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2021年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2020年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
|
キーワード | 記述スタイル特徴 / 盗用発見 / 機械学習 / 知的学習システム / 教育工学 / 作成者認証 / 書き方のクセ / 授業課題レポート |
研究開始時の研究の概要 |
本研究ではレポート作成者の「書き方のクセ」を記述スタイル特徴として記述スタイルモデルにより定量的に表現し、「作成者のこれまでの書き方と今回の書き方との違い」に基づく作成者認証を行うことで盗用を発見する手法を提案し、改良を行ってきた。 本研究期間中には、既存のモデルに加え、作成者のこれまでの記述スタイル特徴との具体的な相違点や盗用か否かの客観的な判断基準を提示する二つのモデルを提案し、教員に分かりやすく示すことで、「納得のいく」盗用発見を実現することを目指す。盗用発見精度の向上や精神的負担の軽減に関する検証についても引き続き行う。
|
研究実績の概要 |
本研究では授業課題レポート作成者の「記述特徴」(書き方の「クセ」)を記述スタイルモデルに学習させ、作成者認証を行うことで内容の類似したレポート文書における盗用を発見する手法を提案している。従来の内容に基づく類似性検出で危惧される、レポート内単語の偶然の一致による誤判定リスクの軽減が期待される一方で、本手法には作成者認証における前処理として過去に作成した複数のレポート文書を予めモデルに学習させておく必要があるというデメリットがある。 この問題を解決するため、作成者の記述特徴の一つとしてWord文書をXML解析することで得られる書式情報を定量化し、説明変数として用いる手法を新たに提案した。本年度は実際の授業で提出されたレポート文書を対象とした評価実験を行い、90%の精度でレポート作成者の識別を行えることを確認し、査読付き学術雑誌に論文が掲載された。また、作成者識別結果の可視化に関する検討の一つとして、k-means法によるクラスタリングを行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
2022年度はコロナ禍の影響が収まってきたものの対面による学会参加や打ち合わせは控え、オンラインによる学会発表や意見交換を行った。前年度から新たに着手したWord書式情報の定量表現について、決定木を用いて作成者特徴に基づく分類ルールを可視化すると共に、ランダムフォレストにより約90%の精度で作成者識別が行えることを確認した。これらの成果をまとめた論文を投稿し、査読付き学術雑誌に採録された。 また、国内学会および国際会議にて口頭発表を行った。このうち国際会議にて報告した内容を発展させ、レター論文として投稿した論文の採録が決定している。よって本研究の進捗状況は概ね順調であるといえる。
|
今後の研究の推進方策 |
k-means法によるクラスタリングの試みについて、2023年度7月に開催される国際会議にて報告を予定している。また、他の検討事項についても良い結果が出れば年度内に報告し、議論を行う。最後に、これまでの成果や議論の内容を整理し、総括する。
|