研究課題/領域番号 |
20K03135
|
研究機関 | 大阪産業大学 |
研究代表者 |
大野 麻子 大阪産業大学, 工学部, 准教授 (90550369)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
キーワード | 記述スタイル特徴 / 盗用発見 / 機械学習 / 知的学習システム / 教育工学 / 作成者認証 / 書き方のクセ / 授業課題レポート |
研究実績の概要 |
本研究では授業課題レポート作成者の「記述特徴」(書き方の「クセ」)を記述スタイルモデルに学習させ、作成者認証を行うことで盗用を発見する手法を提案した。授業課題レポートは同一テーマについて同じ学習進度の学生が一斉に作成することから、内容が類似しやすい(レポート文書内に共通の単語が出現しやすい)という特徴がある。また、一般的な報告書や論文と比較すると文字数が少ないため特徴抽出が難しい。提案手法を併用することで、従来の「内容の類似(文字列の一致)」に基づく盗用発見において危惧される偶然の一致による誤判定のリスクを低減することが期待できる。
しかし本手法には授業課題レポートを提出した学生が過去に作成した複数のレポート文書を記述スタイルモデルに学習させ、作成者認証を行うため、提出されたレポートのみでは作成者認証が行えないというデメリットがあった。
本年度はWord文書の.docxファイルを構成するXML (Extensible Markup Language) ファイル群を構文解析することにより得られたWord書式情報を用いて作成者固有の特徴を定量表現するという新たな試みを行い、複数のWord書式情報を用いてある作成者と他の複数作成者のレポートを区別することが可能であることを確認した。また、決定木を構築してWord書式情報に基づくレポート作成者の分類ルールを可視化した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
2021年度は2020年度に引き続きコロナ禍により学会参加や他大学の専門家との意見交換が思うようにできなかったものの、オンライン上のサービスを利用した学会発表の聴講やチャット、オンライン通話による意見交換を行うことで、関連研究に関する情報収集や本研究への客観的意見の収集を行うことができた。
また、昨年度より着手したディスカッション中の会話テキストの分析(話し方の「クセ」の抽出)や,提案手法の弱点をカバーするために本年度新たに行った試みであるWord書式情報の定量表現について、これまでに得られた成果をまとめ、オンライン開催の国際学会にて3件の研究報告を行った(うち1件はレター論文としてジャーナルに掲載)。また、査読付き学術雑誌に2編の論文が採録された。よって本研究の進捗状況は概ね順調であるといえる。
|
今後の研究の推進方策 |
コロナ禍により研究活動が一部制限される状況が続いているが、引き続き積極的な情報収集や意見交換、研究成果の発表を行う。当初の研究計画と新たに発見した新手法の改良の間で常に優先順位を検討し、必要に応じ柔軟に代替策を講じながら研究を推進する。
|
次年度使用額が生じた理由 |
【次年度使用額が生じた理由】コロナ禍により予定していた学会発表が全てオンライン開催であったため「旅費」および「その他」(学会参加費)の使用額に大幅な変更が生じた。また「人件費・謝金」については学生に実験用データの作成を依頼する予定であったが、コロナ禍により大学への入構が制限されオンラインのみでの実施は難しいと判断したため中止した。
【使用計画】2022年度以降対面にて開催する学会も増えてきたため、可能な場合は対面参加を予定している。また、オンライン開催の学会であっても意見交換が活発にできるようになってきているため、学会発表に加え聴講参加も増やし、より積極的な情報収集・意見交換を行う。学生アルバイトについてはコロナ禍においても安全に実施する方法を提示し学生にとって無理のない範囲で協力を依頼する予定である。
|