研究課題/領域番号 |
20K03135
|
研究機関 | 大阪産業大学 |
研究代表者 |
大野 麻子 大阪産業大学, 工学部, 准教授 (90550369)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
キーワード | 記述スタイル特徴 / 盗用発見 / 機械学習 / 知的学習システム / 教育工学 / 作成者認証 / 書き方のクセ / 授業課題レポート |
研究実績の概要 |
本研究では授業課題レポート作成者の「記述特徴」(書き方の「クセ」)を記述スタイルモデルに学習させ、作成者認証を行うことで盗用を発見する手法を提案した。しかし一方で、①盗用か否かの基準が相対評価である、②学習済のモデルから作成者の記述特徴を読み解き、明文化するには専門的な知識や膨大な時間が必要である、という問題が浮上した。そこで本研究では、新たに二つのモデルを提案し、既存モデルと併用することで、「納得のいく」盗用発見の実現を目指す。 2020年度には次の内容を行った。まず、同じ授業を受講する学生同士の盗用は既存のツール(学習支援システム「WebClass」の類似レポート検知機能)を用いた単純な文字列マッチングにより検出可能であるが、本研究が解決を目指す第三者による代筆やインターネット以外の外部資料からの盗用は既存のツールでは発見できないことを確認した。また、ソースコード盗用発見手法で提案した前後方記述スタイルモデルをレポート文書に適用する検討を行うと共に、マルコフモデルを用いて記述スタイルを表現する試みについても検討を行った。盗用発見システムのGUIについてはPythonを用いて試作を行った。 本年度は新型コロナウィルス感染症の感染拡大に伴う学生の入構制限もあり、実験データであるレポート文書の作成依頼を断念した。代替として手持ちのグループディスカッションの文字起こしデータを対象として改訂版タキソノミーの定義に基づき話者の「学びの深さ」を示す特定のキーワードを抽出し、Word2Vecを用いて獲得した類義語を追加して、話者の学びの深さを分析する手法を提案した。話者の個々の発言をそれぞれ文書とみなせば、複数の文書間で共通した話者固有の特徴的な表現(ここでは話し方の「クセ」)を抽出し作成者認証に用いることができるのではないかと期待している。当初の予定と並行して引き続き検討を行いたい。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
2020年度はコロナ禍という思わぬ事態により、学生に実験用データの作成を依頼することや、教員への聞き取り調査を行うといった人との接触を伴う内容を行うことができず、学会参加による意見交換・情報収集も十分に行えなかった。しかし一方でオンライン開催の国際学会2件にて研究報告・意見交換を行い、当初計画とは異なるアプローチにより本研究で提案する盗用発見手法に活用可能な新たな作成者固有の特徴の獲得について重要な示唆が得られた。よって本研究の進捗状況は概ね順調であるといえる。
|
今後の研究の推進方策 |
コロナ禍により研究活動が一部制限される状況が続いているが、2020年度中にある程度オンラインベースの研究環境が構築でき、ノウハウも蓄積できたことから、基本的には当初の研究計画に従い、必要に応じ柔軟に代替策を講じながら研究を推進する。
|
次年度使用額が生じた理由 |
【次年度使用額が生じた理由】コロナ禍により予定していた学会発表がオンライン化し,聴講参加予定もキャンセルしたため「旅費」および「その他」(学会参加費)の使用額に大幅な変更が生じた.また,「人件費・謝金」については学生に実験用データの作成を依頼する予定であったが,コロナ禍により大学への入構が制限されオンラインのみでの実施は難しいと判断したため中止した.
【使用計画】昨年度の経験から,オンライン開催の学会であっても十分な情報収集・意見交換が行えることを確認したため,今年度は学会発表に加え聴講参加も予定通りに行う.また,学生に依頼する実験用データ作成についても,対面時と同様に個別に説明を行いながらデータを作成してもらう環境がオンライン上でも整ったため昨年度未実施分を本年度中に実施する.
|