研究課題/領域番号 |
25330408
|
研究種目 |
基盤研究(C)
|
研究機関 | 神戸大学 |
研究代表者 |
村尾 元 神戸大学, その他の研究科, 教授 (70273761)
|
研究期間 (年度) |
2013-04-01 – 2016-03-31
|
キーワード | 機械学習 / 盗用発見 / 教育工学 / 人工知能 |
研究概要 |
本研究の目的は,授業のレポート課題に適した盗用発見システムを構築することである.授業で作成されたレポートは同一のテーマについて書かれているために,内容のみに基づいて盗用の判定を行うのは困難である.これを克服するため,本研究ではレポートの「表面的な特徴」に基づいて盗用判定を行う.すなわち,あらかじめ作成者が明らかなレポートの「表面的な特徴」から,そのレポート作成者に関する記述者モデルを作成しておき,疑わしいレポートが得られる度に,それが実際に作成者によって書かれたものか,それとも盗用であるかを,このモデルへの合致度合いに基づいて判定する. 本年度は基盤となる記述者モデルを構築し,簡単なテストを行った. 記述者モデルでは,例えば句読点をどのようなタイミングで入れるのか,その頻度や,句読点そのもの種類,といった記述上の特徴をモデル化する.この目的で本研究では隠れマルコフモデル(HMM)を利用した.また,これまでの授業などで学生が書いたレポートを対象として簡単な実験を行い,これに基づいて幾つかの候補の中から,記述上の特徴とHMMの構造を決定した. 上記モデルをコンピュータ上に実装し,これを用いたテキストの判定実験を行った.すなわち,まず,研究室の複数の学生に簡単なテキスト文書を作成してもらい,それに基づいて,各人の記述者モデルを作成した.続いて,それぞれのテキスト文書について,全ての記述者モデルとの合致度合いを調べ,作成者の記述者モデルとの合致度合いが高く,それ以外のモデルとは合致度合いが低いことを確認した.これに基づいて,テキスト文書の盗用判定をするならば,80%を越える高い判定率となる.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
当初の計画通り(1)記述者モデル(アルゴリズム)の構築と(2)簡単なテストを行った.
|
今後の研究の推進方策 |
当初計画通り,平成26年度は,Web上にレポート作成者判定システムのプロトタイプを作成し,実際に授業での試験運用を行う.これに基づいて,必要であれば,記述者モデル(アルゴリズム)の修正を行う.
|