研究実績の概要 |
小論文やレポートの自動評価の実現を目標に、教師なし学習の一つである敵対生成ネットワークのDiscriminatorに着目し、1文のみを対象として文書の特徴が抽出可能かどうかを調べた。具体的には、1文の分類をタスクに実験を行った。このような1文の分類が可能となれば、文書とは1文の連なりであるから、文全体の評価に結びつくと期待できる。 実験では、敵対生成ネットワーク・アルゴリズムとして、最もオーソドックスな文書生成をタスクとするSeqGANを用いた。そして、訓練データには夏目漱石の著書の文を用いて、敵対生成的に学習を行った。その訓練データによる学習後、敵対生成ネットワーク学習から取得したDiscriminatorに、訓練データとは別の夏目漱石の著書における文、および、太宰治・芥川龍之介の著書の文を与え、夏目漱石の文の識別率を計算した。また、比較検討のために、文書分類に用いられるその他の教師あり学習モデル(Long Short-Term Memory, TextCNN, CNN)を用いて同じタスクの学習を行い、結果の比較を行った。 それらの結果、敵対生成により得られたDiscriminatorの識別性能が他のアルゴリズムから得られた識別器と比較して精度が劣っていた。その要因の一つとしては、Generatorの生成する文が未熟であり、Discriminatorが十分に学習できなかったことがあげられる。また、今回選択したSeqGANがタスクに向かなかったことも考えられるので、その他の文章生成用のGANを用いた実験も継続して行っていく予定である。
|