2020年度はこれまでに引き続き、言内(denotation)および言外(connotation)に関する知識の獲得および利用の研究を行った。 denotationに関する知識については、昨年度までに行った分析から京大格フレームは粒度が細かすぎる等の問題があることが判明したため、BERT等に代表される文脈化単語ベクトルを用いた意味フレーム構築に取り組んだ。具体的には、まず、FrameNetおよびPropBankにおいて2種類以上のフレームを喚起する動詞に着目し、それらの動詞が喚起するフレームの違いを文脈化単語埋め込みがどのくらい捉えているかを調査することで、フレーム知識の自動獲得における文脈化単語埋め込みの有用性の確認した。さらに、文脈化単語埋め込みを利用した動詞の意味フレーム推定タスクに取り組み、マスクされた単語の埋め込みと2段階クラスタリングを用いることで高い精度を実現できることを示した。 connotationに関する知識については、昨年度までにconnotation体系を設計し、半教師有り学習によって大規模コーパスから格フレーム(イベント)に対する感情知識を獲得した。2020年度は、感情知識の利用に焦点を当て、感情知識を深層学習モデルにどのようにして組み込むかについて研究を行った。近年の自然言語処理で一般的に用いられているseq2seqの枠組みにおいて、生成タスクに感情分類タスクを融合することによって、感情知識を考慮した生成を行う手法を提案した。対話応答生成タスクを用いて評価を行ったところ、感情を考慮した生成ができており、また流暢さや発話に対する関連性も同時に向上することを確認した。本手法は、生成・分類を含め様々なタスクに応用することができ、感情知識を深層学習に組み込む手法として今後の発展が期待できる。
|