本研究は,訓練文書と作成時期が異なるテスト文書を分類するために有効な語彙的意味処理技術と教師付き学習手法を開発することを目的とする.今年度はこれまで実施してきた研究の成果を論文として5編公開した.具体的には,(1) 分野語義に関する論文として1編,(2) 語義解消に関して提案した2手法をそれぞれ1編,(3) 意味の等価性に関する論文を1編,そして(4) 少量の教師付き訓練データに対し,分野適応手法を用い,大量のラベルなし訓練データを利用する手法に関する論文である.(1) は,分野に依存して決まる語義を大規模データから教師なし手法により自動的に抽出する手法を提案した.(2) の一つ目は,グラフベースの深層学習により,文の依存構造を学習した結果を用いた語義解消手法,2編目は,文の局所的な情報と大域的な情報を同一の枠組みで学習した結果を用い語義を解消する手法を提案した.(3) は,文の同義性に着目し,談話構造解析から得られる文間関係を用いて2文が同義であるか否かを判定する手法を提案した.(4) は,語義解消で問題となる少量の訓練文書,及び訓練文書と作成時期が異なるテスト文書,すなわち異分野の問題に着目し,Few-Shot 学習,及び分野適応と呼ばれる手法を組み合わせることにより,少数訓練事例の問題,及び訓練文書とテスト文書が異なる分野であるという問題が解消できることを要約タスクを用いて示した.今後は,この手法を語義解消と分類問題に適用する予定である.
|