2020 Fiscal Year Research-status Report
言語解析における目標テキストへの特化技術に関する研究
Project/Area Number |
19K20351
|
Research Institution | Institute of Physical and Chemical Research |
Principal Investigator |
大内 啓樹 国立研究開発法人理化学研究所, 革新知能統合研究センター, 特別研究員 (70825463)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | トランズダクティブ学習 / 表現学習 / 事例ベース学習 / 構造予測 |
Outline of Annual Research Achievements |
本研究では2つの研究目的を掲げている。 一つ目が「単語分散表現を目標テキストに特化させる手法の開発とその効果の検証」である。これは2019年度に順調に遂行することができた。 2020年度は、二つ目の研究目的である「同一ラベルを持つ事例が特徴ベクトル空間上で近くに位置するように学習する手法の開発とその効果の検証」に取り組んだ。各事例を特徴ベクトル空間に写像する深層ニューラルネットワークに距離学習を適用することによって、同一ラベルを持つ事例同士が特徴ベクトル空間上で近づくような学習を実現した。その結果として、学習事例との類似度に基づいてテスト事例を分類することが可能となった。これは従来の深層ニューラルネットワークが抱える解釈性の問題への一つの緩和策として機能する。例えば、「この学習事例と類似しているため、このテスト事例はこのように分類します」といったように、根拠を提示しながら予測を行えるようになった。固有表現抽出・統語チャンキングタスクにおいて手法の評価を行い、その有効性を確認した。本成果は、自然言語処理分野のトップ国際会議であるACL2020に採録され、世界的に高い評価を得た。また、さらに詳細な検証のため、事例間の類似度尺度および学習に用いる目的関数の組み合わせとして、どのようなものが良いかをテキスト分類タスクをもとに検証も行なった。結果として、特徴ベクトル間の内積に基づく類似度は、ある特定の学習事例のみがどのテスト事例とも類似度が高くなってしまうという問題を引き起こすということを明らかにした。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
当初掲げていた2つの研究目的を満たす手法を開発し、その効果を確認した。次年度は手法の改善と、多様なタスクへの適用を視野に入れ、更なる改善に取り組む。
|
Strategy for Future Research Activity |
構文・意味・談話解析など、多様な言語解析タスクにおいて有効性を示すように、手法の更なる改善に取り組む。
|
Causes of Carryover |
参加予定であった国際学会がコロナウィルス流行によってオンライン開催となり、それに係る交通費や参加費が抑えられたため。 翌年度は物品を中心に助成金を使用する。
|
Research Products
(2 results)