研究課題/領域番号 |
19K20351
|
研究機関 | 国立研究開発法人理化学研究所 |
研究代表者 |
大内 啓樹 国立研究開発法人理化学研究所, 革新知能統合研究センター, 特別研究員 (70825463)
|
研究期間 (年度) |
2019-04-01 – 2022-03-31
|
キーワード | トランズダクティブ学習 / 表現学習 / 事例ベース学習 / 構造予測 |
研究実績の概要 |
本研究では2つの研究目的を掲げている。 一つ目が「単語分散表現を目標テキストに特化させる手法の開発とその効果の検証」である。これは2019年度に順調に遂行することができた。 2020年度は、二つ目の研究目的である「同一ラベルを持つ事例が特徴ベクトル空間上で近くに位置するように学習する手法の開発とその効果の検証」に取り組んだ。各事例を特徴ベクトル空間に写像する深層ニューラルネットワークに距離学習を適用することによって、同一ラベルを持つ事例同士が特徴ベクトル空間上で近づくような学習を実現した。その結果として、学習事例との類似度に基づいてテスト事例を分類することが可能となった。これは従来の深層ニューラルネットワークが抱える解釈性の問題への一つの緩和策として機能する。例えば、「この学習事例と類似しているため、このテスト事例はこのように分類します」といったように、根拠を提示しながら予測を行えるようになった。固有表現抽出・統語チャンキングタスクにおいて手法の評価を行い、その有効性を確認した。本成果は、自然言語処理分野のトップ国際会議であるACL2020に採録され、世界的に高い評価を得た。また、さらに詳細な検証のため、事例間の類似度尺度および学習に用いる目的関数の組み合わせとして、どのようなものが良いかをテキスト分類タスクをもとに検証も行なった。結果として、特徴ベクトル間の内積に基づく類似度は、ある特定の学習事例のみがどのテスト事例とも類似度が高くなってしまうという問題を引き起こすということを明らかにした。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
当初掲げていた2つの研究目的を満たす手法を開発し、その効果を確認した。次年度は手法の改善と、多様なタスクへの適用を視野に入れ、更なる改善に取り組む。
|
今後の研究の推進方策 |
構文・意味・談話解析など、多様な言語解析タスクにおいて有効性を示すように、手法の更なる改善に取り組む。
|
次年度使用額が生じた理由 |
参加予定であった国際学会がコロナウィルス流行によってオンライン開催となり、それに係る交通費や参加費が抑えられたため。 翌年度は物品を中心に助成金を使用する。
|