研究課題/領域番号 |
22J14993
|
研究種目 |
特別研究員奨励費
|
配分区分 | 補助金 |
応募区分 | 国内 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 名古屋大学 |
研究代表者 |
山田 康輔 名古屋大学, 情報学研究科, 特別研究員(DC2)
|
研究期間 (年度) |
2022-04-22 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
900千円 (直接経費: 900千円)
2022年度: 900千円 (直接経費: 900千円)
|
キーワード | 意味フレーム推定 / 文脈化単語埋め込み / 深層距離学習 / FrameNet |
研究開始時の研究の概要 |
本研究では、文脈を考慮した単語ベクトル表現を利用し、大規模なテキストコーパスから、人の言葉に関する背景知識である意味フレーム知識を自動構築する。自動構築されたフレーム知識は、テキストの意味解析を行うことができ、自然言語推論や質問応答などのタスクの精度改善につながる。また、研究に取り組んでいる中で文脈化単語ベクトルが語の多義性や用法を捉えたベクトル表現になっているかなどを明らかにする。
|
研究実績の概要 |
本研究課題の目的は、文脈化単語ベクトルを利用して、大規模なテキストコーパスから述語間・フレーム間の関係を捉えた意味役割付きの高品質なフレーム知識を自動構築することである。本年度の目標は、昨年度開発した動詞の意味フレーム推定手法を、既存のラベル付きのリソースであるFrameNetによる実験を行うのではなく、大規模なテキストコーパスに適用できるか検証し、その上でフレーム知識リソースの一部を構築することであった。しかし、本年度の初めに、その手法を大規模テキストコーパスに適用したところ、期待する性能を示さなかった。そこで、本年度は、更なる性能向上に向けて、引き続き動詞の意味フレーム推定に取り組んだ。
以前開発した意味フレーム手法は、事前学習のみに基づく文脈化単語埋め込みモデルを活用していた。しかし、このようなモデルの汎用的な埋め込み空間は、意味的に類似したフレームの事例が近くに位置しているという人間の直観と必ずしも一致しているわけではないため、事前学習のみに基づく文脈化単語埋め込みを用いる手法の性能には限界があることが確認された。そこで、意味フレーム推定をコーパス内の一部の動詞についてのラベル付きデータの存在を仮定した教師ありタスクとして取り組み、深層距離学習に基づき文脈化単語埋め込みモデルをfine-tuningすることで高精度な意味フレーム推定を実現する手法を考案した。クラスタリングタスクによる実験を通し、深層距離学習を適用することで8ポイント以上スコアが向上することを示した。さらに、教師データが極めて少量である場合でも、提案手法が有効であることを示し、実際にフレーム知識を構築する際にも有用であることが期待される。
|
現在までの達成度 (段落) |
令和4年度が最終年度であるため、記入しない。
|
今後の研究の推進方策 |
令和4年度が最終年度であるため、記入しない。
|