研究課題/領域番号 |
18H03286
|
研究機関 | 京都大学 |
研究代表者 |
河原 大輔 京都大学, 情報学研究科, 准教授 (10450694)
|
研究分担者 |
笹野 遼平 名古屋大学, 情報学研究科, 准教授 (70603918)
|
研究期間 (年度) |
2018-04-01 – 2021-03-31
|
キーワード | 言語理解 / 知識フレーム / 言内の意味 / 言外の意味 / 述語項構造 |
研究実績の概要 |
本研究課題は、超大規模テキスト集合から抽出、集約した大量の言語使用に言内・言外の意味を与えることによって、知識フレームを漸進的に獲得する。2018年度において、言内(denotation)に関する知識獲得、言外(connotation)に関する知識獲得をそれぞれ開始した。 denotationに関する知識については、京大格フレームと、英語版FrameNetの対応付けに取り組み、これまで独立したフレームとして扱われていた格フレーム間の意味的関係に関する知識を獲得した。具体的には、日本語と英語間の言語横断単語意味ベクトル用い、京大格フレームに含まれる用例情報と、FrameNetに含まれる注釈付き文から得られる用例情報の類似度を算出することで、京大格フレーム中の各フレームをFrameNetに対応付けた。さらに、日本語版FrameNetの注釈文を用いた評価実験を通し、およそ40%の精度でFrameNet中の望ましいフレームに対応付けられていることを示した。 connotationに関する知識については、格フレームに対して、感情や感覚などの情報を付与することを検討した。connotationの体系として、応募者がこれまでに設計したものを用いる。これは、Plutchikの感情の輪や各種シソーラスを参考に設計したものであり、4クラス47素性からなる。感情や感覚の知識獲得については、まず、大規模コーパスから「腰痛が治って嬉しかった」のような共起パターンを用いて、格フレームと感情・感覚のペアを抽出した。このペアを訓練データとしてニューラルネットワークモデルを学習し、このモデルを用いて生コーパスに対して感情・感覚のタグ付けを行うという半教師有りの枠組みを構築した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
研究計画に従い、2018年度に実施すべきことはおおむね実施することができたため、「おおむね順調に進展している。」と評価した。
|
今後の研究の推進方策 |
2019年度は、言内(denotation)に関する知識獲得、言外(connotation)に関する知識獲得を昨年度から継続して行う。2019年度後半には、獲得した知識を用いたテキスト解析・理解システムの開発に着手する。denotationに関する知識については、昨年度に引き続き、日本語100億文から自動獲得した大規模格フレームと、人手で整備された意味フレーム辞書である英語版FrameNetの対応付けに取り組む。具体的には、適切な言語横断的意味ベクトルの構築手法の検討、格ごとに異なる意味役割の取りやすさの傾向の考慮を行うことで、より高精度な対応付けの実現を目指す。さらに、昨年度は対応付け対象から外していた複合動詞や受身形に対する格フレームも対応付けの対象とし、よりカバレッジの高い対応付けを目指す。また、大規模格フレームと日本語版FrameNetの対応付けデータを用いた対応付けの評価を行う。connotationに関する知識については、昨年度に引き続き、格フレームに対して、感情や感覚などの情報を付与する。大規模コーパスから「腰痛が治って嬉しかった」のような共起パターンを用いて、格フレームと感情・感覚のペアを昨年度に抽出済みであり、これをシードとしてdenotation知識を利用することによって、よりカバレッジを高める手法を研究する。具体的には、同じdenotationを共有している格フレームについて、同じconnotation(感情・感覚)をもつ条件を探索し、クラウドソーシングによって検証する。次に、上記で獲得したdenotation・connotation知識に基づくテキスト解析・理解システムの開発を始める。このシステムは、格の正規化などでは認識することができない意味の同一性や含意関係を捉えることができ、さらに感情・感覚などの言外の意味を推定することができる。
|