• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2022 Fiscal Year Research-status Report

Development of a Hybrid CG Parser

Research Project

Project/Area Number 21K00541
Research InstitutionNational Institute for Japanese Language and Linguistics

Principal Investigator

窪田 悠介  大学共同利用機関法人人間文化研究機構国立国語研究所, 研究系, 准教授 (60745149)

Co-Investigator(Kenkyū-buntansha) 峯島 宏次  慶應義塾大学, 文学部(三田), 准教授 (80725739)
吉川 将司  東北大学, タフ・サイバーフィジカルAI研究センター, 助教 (80883470) [Withdrawn]
Project Period (FY) 2021-04-01 – 2024-03-31
Keywords統語解析 / 意味解析 / 統語変換 / CCG / 機械学習 / 深層学習 / 比較構文
Outline of Annual Research Achievements

本研究は、「統語変換」の概念に基づく理論言語学での研究の知見を活かして、自然言語処理研究において開発されたパーザ (具体的にはCCGパーザ) の性能を向上させることを目指すことを目的とするものである。この目的のために、CCGパーザにとって足りない情報を補うための機械学習のコンポーネントが必要となる。今年度は、昨年度作成したこのコンポーネントのための正解ラベルセットのアノテーション・データを用いて、機械学習によって未知のデータに対して正しくラベル付与ができるかを検証した。

具体的には、BCCWJから抽出した例文に必要な情報を手でアノテーションしたアノテーション・データを正解セットと評価セットに分割し、固有名認識のモデルと同構成の機械学習モデル (東北大から提供されている日本語BERTモデルをfine-tuningしたもの) を用いて比較文の意味に関わる情報のラベル (比較句、対応する程度述語、比較対象の表現の三者) を予測する実験を行った。結果は言語処理学会の年次大会の論文で報告した。

比較的単純な手法で、モデルが未知の文に対して目的とするアノテーション情報を実際に機械学習である程度正確に当てることができることを確認できた。この成果に基づいて、最終年度である来年度は、未知のデータを統語解析し、意味情報ラベルを予測する機械学習モデルの出力と組み合わせて論理式を出力するパイプラインを実際に構築することを目指す。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

概ね計画書に書いたとおりの順序で順調に研究が進んでいる。

Strategy for Future Research Activity

本研究で構築するシステムでは、設計上、(1) CCGパーザ、(2) 高次の意味的対応関係の解析器、(3)ルールベースで書いた、(1)と(2)を組み合わせて正しい意味表示を得るためのパイプラインの三者のスムーズな連携が必須となる。(1) - (3)すべて、単体でもそれぞれ動作に癖があり、またそれぞれの接合部分にも複雑さがある。最終年度である3年目は、年度の早い段階から、システム全体の動作を最適化させる方略を具体的に考える作業に注力する。また、アノテーション・データは、BCCWJのライセンスを持っている研究者に対して復元可能な形で提供する予定である。このための作業も最終年度に行う。

Causes of Carryover

初年度に、データセット構築のためのアノテータ謝金の一部に関連研究の経費を利用することができたので、次年度使用額が発生した。今年度は当初予算を消化することで研究を進めたので、初年度から引き続いだ次年度使用額を、最終年度にデータセットや開発環境のオープン化に向けたデータや環境整理のために当てる予定である。

  • Research Products

    (3 results)

All 2023

All Journal Article (1 results) (of which Open Access: 1 results) Presentation (2 results) (of which Int'l Joint Research: 1 results,  Invited: 1 results)

  • [Journal Article] 比較文の意味解析のための「深い」係り受け関係の解析2023

    • Author(s)
      窪田悠介, 林則序, 天本貴之, 峯島宏次
    • Journal Title

      言語処理学会第29回年次大会予稿集

      Volume: 1 Pages: 2962-2967

    • Open Access
  • [Presentation] 比較文の意味解析のための「深い」係り受け関係の解析2023

    • Author(s)
      窪田悠介, 林則序, 天本貴之, 峯島宏次
    • Organizer
      言語処理学会第29回年次大会
  • [Presentation] Toward 'parasitic scope' parsing: A case study on comparatives in Japanese2023

    • Author(s)
      Yusuke Kubota
    • Organizer
      Japanese/Korean Linguistics 30
    • Int'l Joint Research / Invited

URL: 

Published: 2023-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi