• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2018 Fiscal Year Annual Research Report

Development of Japanese CCG parser "lightblue"

Research Project

Project/Area Number 18H03284
Research InstitutionOchanomizu University

Principal Investigator

戸次 大介  お茶の水女子大学, 基幹研究院, 准教授 (90431783)

Project Period (FY) 2018-04-01 – 2022-03-31
Keywords計算言語学 / 統語解析 / 形式意味論 / 深層学習 / 含意関係認識
Outline of Annual Research Achievements

本研究では、日本語CCG形態素解析器+統語解析器+推論システムであるlightblueの改良を加速的に推進し、日本語意味論データセットJSeMを対象とした含意関係認識タスクの最高精度である75%を上回ることを目指す。lightblueの設計は最先端の理論言語学の成果に基づいて設計されており、統語理論として組合せ範疇文法(CCG)を採用した頑健で高速な解析器であると同時に、意味理論として依存型意味論(DTS)を採用し、自然演繹に基づく証明探索アルゴリズムによって統語解析結果間の推論が計算可能である。また、形式文法理論と深層ニューラルネット(DNN)が融合した設計により、現在DNN単独では難しい「深い意味解析」へ到達することを目指す。また、lightblueは最新言語学理論のシミュレータとも見なせるため、本研究は理論言語学の検証可能性を引き上げる学際的研究プログラムとしての意義も併せ持つ。

平成30年、深層学習の新たな技術として、7月にAllen InstituteによってElmoが、また10月にGoogle AIによってBERTが発表されたことにより、ニューラル自然言語処理は新たな段階に突入した。本研究は、形式文法理論とニューラルネットの融合を目指しているが、一部にはBERTの登場に至って、形式文法理論の役割はニューラルネットによって完全に取って替わられた、という見解も散見される。したがって、それらの研究の限界点を見極める研究が本研究を推進する上で不可欠となった。これまでの研究で、BERTを利用したニューラルネットで捉えうる統語的・意味的情報には一定の限界があることが明らかとなっており、本研究が目指す形式文法とニューラルネットの融合の重要性はますます高まるものと考えられる。

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

当初の計画では、Elmo、BERT等の言語モデルとの比較研究を平成30年11月まで行う予定であったが、この研究トピックは思わぬ広がりをみせ、第一には、平成31年度/令和1年度には、ニューラルネットが人間の推論の体系性を獲得しうるか、という一般的な問いに答えんとする研究に発展した。その成果は、*SEM2019ワークショップ[査読付き国際学会、2nd BlackBoxNLP(ACL2019併設)ワークショップ[査読付き国際学会]、第33回人工知能学会全国大会、言語処理学会第26回年次大会、において発表することができた(ともにオランダ・フローニンゲン大学との共同研究)。
また、第二には、本研究が与する理論言語学と機械学習のハイブリッドによる「深い意味解析」と、BERTのような深層学習のみによるアプローチの比較を行った。両アプローチの差が顕著となる言語現象として比較構文の研究を進めた。この研究では、CCG統語解析器そのものを改良する代わりに、既存のCCG統語解析器のナイーブな出力をTsurgeon(Stanford NLPツールに含まれる木構造変換プログラム)によって統語論的に妥当な構造に変換し、高度な意味解析に接続するという手法を採用した。この研究成果を、ACL student workshop (ACL-SRW2020)[査読付き国際学会](トップカンファレンス)、PACLIC33[査読付き国際学会]、人工知能学会第34回年次大会、において発表することができたのは大きな成果であると考えられる。
以上の研究に注目して頂く機会も増えており、2019年度には国際学会で2回、国内学会で1回の招待講演に加えて、企業向けのセミナーで2回の一般向け講演を行い、研究成果の社会還元に務めた。

Strategy for Future Research Activity

ニューラル言語モデルそのものの評価研究については一定の知見を得たものと考え、R2年度以降は形式文法理論に基づく統語解析の研究を進める予定である。比較構文の研究は、当初目標としていたlightblue構文解析器の開発と融合させていく予定である。

  • Research Products

    (17 results)

All 2020 2019

All Journal Article (7 results) (of which Int'l Joint Research: 3 results,  Peer Reviewed: 7 results,  Open Access: 1 results) Presentation (10 results) (of which Int'l Joint Research: 2 results,  Invited: 4 results)

  • [Journal Article] Logical Inferences with Comparatives and Generalized Quantifiers2020

    • Author(s)
      Haruta, Izumi; Mineshima, Koji; Bekki, Daisuke;
    • Journal Title

      Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics Student Research Workshp (ACL2020-SRW)

      Volume: - Pages: -

    • Peer Reviewed
  • [Journal Article] Variable Handling and Compositionality: Comparing DRT and DTS2019

    • Author(s)
      Yana Yukiko、Mineshima Koji、Bekki Daisuke
    • Journal Title

      Journal of Logic, Language and Information

      Volume: 28 Pages: 261~285

    • DOI

      10.1007/s10849-019-09294-3

    • Peer Reviewed / Open Access
  • [Journal Article] A CCG-based Compositional Semantics and Inference System for Comparatives2019

    • Author(s)
      Haruta, Izumi; Mineshima, Koji; Bekki, Daisuke;
    • Journal Title

      Proceedings of the 33rd Pacific Asia Conference on Language, Information and Computation (PACLIC33)

      Volume: - Pages: 67-76

    • Peer Reviewed
  • [Journal Article] Can Neural Networks Understand Monotonicity Reasoning?2019

    • Author(s)
      Yanaka Hitomi、Mineshima Koji、Bekki Daisuke、Inui Kentaro、Sekine Satoshi、Abzianidze Lasha、Bos Johan
    • Journal Title

      Proceedings of the Second BlackboxNLP workshop on Analyzing and Interpreting Neural Networks for NLP

      Volume: - Pages: 31-40

    • DOI

      10.18653/v1/W19-4804

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] HELP: A Dataset for Identifying Shortcomings of Neural Models in Monotonicity Reasoning2019

    • Author(s)
      Yanaka Hitomi、Mineshima Koji、Bekki Daisuke、Inui Kentaro、Sekine Satoshi、Abzianidze Lasha、Bos Johan
    • Journal Title

      Proceedings of the Eighth Joint Conference on Lexical and Computational Semantics (*SEM 2019)

      Volume: - Pages: 250-255

    • DOI

      10.18653/v1/S19-1027

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] Underspecification and interpretive parallelism in Dependent Type Semantics2019

    • Author(s)
      Kubota Yusuke、Mineshima Koji、Levine Robert、Bekki Daisuke
    • Journal Title

      Proceedings of the IWCS 2019 Workshop on Computing Semantics with Types, Frames and Related Structures (CSTFRS)

      Volume: - Pages: 1-9

    • DOI

      10.18653/v1/W19-1001

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] Questions in Dependent Type Semantics2019

    • Author(s)
      Watanabe Kazuki、Mineshima Koji、Bekki Daisuke
    • Journal Title

      Proceedings of the Sixth Workshop on Natural Language and Computer Science (NLCS'19)

      Volume: - Pages: 23-33

    • DOI

      10.18653/v1/W19-1103

    • Peer Reviewed
  • [Presentation] ニューラルネットは自然言語推論の体系性を学習するか2020

    • Author(s)
      谷中瞳, 峯島宏次, 戸次大介, 乾健太郎
    • Organizer
      言語処理学会第26回年次大会
  • [Presentation] 汎用言語モデルBERTを用いた多言語テキストにおける意味現象タグ予測2020

    • Author(s)
      伊藤美賀, 佐藤七海, 田上青空, 谷中瞳, 峯島宏次, 戸次大介
    • Organizer
      言語処理学会第26回年次大会
  • [Presentation] CCGとCoqを用いた日本語マルチモーダル推論システムの構築2020

    • Author(s)
      秋山雛乃, 石嶋美咲, 石田真捺, 高野紗輝, 鈴木莉子, 谷中瞳, 峯島宏次, 戸次大介
    • Organizer
      言語処理学会第26回年次大会
  • [Presentation] マルチモーダル推論評価のための日本語データセットの試案2020

    • Author(s)
      飯野早貴, 石田真捺, 小谷野華那, 松本留奈, 鈴木莉子, 谷中瞳, 峯島宏次, 戸次大介
    • Organizer
      言語処理学会第26回年次大会
  • [Presentation] クラウドソーシングによる単調推論データセットの構築2019

    • Author(s)
      谷中瞳, 戸次大介, 峯島宏次, 関根聡, 乾健太郎
    • Organizer
      第33回人工知能学会全国大会
  • [Presentation] テキスト情報と画像情報を組み合わせた論理推論システムの構築2019

    • Author(s)
      鈴木莉子, 吉川将司, 谷中瞳, 峯島宏次, 戸次大介
    • Organizer
      第33回人工知能学会全国大会
  • [Presentation] Dependent Types and Theory of Meaning2019

    • Author(s)
      Bekki, Daisuke
    • Organizer
      Nanzan Workshop on the Foundational Issues in Linguistics and Philosophy of Language
    • Int'l Joint Research / Invited
  • [Presentation] 理論言語学に基づく自然言語理解の最前線2019

    • Author(s)
      戸次大介
    • Organizer
      日本英語学会第37回大会
    • Invited
  • [Presentation] Hybrid natural language understanding: neural network, logic and beyond2019

    • Author(s)
      Bekki, Daisuke; Yanaka, Hitomi
    • Organizer
      Konferenz zur Verarbeitung naturlicher Sprache (KONVENS2019)
    • Int'l Joint Research / Invited
  • [Presentation] 自然言語理解技術の動向2019

    • Author(s)
      戸次大介
    • Organizer
      NEDO TSC Foresightセミナー(第1回)
    • Invited

URL: 

Published: 2021-01-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi