• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2022 年度 実施状況報告書

形式意味論と言語処理の融合による構成的言語モデルの開発

研究課題

研究課題/領域番号 20K19868
研究機関東京大学

研究代表者

谷中 瞳  東京大学, 大学院情報理工学系研究科, 講師 (10854581)

研究期間 (年度) 2020-04-01 – 2024-03-31
キーワード自然言語処理 / 自然言語推論 / 事前訓練済み言語モデル / 構成性原理 / 人工知能 / 汎化性能
研究実績の概要

文の意味を計算処理可能な形式で表し、文と文との意味的関係を判定する含意関係認識技術の実現は、計算機による人間らしい言語理解の実現に向けて解決すべき最重要課題である。近年、深層ニューラルネット(DNN)を用いた含意関係認識の研究が盛んに行われているが、文の構成的な意味におけるDNNの表現力は明らかではなく、未知のデータに対する頑健性が不透明である。本研究では、DNNの文の構成的な意味における表現力を明らかにするとともに、表現力の改善を目指す。
本年度は、【研究課題1】文の構成性原理に基づく言語モデルの評価システムの開発と【研究課題2】データ拡張と学習アルゴリズムの改良による構成的言語モデルの開発について、主に次の2つの成果を得た。
研究成果1. DNNが日本語の構成的な意味を理解しているか評価する含意関係・類似度ベンチマークJSICKの開発
前年度までは英語を中心にDNNの推論の体系性を分析する手法を開発してきたが、英語以外の言語を含めてDNNの言語理解能力を分析する手法が求められている。そこで、英語の語彙的、統語的、意味的な言語現象の構成的な組み合わせの理解を必要とする含意関係・類似度ベンチマークSICKを人手で日本語に翻訳し、さらに日本語の特性を考慮して語順や助詞を入れ替えた問題を追加した日本語の含意関係・類似度ベンチマークJSICKを構築し、一般公開した。JSICKを用いた分析によって、現在の汎用言語モデルは日本語の助詞の扱いに課題があるが、データ拡張によって改善する可能性が示唆された。
研究成果2. 日本語の時間的順序を考慮した論理推論システムの構築
形式意味論の知見に基づいて日本語文の意味を構成的に表し、時間的順序に特化した推論システムを構築した。構築したシステムは現在のDNNを用いた推論システムよりも高い精度で時間的順序に関する含意関係認識が行えることを示した。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

本年度は、【研究課題1】文の構成性原理に基づく言語モデルの評価システムの開発と【研究課題2】データ拡張と学習アルゴリズムの改良による構成的言語モデルの開発について上述の研究成果1, 2が得られた。
研究成果1は自然言語処理のトップジャーナル論文誌であるTransactions of the Association for Computational Linguistics (TACL)に採択された。
研究成果2は自然言語処理のトップ査読つき国際会議ACL2022 Student Sessionに採択された。
また、これまでの成果に関連して1本の国際ワークショップ、4件の国内会議、5件の招待講演を行っており、これらの研究成果は大きな成果であると考えられる。

今後の研究の推進方策

【研究課題1】文の構成性原理に基づく言語モデルの評価システムの開発については、日本語を対象として言語モデルの構成性に関する言語理解能力に関してさらなる分析を進める。日本語特有の言語現象として敬語を対象として、現在の汎用言語モデルが様々な統語構造からなる敬語文をどの程度構成的に表現できているのか分析を行う。
【研究課題2】データ拡張と学習アルゴリズムの改良による構成的言語モデルの開発については、これまでの研究成果でデータ拡張によってある程度構成的な意味を考慮した推論の精度改善が見られた点について、どういう形式のデータを入力として与えたときに精度改善の度合いが大きくなるのか、その可能性と限界についてさらなる調査を行う。

次年度使用額が生じた理由

2021年度に続き2022年度も新型コロナの影響により、国際学会・国内学会の多くがオンライン開催となり、旅費が計画よりも使われなかった。2023年度は国際学会・国内学会の多くが対面開催が予定されているため、計画通り旅費を支出できる見込みである。

  • 研究成果

    (14件)

すべて 2022 その他

すべて 雑誌論文 (2件) (うち査読あり 2件、 オープンアクセス 2件) 学会発表 (10件) (うち国際学会 3件、 招待講演 5件) 備考 (2件)

  • [雑誌論文] Compositional Evaluation on Japanese Textual Entailment and Similarity2022

    • 著者名/発表者名
      Yanaka Hitomi、Mineshima Koji
    • 雑誌名

      Transactions of the Association for Computational Linguistics

      巻: 10 ページ: 1266~1284

    • DOI

      10.1162/tacl_a_00518

    • 査読あり / オープンアクセス
  • [雑誌論文] Compositional Semantics and Inference System for Temporal Order based on Japanese CCG2022

    • 著者名/発表者名
      Sugimoto Tomoki、Yanaka Hitomi
    • 雑誌名

      Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics: Student Research Workshop

      巻: - ページ: 104-114

    • DOI

      10.18653/v1/2022.acl-srw.10

    • 査読あり / オープンアクセス
  • [学会発表] 時間的順序を考慮した日本語論理推論システムの構築2022

    • 著者名/発表者名
      杉本智紀, 谷中瞳
    • 学会等名
      人工知能学会第36回全国大会
  • [学会発表] 共起確率を用いた構文木の自動選択による推論システムの改善2022

    • 著者名/発表者名
      井上裕太, 谷中瞳
    • 学会等名
      NLP若手の会第17回シンポジウム
  • [学会発表] サプライザルを利用した日本語の流暢性フィルタリングの試み2022

    • 著者名/発表者名
      田村鴻希, 土井惟成, 西田直人, Junjie Chen, 谷中瞳
    • 学会等名
      言語処理学会第29回年次大会
  • [学会発表] 説明可能な検索ベースの文書分類手法の提案2022

    • 著者名/発表者名
      中井優, 中野雄介, 徳永優也, 上田亮, 谷中瞳
    • 学会等名
      言語処理学会第29回年次大会
  • [学会発表] Revisiting the Systematicity Argument through Analyzing Deep Neural Networks2022

    • 著者名/発表者名
      Hitomi Yanaka
    • 学会等名
      Aspects of Logic Study, celebrating World Logic Day (WLD2022)
    • 国際学会 / 招待講演
  • [学会発表] Exploring the Generalization Ability of Neural Models through Natural Language Inference2022

    • 著者名/発表者名
      Hitomi Yanaka
    • 学会等名
      the 6th International Workshop on Symbolic-Neural Learning (SNL2022)
    • 国際学会 / 招待講演
  • [学会発表] 論理に基づく推論システムの再訪2022

    • 著者名/発表者名
      谷中瞳
    • 学会等名
      情報処理学会第253回自然言語処理研究会
    • 招待講演
  • [学会発表] JSICK:構成的推論・類似度データセットSICK日本語版の紹介2022

    • 著者名/発表者名
      谷中瞳
    • 学会等名
      NLPコロキウム
    • 招待講演
  • [学会発表] 形式言語学の知見を活用した自然言語推論2022

    • 著者名/発表者名
      谷中瞳
    • 学会等名
      第31回ステアラボ人工知能セミナー
    • 招待講演
  • [学会発表] Logical Inference System for Temporal Order based on Japanese CCG2022

    • 著者名/発表者名
      Tomoki Sugimoto, Hitomi Yanaka
    • 学会等名
      the ESSLLI2022 Workshop Natural Logic Meets Machine Learning (NALOMA2022)
    • 国際学会
  • [備考] JSICK

    • URL

      https://github.com/verypluming/JSICK

  • [備考] ccgtemp

    • URL

      https://github.com/ynklab/ccgtemp

URL: 

公開日: 2023-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi