• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

ハイブリッドCGパーザの開発

研究課題

研究課題/領域番号 21K00541
研究種目

基盤研究(C)

配分区分基金
応募区分一般
審査区分 小区分02060:言語学関連
研究機関大学共同利用機関法人人間文化研究機構国立国語研究所

研究代表者

窪田 悠介  大学共同利用機関法人人間文化研究機構国立国語研究所, 研究系, 准教授 (60745149)

研究分担者 峯島 宏次  慶應義塾大学, 文学部(三田), 准教授 (80725739)
吉川 将司  東北大学, タフ・サイバーフィジカルAI研究センター, 助教 (80883470)
研究期間 (年度) 2021-04-01 – 2025-03-31
研究課題ステータス 交付 (2023年度)
配分額 *注記
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2023年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2022年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2021年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
キーワード統語解析 / 意味解析 / 統語変換 / CCG / 機械学習 / 深層学習 / 比較構文 / ハイブリッドCG / アノテーション / カテゴリ文法 / 統語変形
研究開始時の研究の概要

ハイブリッド CG のパーザを開発する。ハイブリッドCG はカテゴリ文法の一種であり、生成文法理論の中核的な概念である「統語変形」を簡潔に扱える点に特色を持つ。「変形」の概念を明示的に組み込んだパーザを開発することで、近年発展が目覚ましい、パーザなどの言語資源を用いた計算論的モデリングに基づく理論言語学研究を推し進めるための基盤資源を提供することを目指す。

研究実績の概要

本研究は、「統語変換」の概念に基づく理論言語学での研究の知見を活かして、自然言語処理研究において開発されたパーザ (具体的にはCCGパーザ) の性能を向上させることを目指すことを目的とするものである。この目的のために、CCGパーザにとって足りない情報を補うための機械学習のコンポーネントが必要となる。

本研究で構築するシステムは、設計上、(1) CCGパーザ、(2) 高次の意味的対応関係の解析器、(3) 何らかの方法で(1)と(2)を組み合わせて正しい意味表示を得るためのコンポーネントの3つの要素から構成される。

昨年度までの研究で、(2)のコンポーネントについて、機械学習によって未知のデータに対して正しく意味情報を付与できることが分かった。今年度は、(3)の部分の設計、つまり、この機械学習のコンポーネントとCCGパーザを組み合わせ、未知のデータを統語解析し、意味情報ラベルを予測する機械学習モデルの出力と組み合わせて論理式を出力するパイプラインを構築する方法を試行錯誤した。この作業は、パーザの設計を一から考え直すなどの大がかりで複雑な作業を伴ったため、当初の予想より時間がかかっている。このため、研究期間を一年延長して、システム全体を完成させ、学習データやパーザのモデルなどを公開するなどの作業を余裕をもって進めることができるように計画変更した。

現在までの達成度 (区分)
現在までの達成度 (区分)

3: やや遅れている

理由

本研究で構築するシステムでは、設計上、(1) CCGパーザ、(2) 高次の意味的対応関係の解析器、(3) 何らかの方法で(1)と(2)を組み合わせて正しい意味表示を得るためのコンポーネントの三者のスムーズな連携が必須となる。(1) - (3)すべて、単体でもそれぞれ動作に癖がある計算システムであり、またそれぞれの接合部分にも複雑さがあるため、困難な課題であることは当初からある程度予想されていた。実際にシステム全体のパイプラインを実装する作業に取り掛かった最終年度において、作業の複雑さが想定以上であったため、研究の完了に遅れが出ている。

今後の研究の推進方策

昨年度の作業により、基本的な実装方針は明確になっており、また、原理的に可能な作業であることはパイロット的な試行により確認済みである。研究期間を一年延長して、実装を満足のいく形で完成させ、学習データやパーザのモデルなどを公開するなどの作業を余裕をもって進める。

報告書

(3件)
  • 2023 実施状況報告書
  • 2022 実施状況報告書
  • 2021 実施状況報告書
  • 研究成果

    (6件)

すべて 2024 2023 2022

すべて 雑誌論文 (2件) (うちオープンアクセス 1件) 学会発表 (4件) (うち国際学会 1件、 招待講演 1件)

  • [雑誌論文] 統語変形はコミュニケーションから創発するのか?2024

    • 著者名/発表者名
      梶川康平, 大関洋平, 窪田悠介
    • 雑誌名

      言語処理学会第30回年次大会予稿集

      巻: 30 ページ: 2233-2237

    • 関連する報告書
      2023 実施状況報告書
  • [雑誌論文] 比較文の意味解析のための「深い」係り受け関係の解析2023

    • 著者名/発表者名
      窪田悠介, 林則序, 天本貴之, 峯島宏次
    • 雑誌名

      言語処理学会第29回年次大会予稿集

      巻: 1 ページ: 2962-2967

    • 関連する報告書
      2022 実施状況報告書
    • オープンアクセス
  • [学会発表] 統語変形はコミュニケーションから創発するのか?2024

    • 著者名/発表者名
      梶川康平, 大関洋平, 窪田悠介
    • 学会等名
      言語処理学会第30回年次大会
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] 比較文の意味解析のための「深い」係り受け関係の解析2023

    • 著者名/発表者名
      窪田悠介, 林則序, 天本貴之, 峯島宏次
    • 学会等名
      言語処理学会第29回年次大会
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] Toward 'parasitic scope' parsing: A case study on comparatives in Japanese2023

    • 著者名/発表者名
      Yusuke Kubota
    • 学会等名
      Japanese/Korean Linguistics 30
    • 関連する報告書
      2022 実施状況報告書
    • 国際学会 / 招待講演
  • [学会発表] 対照言語学の観点から見た日本語の計算言語学2022

    • 著者名/発表者名
      窪田悠介
    • 学会等名
      Prosody and Grammar Festa 6
    • 関連する報告書
      2021 実施状況報告書

URL: 

公開日: 2021-04-28   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi