• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2022 Fiscal Year Research-status Report

Study of the hierarchical sentence structure of Japanese based on the corpus with syntactic and semantic information

Research Project

Project/Area Number 22K00524
Research InstitutionTohoku University

Principal Investigator

吉本 啓  東北大学, 高度教養教育・学生支援機構, 名誉教授 (50282017)

Co-Investigator(Kenkyū-buntansha) 森 芳樹  東京大学, 大学院総合文化研究科, 教授 (30306831)
バトラー アラステア  弘前大学, 人文社会科学部, 准教授 (90588873)
Project Period (FY) 2022-04-01 – 2025-03-31
Keywordsコーパス / 日本語 / 文の階層 / 統語論 / 意味論 / ツリーバンク / 複文
Outline of Annual Research Achievements

本研究では、統語・意味解析情報付きコーパスを利用して、大量のデータにもとづいて日本語の文の階層性を検証し、その成果を文解析・生成システムとしてモデル化することを目的とする。応募者らが開発を行ってきたかいのきツリーバンクは、日本語として初めての、本格的な文統語・意味解析情報を有するコーパスである。これを利用して、テクスト中の文における語句の共起関係の検索を行い、階層表現の実態に即した分類基準を提案することを研究課題としている。
具体的には、尾上 (1999) により明らかにされた、階層の3つの分類基準に従ってかいのきツリーバンクを検索し、関連する語句の実際の分布について把握を試みる。また、その結果の実装として、文階層形成にもとづく日本語文解析・生成システムを構築する。さらに、複文における主節-従属節間の主語の継承およびテンス解釈依存の問題に関して、コーパス調査等を通じて実情を解明した上で、規則を上記の文解析・生成システムに組み込むことでモデル化を行うことも課題としている。
今年度は、複文構文の一部を取り上げ、その検索によって、テンス表示の分布とそのテンス解釈の規則の明確化を行った。その結果、上位の階層から下位へのテンス情報の継承を裏付ける言語データをその例外とともに、非単調的な推論規則のシステムとして説明できることが分かった。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

今年度は、かいのきツリーバンクの中の作例と翻訳を除く57,705文の中からノデ/カラ従属節を伴う文を主節・従属節の非タ形/タ形ごとに抽出して分析を加え、階層ごとのテンス情報の導入という文法モデルによりデータの説明が可能か否かについて検討を行った。
まず、タ形-ノデ/カラ-タ形の構文について、従属節述語が動作的であるものはすべて主節成立時以前の成立である。状態述語は大部分が主節成立時と同時だが、少数ながら主節成立時以前のものもある。
非タ形-ノデ/カラ-タ形の構文では、従属節述語の大部分は事実上状態的で、その成立時は主節と同時である。従属節述語が動作的で時間的幅を持たず、主節成立時以降を表すものはごく少数である。
また、主節述語が動作的で非タ形であるものについては、一種のモーダルとすることにより、従属節テンス解釈の基準時を他のケースと同様に主節成立時とできることを示した。
全体として、文のテンス解釈においてテンス情報が上位の階層から下位へと継承されるという非単調的な処理システムを言語データの解析により裏付けることができた。

Strategy for Future Research Activity

今後は、文構成要素間の共起関係の調査を通じた日本語の文の成り立ちのメカニズムの解明に取り組む。そのために、まず、尾上 (1999) の挙げる3つの異なる階層分類基準に従って かいのきツリーバンクを検索し、関連する語句の実際の分布について把握を行う。ここで取り上げる語句の大部分は機能語 (助詞、助動詞等) により構成されるので、統語解析情報付きコーパスの自動検索が効力を発揮し、分析の多くは短時間で行われると思われる。しかし、分析対象には副詞等も含むため、人手による仕分けも必要である。結果を検討し、語句の分布を最もよく説明する分類基準を提案する。分類基準を必要により細分化し、最適な組み合わせを考える。しかし、硬直した規則を設定するのではなく、語彙意味・文法情報と文脈とのインタフェースとして働く生きた階層構造の生態の解明を目指す。
複文の主語継承およびテンス解釈に関しても、さらにツリーバンクにもとづく調査を行う。主語の一致については、検索によりかなり良質のデータが得られることが期待される。それにもとづいて従属節による主語継承の規則を定式化する。テンスに関しては、ツリーバンク検索結果の精査を進め、実態をもっともよく説明する複文テンス解釈規則を考察する。

Causes of Carryover

コロナ感染状況がまだ沈静化せず、国内、国外の学会や研究会のオンライン開催が多く、また自身も対面参加を差し控えたために、計画した旅費に余りが出た。状況が好転しつつあるので、令和5年度は次年度使用額を使用して、学会、研究会に積極的に対面参加する予定である。

  • Research Products

    (10 results)

All 2023 2022

All Journal Article (6 results) (of which Peer Reviewed: 4 results,  Open Access: 3 results) Presentation (4 results) (of which Int'l Joint Research: 2 results)

  • [Journal Article] ,Sein + zu + Infinitiv‘-Konstruktion in der universalen Satzarchitektur2023

    • Author(s)
      Akari Takahata & Yoshiki Mori
    • Journal Title

      Linguisten-Seminar: Forum japanisch-germanistischer Sprachforschung

      Volume: 5 Pages: 76-92

    • Peer Reviewed
  • [Journal Article] Two Word Order Variations in German Cleft Sentences2023

    • Author(s)
      Yoshiki Mori & Yuto Yamazaki
    • Journal Title

      Word Order Matters

      Volume: 1 Pages: 81-110

    • Peer Reviewed
  • [Journal Article] NINJAL Parsed Corpus of Modern Japanese の構築と公開2022

    • Author(s)
      吉本 啓, パルデシ プラシャント, 長崎 郁, Alastair J. Butler
    • Journal Title

      自然言語処理

      Volume: 29 Pages: 1015-1022

    • DOI

      10.5715/jnlp.29.1015

    • Open Access
  • [Journal Article] Experiencer-Argument im Haupt- und Komplementsatz der Einstellungsverben2022

    • Author(s)
      Shungo Fujii & Yoshiki Mori
    • Journal Title

      Linguisten-Seminar: Forum japanisch-germanistischer Sprachforschung

      Volume: 4 Pages: 94-115

    • DOI

      10.11282/jggls.4.0_94

    • Open Access
  • [Journal Article] The implicit arguments in German modal passive construction2022

    • Author(s)
      Akari Takahata & Yoshiki Mori
    • Journal Title

      Data Science in Collaboration

      Volume: 5 Pages: 72-81

    • Peer Reviewed
  • [Journal Article] Aspekt-sensitive Verwendungen von mou (schon) und mada (noch) im Japanischen2022

    • Author(s)
      Yoshiki Mori
    • Journal Title

      Paths through meaning and form: Festschrift offered to Klaus von Heusinger on the occasion of his 60th birthday

      Volume: 1 Pages: 187-191

    • DOI

      10.18716/omp.3

    • Peer Reviewed / Open Access
  • [Presentation] 日本語複文におけるテンス情報の継承2023

    • Author(s)
      吉本啓
    • Organizer
      科研費新学術領域研究「時間生成学―時を生み出すこころの仕組み」A01班「言語による時間生成」研究報告会
  • [Presentation] 深層学習を利用した PropBank 形式の日本語意味役割付与モデル2023

    • Author(s)
      タロック・カラム, 竹内孔一, バトラー・アラステア, 長崎郁, パルデシ・プラシャント
    • Organizer
      言語処理学会
  • [Presentation] Constraining parse ambiguity with grammatical codes2023

    • Author(s)
      Alastair Butler
    • Organizer
      Logic and Engineering of Natural Language Semantics 19 (LENLS19)
    • Int'l Joint Research
  • [Presentation] The Discourse Function of Aspect in Japanese2023

    • Author(s)
      Kei Yoshimoto, Joseph Tabolt, Zhen Zhou. Hiromi Kaji, and Tamami Shimada.
    • Organizer
      Logic and Engineering of Natural Language Semantics 19 (LENLS19)
    • Int'l Joint Research

URL: 

Published: 2023-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi