Study of the hierarchical sentence structure of Japanese based on the corpus with syntactic and semantic information

Research Project

Project/Area Number	22K00524
Research Category	Grant-in-Aid for Scientific Research (C)
Allocation Type	Multi-year Fund
Section	一般
Review Section	Basic Section 02060:Linguistics-related
Research Institution	Tohoku University
Principal Investigator	吉本啓東北大学, 高度教養教育・学生支援機構, 名誉教授 (50282017)
Co-Investigator(Kenkyū-buntansha)	森芳樹東京大学, 大学院総合文化研究科, 教授 (30306831) バトラーアラステア弘前大学, 人文社会科学部, 准教授 (90588873)
Project Period (FY)	2022-04-01 – 2025-03-31
Project Status	Granted (Fiscal Year 2023)
Budget Amount *help	¥3,380,000 (Direct Cost: ¥2,600,000、Indirect Cost: ¥780,000) Fiscal Year 2024: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000) Fiscal Year 2023: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000) Fiscal Year 2022: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Keywords	コーパス / 日本語 / 文の階層 / 統語論 / 意味論 / ツリーバンク / 複文 / テンス
Outline of Research at the Start	日本語の文のもっとも基本的な構造であるとされる文階層構造を、統語・意味解析情報付きコーパス NPCMJ によって検証することを目的とする。コーパスにおける文構成要素間の共起関係を調査することを通じて階層の分類基準を明らかにし、さらにそれにもとづいて日本語文解析・生成システムを提案する。さらに、複文の主語継承とテンス解釈という具体的事例を取り上げて上記の文解析・生成システムを検証し、必要に応じて修正や拡張を行う。
Outline of Annual Research Achievements	南 (1974) の日本語文階層説は、日本語の文の成り立ちを統一的に説明する理論として評価され、多くの検証や応用研究がなされてきた。一定量のデータを用いた理論の実証も試みられているが、大規模なコーパスにもとづく総合的な解明はいまだなされていない。吉本らは、国立国語研究所共同研究プロジェクトにおいて、日本語として初めての、本格的な文統語・意味解析情報を有するコーパスである NINJAL Parsed Corpus of Modern Japanese / かいのきツリーバンク（以下、かいのきTB）の開発を行った。構文による用例検索を可能にするかいのきTBを用いて、日本語文の階層構造の全体像を解明することが本研究の目的である。また、日本語の文の構成に関する包括的な仮説である文階層説の研究を進めることにより、複文を含む日本語の文の統語構造・意味情報の総体についても認識を深めることができる。本年度は前年度の研究を継続して複文を取り上げ、ノデ／カラ従属節を伴う複文におけるテンスの表示と意味の分布について、かいのきTBの検索を通じて調査を行った。検索により得られたデータを検討した結果、ディフォールト規則としてノデ／カラ従属節をB類従属節とし、従属節述語のテンス計算の基準時を主節述語成立時とする一方、これによりカバーできない、少数の例外の扱いも必要であることが分かった。これにより得られた、上位階層から下位階層へのテンス情報継承のデータをその例外とともに説明する非単調的な論理推論モデルを提案した。
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 前年度の研究を継続し、ノデ／カラ従属節を伴う文を従属節および主節の非タ形／タ形ごとに抽出して調査を行った。これを踏まえ、階層ごとのテンス情報の導入と語彙的なテンス情報（状態述語・動作述語および非タ形／タ形）との組み合わせにより文のテンス情報を合成する非単調的論理推論システムを提案した。これにより、ノデ／カラ従属節の述語はディフォールトとしてB節述語とされ、従属節基準時（非タ形／タ形のテンス解釈のための基準）は主節成立時に一致するので、大多数の用例が説明される。従属節述語が非タ形の場合（例：私が黙っているので、彼はもう一度同じことを繰返した）、従属節と主節の成立時は重複することになる。他方、少数ながら、従属節非タ形述語の成立時が発話時と重複するものも見られる（例：今の正式名称があまりにも長いので、略して女川フォールドセンターと呼ぶようになりました）。このような例においては、発話時を表す時間副詞句等が明示的に出現することから、従属節はB節でありえず、例外的にC節とされた結果、従属節基準時が発話時と一致するのだと考える。この他にも述語タ形の意味にもディフォールト以外に条件次第で例外的な意味を認め、用例を全般をカバーするテンス意味推論システムを構築した。
Strategy for Future Research Activity	日本語文の階層構造の実態解明を遅らせている大きな要因は、文構成要素の4階層への分類に当たって、どのような分類基準を採用するかによって結果が大きく異なることにあると考えられる。分類基準としては、これまでに、(1) 異なる種類の従属節間の包含可能性、(2) 異なる種類の従属節内部における述語以外の文構成要素の生起可能性、(3) 異なる種類の従属節内部における述語構成要素の生起可能性、の3つが行われてきた。コーパスのデータ検索によってこれらの点に関する語句の種類ごとの分布を明らかにし、分類基準を明確にする必要がある。かいのきTBを使用することにより、数万文についての調査の大部分を短時間で行うことが可能になる。この結果を踏まえ、分類の精緻化を行い、また統計的手法も導入して、階層性にもとづく日本語文解析・生成の形式的モデルを提案する。複文において従属節の主語やテンスの解釈が主節のそれに依存するかどうかという問題についても、かいのきTBの検索を通じた解明が期待できる。上記のように、ノデ／カラ従属節を伴う複文のテンス意味の非単調論理推論システムを提案済みである。他の種類の従属節を含む複文についてこれを検討し、理論の更新を図る。また、ナガラ従属節の主語継承についても、すでに共同研究によって成果を蓄積しつつあるので、これをさらに発展させて主語解釈の一般モデルを提案する。

Report

(2 results)

2023 Research-status Report
2022 Research-status Report

Research Products
(24 results)

All 2023 2022

All Journal Article (12 results) (of which Peer Reviewed: 10 results, Open Access: 3 results) Presentation (12 results) (of which Int'l Joint Research: 3 results, Invited: 3 results)

[Journal Article] 日本語複文におけるテンス情報の継承2023
- Author(s)
  吉本啓
- Journal Title
  
  「言語による時間生成」論文集・報告集
  
  Volume: 1 Pages: 49-66
- Related Report
  2023 Research-status Report
[Journal Article] ,Sein + zu + Infinitiv‘-Konstruktion in der universalen Satzarchitektur2023
- Author(s)
  Akari Takahata & Yoshiki Mori
- Journal Title
  
  Linguisten-Seminar: Forum japanisch-germanistischer Sprachforschung
  
  Volume: 5 Pages: 76-92
- Related Report
  2023 Research-status Report 2022 Research-status Report
- Peer Reviewed
[Journal Article] Two Word Order Variations in German Cleft Sentences2023
- Author(s)
  Yoshiki Mori & Yuto Yamazaki
- Journal Title
  
  Przemyslaw Tajsner & Jacek Witkos (eds.) Word Order Matters
  
  Volume: 1 Pages: 81-110
- Related Report
  2023 Research-status Report
- Peer Reviewed
[Journal Article] Get + to-infinitive construction in German and the diversity of restructuring2023
- Author(s)
  Akari Takahata & Yoshiki Mori
- Journal Title
  
  Kim, Tae Sik & Jungu Kang (eds.) Proceedings of 24th Seoul International Conference on Generative Grammar
  
  Volume: 1 Pages: 284-294
- Related Report
  2023 Research-status Report
- Peer Reviewed
[Journal Article] ドイツ語の副詞節および補文の統語構造と意味論2023
- Author(s)
  伊藤克将・森芳樹
- Journal Title
  
  森芳樹（編）発話を越えたところに及ぶ文法の可能性：話し手指向性と聞き手指向性（Perlokutionaere Moeglichkeiten in der Grammatik: Sprecher- und Hoererorientierung）
  
  Volume: 1 Pages: 5-23
- Related Report
  2023 Research-status Report
- Peer Reviewed
[Journal Article] Constraining Parse Ambiguity with Grammatical Codes2023
- Author(s)
  Butler, Alastair
- Journal Title
  
  Bekki, D., Mineshima, K., McCready, E. (eds) Logic and Engineering of Natural Language Semantics. LENLS 2022
  
  Volume: 1 Pages: 120-138
- DOI
  10.1007/978-3-031-43977-3_8
- ISBN
  9783031439766, 9783031439773
- Related Report
  2023 Research-status Report
- Peer Reviewed
[Journal Article] Parsed Corpus Development with a Quick Access Interface2023
- Author(s)
  Butler, Alastair
- Journal Title
  
  Yada, K., Takama, Y., Mineshima, K., Satoh, K. (eds) New Frontiers in Artificial Intelligence. JSAI-isAI 2021
  
  Volume: 1 Pages: 212-227
- DOI
  10.1007/978-3-031-36190-6_15
- ISBN
  9783031361890, 9783031361906
- Related Report
  2023 Research-status Report
- Peer Reviewed
[Journal Article] Two Word Order Variations in German Cleft Sentences2023
- Author(s)
  Yoshiki Mori & Yuto Yamazaki
- Journal Title
  
  Word Order Matters
  
  Volume: 1 Pages: 81-110
- Related Report
  2022 Research-status Report
- Peer Reviewed
[Journal Article] Development and publication of the NINJAL Parsed Corpus of Modern Japanese2022
- Author(s)
  吉本啓, パルデシプラシャント, 長崎郁, Alastair J. Butler
- Journal Title
  
  Journal of Natural Language Processing
  
  Volume: 29 Issue: 3 Pages: 1015-1022
- DOI
  10.5715/jnlp.29.1015
- ISSN
  1340-7619, 2185-8314
- Related Report
  2022 Research-status Report
- Open Access
[Journal Article] Experiencer-Argument im Haupt- und Komplementsatz der Einstellungsverben2022
- Author(s)
  Shungo Fujii & Yoshiki Mori
- Journal Title
  
  Linguisten-Seminar:Forum japanisch-germanistischer Sprachforschung
  
  Volume: 4 Issue: 0 Pages: 94-115
- DOI
  10.11282/jggls.4.0_94
- ISSN
  2434-5407
- Related Report
  2022 Research-status Report
- Peer Reviewed / Open Access
[Journal Article] The implicit arguments in German modal passive construction2022
- Author(s)
  Akari Takahata & Yoshiki Mori
- Journal Title
  
  Data Science in Collaboration
  
  Volume: 5 Pages: 72-81
- Related Report
  2022 Research-status Report
- Peer Reviewed
[Journal Article] Aspekt-sensitive Verwendungen von mou (schon) und mada (noch) im Japanischen2022
- Author(s)
  Yoshiki Mori
- Journal Title
  
  Paths through meaning and form: Festschrift offered to Klaus von Heusinger on the occasion of his 60th birthday
  
  Volume: 1 Pages: 187-191
- Related Report
  2022 Research-status Report
- Peer Reviewed / Open Access
[Presentation] 高度文法情報付きコーパスとその日本語教育への応用2023
- Author(s)
  吉本啓・周振
- Organizer
  2023年台湾日本語教育研究国際シンポジウム、台湾日本語教育学会
- Related Report
  2023 Research-status Report
- Int'l Joint Research
[Presentation] Korean preterite form -ess- in comparison with Japanese correspondent -ta: interactions with negation2023
- Author(s)
  Yoshiki Mori & Chunhong Park
- Organizer
  International Conference for Korean Linguistics 2023
- Related Report
  2023 Research-status Report
- Invited
[Presentation] Three types of moo with imperatives in Japanese: Based on the contrast between sudeni and moo2023
- Author(s)
  Yoshiki Mori & Mizuho Miyata
- Organizer
  Workshop on ‘already’ markers, iamitives, and related expressions
- Related Report
  2023 Research-status Report
- Invited
[Presentation] Die Analyse zur bleiben + zu-Infinitiv-Konstruktion: Worin bleibt der Unterschied zu sein?2023
- Author(s)
  Akari Takahata & Yoshiki Mori
- Organizer
  Linguistenseminar 49
- Related Report
  2023 Research-status Report
[Presentation] Word order variations in German cleft sentences on a cartographic approach2023
- Author(s)
  Yoshiki Mori & Yuto Yamazaki
- Organizer
  Topic, Focus and Subject Conference
- Related Report
  2023 Research-status Report
[Presentation] QuD-effects of word order variations in German cleft sentences2023
- Author(s)
  Yoshiki Mori & Yuto Yamazaki
- Organizer
  Referential Structure in Communication
- Related Report
  2023 Research-status Report
[Presentation] The role of the definiteness feature in numeral-verb agreement2023
- Author(s)
  Yehor Duma & Yoshiki Mori
- Organizer
  Germanistische Linguistik zwischen Koeln und Tokio
- Related Report
  2023 Research-status Report
[Presentation] Dot-to-dot semantic representation2023
- Author(s)
  Butler, Alastair
- Organizer
  Logic and Engineering of Natural Language Semantics 20
- Related Report
  2023 Research-status Report
- Invited
[Presentation] 日本語複文におけるテンス情報の継承2023
- Author(s)
  吉本啓
- Organizer
  科研費新学術領域研究「時間生成学―時を生み出すこころの仕組み」A01班「言語による時間生成」研究報告会
- Related Report
  2022 Research-status Report
[Presentation] 深層学習を利用した PropBank 形式の日本語意味役割付与モデル2023
- Author(s)
  タロック・カラム, 竹内孔一, バトラー・アラステア, 長崎郁, パルデシ・プラシャント
- Organizer
  言語処理学会
- Related Report
  2022 Research-status Report
[Presentation] Constraining parse ambiguity with grammatical codes2023
- Author(s)
  Alastair Butler
- Organizer
  Logic and Engineering of Natural Language Semantics 19 (LENLS19)
- Related Report
  2022 Research-status Report
- Int'l Joint Research
[Presentation] The Discourse Function of Aspect in Japanese2023
- Author(s)
  Kei Yoshimoto, Joseph Tabolt, Zhen Zhou. Hiromi Kaji, and Tamami Shimada.
- Organizer
  Logic and Engineering of Natural Language Semantics 19 (LENLS19)
- Related Report
  2022 Research-status Report
- Int'l Joint Research

Study of the hierarchical sentence structure of Japanese based on the corpus with syntactic and semantic information

Principal Investigator

吉本 啓 東北大学, 高度教養教育・学生支援機構, 名誉教授 (50282017)

¥3,380,000 (Direct Cost: ¥2,600,000、Indirect Cost: ¥780,000)

Current Status of Research Progress

Reason

Report

Research Products

[Journal Article] 日本語複文におけるテンス情報の継承2023

Author(s)

Journal Title

Related Report

[Journal Article] ,Sein + zu + Infinitiv‘-Konstruktion in der universalen Satzarchitektur2023

Author(s)

Journal Title

Related Report

[Journal Article] Two Word Order Variations in German Cleft Sentences2023

Author(s)

Journal Title

Related Report

[Journal Article] Get + to-infinitive construction in German and the diversity of restructuring2023

Author(s)

Journal Title

Related Report

[Journal Article] ドイツ語の副詞節および補文の統語構造と意味論2023

Author(s)

Journal Title

Related Report

[Journal Article] Constraining Parse Ambiguity with Grammatical Codes2023

Author(s)

Journal Title

DOI

ISBN

Related Report

[Journal Article] Parsed Corpus Development with a Quick Access Interface2023

Author(s)

Journal Title

DOI

ISBN

Related Report

[Journal Article] Two Word Order Variations in German Cleft Sentences2023

Author(s)

Journal Title

Related Report

[Journal Article] Development and publication of the NINJAL Parsed Corpus of Modern Japanese2022

Author(s)

Journal Title

DOI

ISSN

Related Report

[Journal Article] Experiencer-Argument im Haupt- und Komplementsatz der Einstellungsverben2022

Author(s)

Journal Title

DOI

ISSN

Related Report

[Journal Article] The implicit arguments in German modal passive construction2022

Author(s)

Journal Title

Related Report

[Journal Article] Aspekt-sensitive Verwendungen von mou (schon) und mada (noch) im Japanischen2022

Author(s)

Journal Title

Related Report

[Presentation] 高度文法情報付きコーパスとその日本語教育への応用2023

Author(s)

Organizer

Related Report

[Presentation] Korean preterite form -ess- in comparison with Japanese correspondent -ta: interactions with negation2023

Author(s)

Organizer

Related Report

[Presentation] Three types of moo with imperatives in Japanese: Based on the contrast between sudeni and moo2023

Author(s)

Organizer

Related Report

[Presentation] Die Analyse zur bleiben + zu-Infinitiv-Konstruktion: Worin bleibt der Unterschied zu sein?2023

Author(s)

Organizer

Related Report

吉本啓東北大学, 高度教養教育・学生支援機構, 名誉教授 (50282017)