統語・意味解析情報付きコーパスにもとづく日本語文階層性の研究

研究課題

研究課題/領域番号	22K00524
研究種目	基盤研究(C)
配分区分	基金
応募区分	一般
審査区分	小区分02060:言語学関連
研究機関	東北大学
研究代表者	吉本啓東北大学, 高度教養教育・学生支援機構, 名誉教授 (50282017)
研究分担者	森芳樹東京大学, 大学院総合文化研究科, 教授 (30306831) バトラーアラステア弘前大学, 人文社会科学部, 准教授 (90588873)
研究期間 (年度)	2022-04-01 – 2025-03-31
研究課題ステータス	交付 (2023年度)
配分額 *注記	3,380千円 (直接経費: 2,600千円、間接経費: 780千円) 2024年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円) 2023年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円) 2022年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
キーワード	コーパス / 日本語 / 文の階層 / 統語論 / 意味論 / ツリーバンク / 複文 / テンス
研究開始時の研究の概要	日本語の文のもっとも基本的な構造であるとされる文階層構造を、統語・意味解析情報付きコーパス NPCMJ によって検証することを目的とする。コーパスにおける文構成要素間の共起関係を調査することを通じて階層の分類基準を明らかにし、さらにそれにもとづいて日本語文解析・生成システムを提案する。さらに、複文の主語継承とテンス解釈という具体的事例を取り上げて上記の文解析・生成システムを検証し、必要に応じて修正や拡張を行う。
研究実績の概要	南 (1974) の日本語文階層説は、日本語の文の成り立ちを統一的に説明する理論として評価され、多くの検証や応用研究がなされてきた。一定量のデータを用いた理論の実証も試みられているが、大規模なコーパスにもとづく総合的な解明はいまだなされていない。吉本らは、国立国語研究所共同研究プロジェクトにおいて、日本語として初めての、本格的な文統語・意味解析情報を有するコーパスである NINJAL Parsed Corpus of Modern Japanese / かいのきツリーバンク（以下、かいのきTB）の開発を行った。構文による用例検索を可能にするかいのきTBを用いて、日本語文の階層構造の全体像を解明することが本研究の目的である。また、日本語の文の構成に関する包括的な仮説である文階層説の研究を進めることにより、複文を含む日本語の文の統語構造・意味情報の総体についても認識を深めることができる。本年度は前年度の研究を継続して複文を取り上げ、ノデ／カラ従属節を伴う複文におけるテンスの表示と意味の分布について、かいのきTBの検索を通じて調査を行った。検索により得られたデータを検討した結果、ディフォールト規則としてノデ／カラ従属節をB類従属節とし、従属節述語のテンス計算の基準時を主節述語成立時とする一方、これによりカバーできない、少数の例外の扱いも必要であることが分かった。これにより得られた、上位階層から下位階層へのテンス情報継承のデータをその例外とともに説明する非単調的な論理推論モデルを提案した。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由前年度の研究を継続し、ノデ／カラ従属節を伴う文を従属節および主節の非タ形／タ形ごとに抽出して調査を行った。これを踏まえ、階層ごとのテンス情報の導入と語彙的なテンス情報（状態述語・動作述語および非タ形／タ形）との組み合わせにより文のテンス情報を合成する非単調的論理推論システムを提案した。これにより、ノデ／カラ従属節の述語はディフォールトとしてB節述語とされ、従属節基準時（非タ形／タ形のテンス解釈のための基準）は主節成立時に一致するので、大多数の用例が説明される。従属節述語が非タ形の場合（例：私が黙っているので、彼はもう一度同じことを繰返した）、従属節と主節の成立時は重複することになる。他方、少数ながら、従属節非タ形述語の成立時が発話時と重複するものも見られる（例：今の正式名称があまりにも長いので、略して女川フォールドセンターと呼ぶようになりました）。このような例においては、発話時を表す時間副詞句等が明示的に出現することから、従属節はB節でありえず、例外的にC節とされた結果、従属節基準時が発話時と一致するのだと考える。この他にも述語タ形の意味にもディフォールト以外に条件次第で例外的な意味を認め、用例を全般をカバーするテンス意味推論システムを構築した。
今後の研究の推進方策	日本語文の階層構造の実態解明を遅らせている大きな要因は、文構成要素の4階層への分類に当たって、どのような分類基準を採用するかによって結果が大きく異なることにあると考えられる。分類基準としては、これまでに、(1) 異なる種類の従属節間の包含可能性、(2) 異なる種類の従属節内部における述語以外の文構成要素の生起可能性、(3) 異なる種類の従属節内部における述語構成要素の生起可能性、の3つが行われてきた。コーパスのデータ検索によってこれらの点に関する語句の種類ごとの分布を明らかにし、分類基準を明確にする必要がある。かいのきTBを使用することにより、数万文についての調査の大部分を短時間で行うことが可能になる。この結果を踏まえ、分類の精緻化を行い、また統計的手法も導入して、階層性にもとづく日本語文解析・生成の形式的モデルを提案する。複文において従属節の主語やテンスの解釈が主節のそれに依存するかどうかという問題についても、かいのきTBの検索を通じた解明が期待できる。上記のように、ノデ／カラ従属節を伴う複文のテンス意味の非単調論理推論システムを提案済みである。他の種類の従属節を含む複文についてこれを検討し、理論の更新を図る。また、ナガラ従属節の主語継承についても、すでに共同研究によって成果を蓄積しつつあるので、これをさらに発展させて主語解釈の一般モデルを提案する。

報告書

(2件)

2023 実施状況報告書
2022 実施状況報告書

研究成果
(24件)

すべて 2023 2022

すべて雑誌論文 (12件) (うち査読あり 10件、オープンアクセス 3件) 学会発表 (12件) (うち国際学会 3件、招待講演 3件)

[雑誌論文] 日本語複文におけるテンス情報の継承2023
- 著者名/発表者名
  吉本啓
- 雑誌名
  
  「言語による時間生成」論文集・報告集
  
  巻: 1 ページ: 49-66
- 関連する報告書
  2023 実施状況報告書
[雑誌論文] ,Sein + zu + Infinitiv‘-Konstruktion in der universalen Satzarchitektur2023
- 著者名/発表者名
  Akari Takahata & Yoshiki Mori
- 雑誌名
  
  Linguisten-Seminar: Forum japanisch-germanistischer Sprachforschung
  
  巻: 5 ページ: 76-92
- 関連する報告書
  2023 実施状況報告書 2022 実施状況報告書
- 査読あり
[雑誌論文] Two Word Order Variations in German Cleft Sentences2023
- 著者名/発表者名
  Yoshiki Mori & Yuto Yamazaki
- 雑誌名
  
  Przemyslaw Tajsner & Jacek Witkos (eds.) Word Order Matters
  
  巻: 1 ページ: 81-110
- 関連する報告書
  2023 実施状況報告書
- 査読あり
[雑誌論文] Get + to-infinitive construction in German and the diversity of restructuring2023
- 著者名/発表者名
  Akari Takahata & Yoshiki Mori
- 雑誌名
  
  Kim, Tae Sik & Jungu Kang (eds.) Proceedings of 24th Seoul International Conference on Generative Grammar
  
  巻: 1 ページ: 284-294
- 関連する報告書
  2023 実施状況報告書
- 査読あり
[雑誌論文] ドイツ語の副詞節および補文の統語構造と意味論2023
- 著者名/発表者名
  伊藤克将・森芳樹
- 雑誌名
  
  森芳樹（編）発話を越えたところに及ぶ文法の可能性：話し手指向性と聞き手指向性（Perlokutionaere Moeglichkeiten in der Grammatik: Sprecher- und Hoererorientierung）
  
  巻: 1 ページ: 5-23
- 関連する報告書
  2023 実施状況報告書
- 査読あり
[雑誌論文] Constraining Parse Ambiguity with Grammatical Codes2023
- 著者名/発表者名
  Butler, Alastair
- 雑誌名
  
  Bekki, D., Mineshima, K., McCready, E. (eds) Logic and Engineering of Natural Language Semantics. LENLS 2022
  
  巻: 1 ページ: 120-138
- DOI
  10.1007/978-3-031-43977-3_8
- ISBN
  9783031439766, 9783031439773
- 関連する報告書
  2023 実施状況報告書
- 査読あり
[雑誌論文] Parsed Corpus Development with a Quick Access Interface2023
- 著者名/発表者名
  Butler, Alastair
- 雑誌名
  
  Yada, K., Takama, Y., Mineshima, K., Satoh, K. (eds) New Frontiers in Artificial Intelligence. JSAI-isAI 2021
  
  巻: 1 ページ: 212-227
- DOI
  10.1007/978-3-031-36190-6_15
- ISBN
  9783031361890, 9783031361906
- 関連する報告書
  2023 実施状況報告書
- 査読あり
[雑誌論文] Two Word Order Variations in German Cleft Sentences2023
- 著者名/発表者名
  Yoshiki Mori & Yuto Yamazaki
- 雑誌名
  
  Word Order Matters
  
  巻: 1 ページ: 81-110
- 関連する報告書
  2022 実施状況報告書
- 査読あり
[雑誌論文] NINJAL Parsed Corpus of Modern Japanese の構築と公開2022
- 著者名/発表者名
  吉本啓, パルデシプラシャント, 長崎郁, Alastair J. Butler
- 雑誌名
  
  自然言語処理
  
  巻: 29 号: 3 ページ: 1015-1022
- DOI
  10.5715/jnlp.29.1015
- ISSN
  1340-7619, 2185-8314
- 関連する報告書
  2022 実施状況報告書
- オープンアクセス
[雑誌論文] Experiencer-Argument im Haupt- und Komplementsatz der Einstellungsverben2022
- 著者名/発表者名
  Shungo Fujii & Yoshiki Mori
- 雑誌名
  
  Linguisten-Seminar : Forum japanisch-germanistischer Sprachforschung
  
  巻: 4 号: 0 ページ: 94-115
- DOI
  10.11282/jggls.4.0_94
- ISSN
  2434-5407
- 関連する報告書
  2022 実施状況報告書
- 査読あり / オープンアクセス
[雑誌論文] The implicit arguments in German modal passive construction2022
- 著者名/発表者名
  Akari Takahata & Yoshiki Mori
- 雑誌名
  
  Data Science in Collaboration
  
  巻: 5 ページ: 72-81
- 関連する報告書
  2022 実施状況報告書
- 査読あり
[雑誌論文] Aspekt-sensitive Verwendungen von mou (schon) und mada (noch) im Japanischen2022
- 著者名/発表者名
  Yoshiki Mori
- 雑誌名
  
  Paths through meaning and form: Festschrift offered to Klaus von Heusinger on the occasion of his 60th birthday
  
  巻: 1 ページ: 187-191
- 関連する報告書
  2022 実施状況報告書
- 査読あり / オープンアクセス
[学会発表] 高度文法情報付きコーパスとその日本語教育への応用2023
- 著者名/発表者名
  吉本啓・周振
- 学会等名
  2023年台湾日本語教育研究国際シンポジウム、台湾日本語教育学会
- 関連する報告書
  2023 実施状況報告書
- 国際学会
[学会発表] Korean preterite form -ess- in comparison with Japanese correspondent -ta: interactions with negation2023
- 著者名/発表者名
  Yoshiki Mori & Chunhong Park
- 学会等名
  International Conference for Korean Linguistics 2023
- 関連する報告書
  2023 実施状況報告書
- 招待講演
[学会発表] Three types of moo with imperatives in Japanese: Based on the contrast between sudeni and moo2023
- 著者名/発表者名
  Yoshiki Mori & Mizuho Miyata
- 学会等名
  Workshop on ‘already’ markers, iamitives, and related expressions
- 関連する報告書
  2023 実施状況報告書
- 招待講演
[学会発表] Die Analyse zur bleiben + zu-Infinitiv-Konstruktion: Worin bleibt der Unterschied zu sein?2023
- 著者名/発表者名
  Akari Takahata & Yoshiki Mori
- 学会等名
  Linguistenseminar 49
- 関連する報告書
  2023 実施状況報告書
[学会発表] Word order variations in German cleft sentences on a cartographic approach2023
- 著者名/発表者名
  Yoshiki Mori & Yuto Yamazaki
- 学会等名
  Topic, Focus and Subject Conference
- 関連する報告書
  2023 実施状況報告書
[学会発表] QuD-effects of word order variations in German cleft sentences2023
- 著者名/発表者名
  Yoshiki Mori & Yuto Yamazaki
- 学会等名
  Referential Structure in Communication
- 関連する報告書
  2023 実施状況報告書
[学会発表] The role of the definiteness feature in numeral-verb agreement2023
- 著者名/発表者名
  Yehor Duma & Yoshiki Mori
- 学会等名
  Germanistische Linguistik zwischen Koeln und Tokio
- 関連する報告書
  2023 実施状況報告書
[学会発表] Dot-to-dot semantic representation2023
- 著者名/発表者名
  Butler, Alastair
- 学会等名
  Logic and Engineering of Natural Language Semantics 20
- 関連する報告書
  2023 実施状況報告書
- 招待講演
[学会発表] 日本語複文におけるテンス情報の継承2023
- 著者名/発表者名
  吉本啓
- 学会等名
  科研費新学術領域研究「時間生成学―時を生み出すこころの仕組み」A01班「言語による時間生成」研究報告会
- 関連する報告書
  2022 実施状況報告書
[学会発表] 深層学習を利用した PropBank 形式の日本語意味役割付与モデル2023
- 著者名/発表者名
  タロック・カラム, 竹内孔一, バトラー・アラステア, 長崎郁, パルデシ・プラシャント
- 学会等名
  言語処理学会
- 関連する報告書
  2022 実施状況報告書
[学会発表] Constraining parse ambiguity with grammatical codes2023
- 著者名/発表者名
  Alastair Butler
- 学会等名
  Logic and Engineering of Natural Language Semantics 19 (LENLS19)
- 関連する報告書
  2022 実施状況報告書
- 国際学会
[学会発表] The Discourse Function of Aspect in Japanese2023
- 著者名/発表者名
  Kei Yoshimoto, Joseph Tabolt, Zhen Zhou. Hiromi Kaji, and Tamami Shimada.
- 学会等名
  Logic and Engineering of Natural Language Semantics 19 (LENLS19)
- 関連する報告書
  2022 実施状況報告書
- 国際学会

統語・意味解析情報付きコーパスにもとづく日本語文階層性の研究

研究代表者

吉本 啓 東北大学, 高度教養教育・学生支援機構, 名誉教授 (50282017)

3,380千円 (直接経費: 2,600千円、間接経費: 780千円)

現在までの達成度 (区分)

理由

報告書

研究成果

[雑誌論文] 日本語複文におけるテンス情報の継承2023

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] ,Sein + zu + Infinitiv‘-Konstruktion in der universalen Satzarchitektur2023

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Two Word Order Variations in German Cleft Sentences2023

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Get + to-infinitive construction in German and the diversity of restructuring2023

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] ドイツ語の副詞節および補文の統語構造と意味論2023

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Constraining Parse Ambiguity with Grammatical Codes2023

著者名/発表者名

雑誌名

DOI

ISBN

関連する報告書

[雑誌論文] Parsed Corpus Development with a Quick Access Interface2023

著者名/発表者名

雑誌名

DOI

ISBN

関連する報告書

[雑誌論文] Two Word Order Variations in German Cleft Sentences2023

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] NINJAL Parsed Corpus of Modern Japanese の構築と公開2022

著者名/発表者名

雑誌名

DOI

ISSN

関連する報告書

[雑誌論文] Experiencer-Argument im Haupt- und Komplementsatz der Einstellungsverben2022

著者名/発表者名

雑誌名

DOI

ISSN

関連する報告書

[雑誌論文] The implicit arguments in German modal passive construction2022

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Aspekt-sensitive Verwendungen von mou (schon) und mada (noch) im Japanischen2022

著者名/発表者名

雑誌名

関連する報告書

[学会発表] 高度文法情報付きコーパスとその日本語教育への応用2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Korean preterite form -ess- in comparison with Japanese correspondent -ta: interactions with negation2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Three types of moo with imperatives in Japanese: Based on the contrast between sudeni and moo2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Die Analyse zur bleiben + zu-Infinitiv-Konstruktion: Worin bleibt der Unterschied zu sein?2023

著者名/発表者名

学会等名

関連する報告書

吉本啓東北大学, 高度教養教育・学生支援機構, 名誉教授 (50282017)