Development of an English corpus with visualized interrelationships among sentences in the framework of dependency grammar
Project/Area Number |
20K00583
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 02060:Linguistics-related
|
Research Institution | Meiji University |
Principal Investigator |
大矢 政徳 明治大学, 国際日本学部, 専任教授 (60318748)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2022: ¥130,000 (Direct Cost: ¥100,000、Indirect Cost: ¥30,000)
Fiscal Year 2021: ¥390,000 (Direct Cost: ¥300,000、Indirect Cost: ¥90,000)
Fiscal Year 2020: ¥520,000 (Direct Cost: ¥400,000、Indirect Cost: ¥120,000)
|
Keywords | 依存文法 / 対訳コーパス / 依存距離 / 概念密度 / 日英パラレルコーパス / Dependency Grammar / Parallel Corpus / Network analysis / Centrality measures / 英語コーパス / 自然言語処理 / 談話情報 / 自然言語推論 |
Outline of Research at the Start |
本研究は、言語学的に動機づけられた自然言語処理研究の試みの一つとして、依存文法(Dependency Grammar)の枠組を利用してテキスト中の複数の文の相互関係を可視化した英語 コーパス構築と、これを利用した自然言語推論システム構築を目的とする。 テキストを構成する文どうしの関係を各文中の単語間の関係で表現すること によって、依存文法と概念的には同一の形式でテキストの談話構造を明示化することに寄与 するのみならず、文と文とに矛盾関係が生じている場合も研究対象とすることによって、従 来のRSTよりも汎用性と粒度の双方が高い談話構造表示形式を構築することが期待される。
|
Outline of Annual Research Achievements |
2022年度は論文を3編発表した(学内紀要を含む)。"The Relevance of Dependency Distances in the Study of L2 Production"は、前年度にThai TESOLで発表した内容のプロシーディングスとして発行されたものであり、異なる熟達度の英語学習者が産出したテキストの文中の単語の依存距離の確率分布が、熟達度の違いに関わらずZipf-Alekseev 分布に一致するという先行研究の知見を、より多くの学習者の産出した英語エッセイのコーパスをデータとして検証した研究である。続いて"Differences of Mean Dependency Distances of English Essays Written by Learners of Different Proficiency Levels"では、前論文の結果を踏襲しつつも、平均依存距離を尺度として異なる熟達度の英語学習者が産出した英文を比較すると、熟達度の違いによって平均依存距離は異なり、さらに異なる依存タイプの平均依存距離に注目すると、依存タイプによって熟達度の違いで平均依存距離が異なるものもあれば、依存タイプの違いに関わらず平均依存距離が変わらない場合もあるという結果が得られた。一方、"Propositional Idea Density of a Japanese Text and its English Translation in a Parallel Corpus "では、先行する研究で注目されている概念密度に着目し、川端康成のノーベル文学賞受賞スピーチとその英訳を依存文法の枠組みで構文解析した日英対訳コーパスをデータとしてそれぞれの概念密度を計算したところ言語間で概念密度には有意な差がみられないという結果が得られた。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
2022年度途中から、依存距離だけでなく概念密度に研究の関心が移り、概念密度と依存距離との双方を変数として研究を進めるようになったため、当初目標としていた研究課題そのものの研究の進捗が遅れる結果となっている。
|
Strategy for Future Research Activity |
依存距離と概念密度とを並行して研究することを研究の中心に明確に据えることによってより多角的に依存文法の枠組みに沿って日英語の構造的差異の定量的理解とその知見の応用を進めていくこととする。
|
Report
(3 results)
Research Products
(12 results)