研究課題/領域番号 |
20K00583
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分02060:言語学関連
|
研究機関 | 明治大学 |
研究代表者 |
大矢 政徳 明治大学, 国際日本学部, 専任教授 (60318748)
|
研究期間 (年度) |
2020-04-01 – 2024-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
1,040千円 (直接経費: 800千円、間接経費: 240千円)
2022年度: 130千円 (直接経費: 100千円、間接経費: 30千円)
2021年度: 390千円 (直接経費: 300千円、間接経費: 90千円)
2020年度: 520千円 (直接経費: 400千円、間接経費: 120千円)
|
キーワード | 依存文法 / 対訳コーパス / 依存距離 / 概念密度 / 日英パラレルコーパス / Dependency Grammar / Parallel Corpus / Network analysis / Centrality measures / 英語コーパス / 自然言語処理 / 談話情報 / 自然言語推論 |
研究開始時の研究の概要 |
本研究は、言語学的に動機づけられた自然言語処理研究の試みの一つとして、依存文法(Dependency Grammar)の枠組を利用してテキスト中の複数の文の相互関係を可視化した英語 コーパス構築と、これを利用した自然言語推論システム構築を目的とする。 テキストを構成する文どうしの関係を各文中の単語間の関係で表現すること によって、依存文法と概念的には同一の形式でテキストの談話構造を明示化することに寄与 するのみならず、文と文とに矛盾関係が生じている場合も研究対象とすることによって、従 来のRSTよりも汎用性と粒度の双方が高い談話構造表示形式を構築することが期待される。
|
研究実績の概要 |
2022年度は論文を3編発表した(学内紀要を含む)。"The Relevance of Dependency Distances in the Study of L2 Production"は、前年度にThai TESOLで発表した内容のプロシーディングスとして発行されたものであり、異なる熟達度の英語学習者が産出したテキストの文中の単語の依存距離の確率分布が、熟達度の違いに関わらずZipf-Alekseev 分布に一致するという先行研究の知見を、より多くの学習者の産出した英語エッセイのコーパスをデータとして検証した研究である。続いて"Differences of Mean Dependency Distances of English Essays Written by Learners of Different Proficiency Levels"では、前論文の結果を踏襲しつつも、平均依存距離を尺度として異なる熟達度の英語学習者が産出した英文を比較すると、熟達度の違いによって平均依存距離は異なり、さらに異なる依存タイプの平均依存距離に注目すると、依存タイプによって熟達度の違いで平均依存距離が異なるものもあれば、依存タイプの違いに関わらず平均依存距離が変わらない場合もあるという結果が得られた。一方、"Propositional Idea Density of a Japanese Text and its English Translation in a Parallel Corpus "では、先行する研究で注目されている概念密度に着目し、川端康成のノーベル文学賞受賞スピーチとその英訳を依存文法の枠組みで構文解析した日英対訳コーパスをデータとしてそれぞれの概念密度を計算したところ言語間で概念密度には有意な差がみられないという結果が得られた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
2022年度途中から、依存距離だけでなく概念密度に研究の関心が移り、概念密度と依存距離との双方を変数として研究を進めるようになったため、当初目標としていた研究課題そのものの研究の進捗が遅れる結果となっている。
|
今後の研究の推進方策 |
依存距離と概念密度とを並行して研究することを研究の中心に明確に据えることによってより多角的に依存文法の枠組みに沿って日英語の構造的差異の定量的理解とその知見の応用を進めていくこととする。
|