2020 Fiscal Year Research-status Report
Development of an English corpus with visualized interrelationships among sentences in the framework of dependency grammar
Project/Area Number |
20K00583
|
Research Institution | Meiji University |
Principal Investigator |
大矢 政徳 明治大学, 国際日本学部, 専任准教授 (60318748)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | Dependency Grammar / Parallel Corpus / Network analysis / Centrality measures |
Outline of Annual Research Achievements |
"Structural divergence between root elements in English-Japanese translation pairs"(Global Japanese Studies Review, Meiji University 12(1) 107 - 126 Mar, 2020)と題した論文では,英語と日本語との翻訳ペア文中の単語の依存関係を依存木で表現し,その構造的不一致について論じた. "Analysis and Quantification of the Network of Lexical Connectedness Within a Text Based on Metrics Used in Network Analysis (Global Japanese Studies Review, Meiji University 13(1) 15 - 38 Mar, 2021)と題した論文では,英文テキスト中の文を頂点とし,文間の意味的関連を辺としたネットワークととらえ,これが文と文との関係つまり文脈の構造を表現しているとし,その構造特性の数値化を提案した. "Syntactic similarity of the sentences in a multi-lingual parallel corpus based on the Euclidean distance of their dependency trees"(Pacific Asia Conference on Language, Information and Computation (PACLIC) 34 Oct 24, 2020 )と題した研究発表では,多言語パラレルコーパスをデータとし,文の統語的類似性をユークリッド距離として計算する手法を提案した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
高品質の多言語パラレルコーパスを使って様々な観点から依存文法に基づく文の構造特性と言語間の類似性や差異を定量的に算出する手法の研究が進んでいる.
|
Strategy for Future Research Activity |
これまで同様,(1)多言語パラレルコーパスを利用した様々な観点からの文構造の類似性・差異に関する定量的研究と,(2)テキスト中の文の意味的関連を文のネットワークととらえた場合の構造特性の定量的研究に加え,日本語と英語との翻訳ペア間のより詳細で言語学的に動機づけられた類似性・差異の定量的検証を進める.具体的には,川端康成による『美しい日本の私』の日本語原文と英訳文との対訳文ペアをデータとして,その依存構造間の構造的不一致を検証しつつ,各言語のテキスト中の文を頂点とし,文間の意味的関連を辺としたネットワークととらえ,これが文と文との関係つまり文脈の構造を表現しているとし,その構造特性の数値化を進める.
|
Causes of Carryover |
2020年度は,Covid-19の影響により海外への研究発表出張が行えなかった.2021年度は状況の変化に応じて海外への研究発表出張を行う.
|