研究課題/領域番号 |
24320074
|
研究機関 | 東京外国語大学 |
研究代表者 |
町田 和彦 東京外国語大学, アジア・アフリカ言語文化研究所, 教授 (70134749)
|
研究分担者 |
萩田 博 東京外国語大学, 大学院総合国際学研究院, 准教授 (80143618)
萬宮 健策 東京外国語大学, 大学院総合国際学研究院, 准教授 (00403204)
三上 喜貴 長岡技術科学大学, 工学(系)研究科(研究院), 教授 (70293264)
|
研究期間 (年度) |
2012-04-01 – 2015-03-31
|
キーワード | ヒンディー語 / ウルドゥー語 / 語彙 |
研究実績の概要 |
本研究は、言語的には同一言語とされるヒンディー語(インドの公用語、デーヴァナーガリー文字)とウルドゥー語(パキスタンの国語、アラビア系文字)の最大の相違点といわれる使用語彙の語源について、その実態を客観的かつ統計的に明らかにすることであった。事前の予想ではいわゆる定説どおり、共有する近代インド・アーリア語系を除くと、ヒンディー語はサンスクリット語源の語彙が、ウルドゥー語はペルシャ語・アラビア語からの借用語が多くなると思われた。 分析手法は、19世紀から21世紀にいたる期間において各言語の同時代散文作品を選び出し、それぞれの作品における使用頻度上位80%を占める語彙を抽出し、それらの語彙の語源別含有比率を計測した。この目的のために、延べ語語形(tokens)から異なり語形(types)へ、さらに辞書の見出し語形(lemmas)に収束させるプログラムと機械辞書を開発した。また収束した辞書の見出し語形から語源を自動的に同定するための語源辞書を作成した。 研究の結果、ヒンディー語とウルドゥー語の両言語においての語彙の語源的片寄りについては、事前の想定よりも差がなかったということがわかった。特に使用頻度上位80%までの範囲では、両言語とも圧倒的に近代インド・アーリア語系が多数を占め、若干の古くから借用されているペルシア系語彙が上位に来ることが確認できた。サンスクリット系の語彙は、ヒンディー語でも使用頻度上位にくることはなかった。
|
現在までの達成度 (段落) |
26年度が最終年度であるため、記入しない。
|
今後の研究の推進方策 |
26年度が最終年度であるため、記入しない。
|
次年度使用額が生じた理由 |
26年度が最終年度であるため、記入しない。
|
次年度使用額の使用計画 |
26年度が最終年度であるため、記入しない。
|