研究課題/領域番号 |
24320074
|
研究機関 | 東京外国語大学 |
研究代表者 |
町田 和彦 東京外国語大学, アジア・アフリカ言語文化研究所, 教授 (70134749)
|
研究分担者 |
三上 喜貴 長岡技術科学大学, 工学(系)研究科(研究院), 教授 (70293264)
萩田 博 東京外国語大学, 大学院総合国際学研究院, 准教授 (80143618)
萬宮 健策 東京外国語大学, 大学院総合国際学研究院, 准教授 (00403204)
|
研究期間 (年度) |
2012-04-01 – 2015-03-31
|
キーワード | 言語学 / ヒンディー語 / ウルドゥー語 / 語彙 / 機械処理 |
研究概要 |
ヒンディー語・ウルドゥー語の定量分析の対象である語彙属性に関し語源情報(供給源言語、音韻変化の程度など)をもとにきめ細かく設定し、機械辞書(見出し語形、語彙属性、品詞、活用変化情報、語義など)を作成し、時代ごと(19、20,21 世紀)に選定された両言語の散文テキストを電子化し蓄積する作業を継続した。さらにこれらのテキストに対する機械辞書を利用した自動タグ付け(tagging)の出力結果をもとに語彙属性の定量分析を実施した。また前年度の研究成果をヒンディー語・ウルドゥー語教育に反映させ、各研究項目にフィードバックさせた。 1)【語彙属性の設定と機械辞書作成】機械辞書の量的拡充(新たに約10,000 語、累計約15,000 語)を図ると同時に、精度を向上させた。初年度の研究成果をもとに語彙属性の設定に修正の必要の有無があるか確認し、必要があれば修正し機械辞書全体に反映させた。 2)【時代別のヒンディー語・ウルドゥー語散文テキストの電子化】散文テキストの電子化(新たに約100 万語、累計約200 万語)をさらに進めた。前年度電子化が済んだテキストについても、より拡充した機械辞書による自動スペルチェックを実施し正確さを向上させた。 3)【語彙属性の定量分析】平成25 年度までの語彙属性の定量分析の結果をもとに日本南アジア学会(2013年10月15日)において研究成果を発表した。内容は、ヒンディー語とウルドゥー語の差異を特徴づける根拠とされるそれぞれの言語に含まれる借用語彙の語源別含有率に関してであった。発表では、両言語の散文作品に出現する語彙の語源別定量分析の過程で明らかになりつつある問題の一部を報告した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
1)【語彙属性の設定と機械辞書作成】 機械辞書の量的拡充が予定通りに進んだ。2013年度は、新たに約10,000 語、累計約15,000 語の目標を達成した。 2)【時代別のヒンディー語・ウルドゥー語散文テキストの電子化】散文テキストの電子化についても予定通りに進んだ。2013年度は、新たに約100 万語、累計約200 万語の目標を達成した。 3)【語彙属性の定量分析】平成25 年度までの語彙属性の定量分析の結果をもとに日本南アジア学会(2013年10月15日)において研究成果を発表した。
|
今後の研究の推進方策 |
1)【語彙属性の設定と機械辞書作成】平成25 年度に引き続き、機械辞書の量的拡充(新たに約10,000 語、累計約25,000 語)をはかると同時に、精度を向上させる。作成した機械辞書の語義の充実にも努め、ヒンディー語・ウルドゥー語・英語・日本語辞書への応用とその学習者への公開をはかる。この公開予定の辞書には、本研究の研究成果が反映された両言語の共通基本語彙および各言語特有の使用語彙の区別が明示されるようにする。2)【時代別のヒンディー語・ウルドゥー語散文テキストの電子化】 前年度に引き続き散文テキストの電子化(新たに約100 万語、累計約300 万語)を進め、目標を達成する。蓄積した電子テキストは、著作権の許す範囲でweb 上に公開する。 3)【語彙属性の定量分析】語彙属性の定量分析の最終結果を反映した、ヒンディー語とウルドゥー語の個別の「語彙属性スペクトル」としてweb 上に公開する。その際、海外の研究者による本研究成果利用の便を考慮し、本研究の問題設定、アプローチの手法、結果について詳細な解説を英語でもつける。
|