研究課題/領域番号 |
09044004
|
研究種目 |
基盤研究(A)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
その他外国語・外国文学
|
研究機関 | 東京外国語大学 |
研究代表者 |
ペーリ バースカララーオ (バースカララ-オ ペ-リ) 東京外国語大学, アジア・アフリカ言語文化研究所, 教授 (00272617)
|
研究分担者 |
峰岸 真琴 東京外国語大学, アジア・アフリカ言語文化研究所, 助教授 (20190712)
高島 淳 東京外国語大学, アジア・アフリカ言語文化研究所, 助教授 (40202147)
町田 和彦 東京外国語大学, アジア・アフリカ言語文化研究所, 教授 (70134749)
高橋 孝信 東京大学, 大学院・人文社会系研究科, 助教授 (10236292)
奈良 毅 清泉女子大学, 人文科学研究所, 教授 (90014464)
|
研究期間 (年度) |
1997 – 1999
|
研究課題ステータス |
完了 (1999年度)
|
配分額 *注記 |
18,000千円 (直接経費: 18,000千円)
1999年度: 6,000千円 (直接経費: 6,000千円)
1998年度: 5,700千円 (直接経費: 5,700千円)
1997年度: 6,300千円 (直接経費: 6,300千円)
|
キーワード | テルグ語 / ヒンディー語 / サンスクリット語 / ベンガル語 / タミル語 / マラヤーラム語 / カンナダ語 / マラーティー語 / マラヤ-ラム語 / マラ-ティー語 |
研究概要 |
1.インドの主要8言語(内、インド・アーリア諸語はヒンディー、ベンガル、マラーティー、サンスクリット語、ドラヴィダ諸語はタミル、テルグ、カンナダ、マラヤーラム語)の各言語別にフォーマット(見出し語形、文法情報、発音、語源、語義、文化情報などを含む)の記述方式に従って基本的な機械可読辞書を作成した。 2.上記の機械可読辞書を用いて、インド諸語中央研究所との協力により得られた入力済みの各言語のコーパスデータについて、スペルチェック、構文解析の実験を行った。 3.各言語について、見出し語形の発音をつづりから自動生成させるために必要なプログラムを作成した。 4.パーザ(構文解析プログラム)を、プロトタイプから順次改良を進め、ヒンディー語については、web上で試験的に公開した。 5.サンスクリット語の電子辞書をweb上で試験的に公開した。 6.インド諸語中央研究所において入力された、アッサム語、ベンガル語、ヒンディー語、カンナダ語、カシミーリー語、マラヤーラム語、マラーティー語、オリヤー語、パンジャービー語、タミル語、テルグ語、ウルドゥー語の教科書等の言語コーパスデータを利用するための校正支援プログラムに必要なデータの構造解析およびそれを構成するツール類の開発を行った。
|