研究課題
基盤研究(A)
1.インドの主要8言語(内、インド・アーリア諸語はヒンディー、ベンガル、マラーティー、サンスクリット語、ドラヴィダ諸語はタミル、テルグ、カンナダ、マラヤーラム語)の各言語別にフォーマット(見出し語形、文法情報、発音、語源、語義、文化情報などを含む)の記述方式に従って基本的な機械可読辞書を作成した。2.上記の機械可読辞書を用いて、インド諸語中央研究所との協力により得られた入力済みの各言語のコーパスデータについて、スペルチェック、構文解析の実験を行った。3.各言語について、見出し語形の発音をつづりから自動生成させるために必要なプログラムを作成した。4.パーザ(構文解析プログラム)を、プロトタイプから順次改良を進め、ヒンディー語については、web上で試験的に公開した。5.サンスクリット語の電子辞書をweb上で試験的に公開した。6.インド諸語中央研究所において入力された、アッサム語、ベンガル語、ヒンディー語、カンナダ語、カシミーリー語、マラヤーラム語、マラーティー語、オリヤー語、パンジャービー語、タミル語、テルグ語、ウルドゥー語の教科書等の言語コーパスデータを利用するための校正支援プログラムに必要なデータの構造解析およびそれを構成するツール類の開発を行った。
すべて その他
すべて 文献書誌 (18件)