研究課題/領域番号 |
08451104
|
研究機関 | 東京外国語大学 |
研究代表者 |
町田 和彦 東京外国語大学, アジア・アフリカ言語文化研究所, 教授 (70134749)
|
研究分担者 |
赤松 明彦 九州大学, 文学部, 教授 (80159326)
澤田 英夫 東京外国語大学, アジア・アフリカ言語文化研究所, 助手 (60282779)
峰岸 真琴 東京外国語大学, アジア・アフリカ言語文化研究所, 助教授 (20190712)
高島 淳 東京外国語大学, アジア・アフリカ言語文化研究所, 助教授 (40202147)
|
キーワード | インド系文字 / テキスト解析 / 機械可読辞書 / ヒンディー語 / サンスクリット語 / タイ語 / カンボジア語 / ビルマ語 |
研究概要 |
本研究が対象とするインド系文字で表記される言語(ヒンディー語、サンスクリット語、タイ語、カンボジア語、ビルマ語)のテキスト自動解析について、最終年度(第3年度)は、以下の研究実績をあげた。 1. 確定したフォーマットとコード体系に従って、各言語別に機械可読辞書を拡充した。このフォーマットとコード体系に従うファイルをTEXなどの電子組版にも応用できるシステムを確立した。 2. テキストの自動解析を目的とする機械可読辞書にとって重要な語基(BASE)と接辞(SUFFIX)の情報内容に関して、各言語別にかなりの精度で実用化できることを確認した。 3. パソコン(DOS-V)上で動作するテキスト自動解析プログラムに改良を加えた。また同等の性能を有するプログラムをUNIX上に移植した。 4. UNIX上に移植したプログラムとデータをサーバにおき、CGI(Common Gateway Interface)を利用してインターネット上で電子辞書検索システムおよびテキスト解析システムを現在実験運用中である。ヒンディー語に関しては、研究代表者(町田)のホームページ 日本語版(http://www3.aa.tufs.ac.jp/〜kmach/index.htm) 英語版(http://www3.aa.tufs.ac.jp/〜kmach/index-e.htm) から利用できる。
|