研究課題/領域番号 |
08451104
|
研究種目 |
基盤研究(B)
|
研究機関 | 東京外国語大学 |
研究代表者 |
町田 和彦 東京外国語大学, アジア・アフリカ言語文化研究所, 助教授 (70134749)
|
研究分担者 |
赤松 明彦 九州大学, 文学部, 助教授 (80159326)
澤田 英夫 東京外国語大学アジア, アフリカ言語文化研究所, 助手 (60282779)
峰岸 真琴 東京外国語大学アジア, アフリカ言語文化研究所, 助教授 (20190712)
高島 淳 東京外国語大学アジア, アフリカ言語文化研究所, 助教授 (40202147)
|
キーワード | インド系文字 / テキスト解析 / 機械可読辞書 / ヒンディー語 / サンスクリット語 / タイ語 / カンポジア語 / ビルマ語 |
研究概要 |
本研究が対象とするインド系文字で表記される言語(ヒンディー語、サンスクリット語、タイ語、カンボジア語、ビルマ語)のテキスト自動処理について、今年度(初年度)は、以下の研究実績をあげた。 1.汎用性のある機械可読辞書のフォーマットと文字コード体系を確定した。 2.確定したフォーマットとコード体系に従って、各言語別に小規模な機械可読辞書を作成した。 3.テキスの自動解析を目的とする機械可読辞書にとって重要な語基(BASE)と接語(SUFFIX)の情報について、試験的な解決方法が試みられた。 4.パソコン上で動作するテキスト自動解析プログラムのプロトタイプを試作した。 5.試作されたプロトタイプのプログラムをUNIX上に移植した。 6.CGI(Common Gateway Interface)を利用してインターネット上での実験的な電子辞書検索システム(ヒンディー語)を開発した。現在、研究代表者(町田)のホームページから利用できる。基本的には、他の言語にもこのシステムは有効であることが確認できた。
|