研究課題/領域番号 |
08451104
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
その他外国語・外国文学
|
研究機関 | 東京外国語大学 |
研究代表者 |
町田 和彦 東京外国語大学, アジア・アフリカ言語文化研究所, 教授 (70134749)
|
研究分担者 |
赤松 明彦 九州大学文学部, 教授 (80159326)
澤田 英夫 東京外国語大学, アジア・アフリカ言語文化研究所, 助手 (60282779)
峰岸 真琴 東京外国語大学, アジア・アフリカ言語文化研究所, 助教授 (20190712)
高島 淳 東京外国語大学, アジア・アフリカ言語文化研究所, 助教授 (40202147)
|
研究期間 (年度) |
1996 – 1998
|
研究課題ステータス |
完了 (1998年度)
|
配分額 *注記 |
6,100千円 (直接経費: 6,100千円)
1998年度: 1,000千円 (直接経費: 1,000千円)
1997年度: 900千円 (直接経費: 900千円)
1996年度: 4,200千円 (直接経費: 4,200千円)
|
キーワード | インド系文字 / テキスト解析 / 機械可読辞書 / ヒンディー語 / サンスクリット語 / タイ語 / カンボジア語 / ビルマ語 / カンポジア語 |
研究概要 |
本研究が対象とするインド系文字で表記される言語(ヒンディー語、サンスクリット語、タイ語、カンボジア語、ビルマ語)のテキスト自動解析についての研究実績は以下のとおり。 1. 自動的に機械可読辞書が生成できるオリジナル辞書の汎用的なフォーマットとコード体系を決めた。またオリジナル辞書ファイルをTEXなどの電子組版にも応用できるシステムを確立した。 2. 各言語別に1万語以上のhead wordを含む機械辞書を構築した。 3. テキストの自動解析を目的とする機械可読辞書にとって重要な語基(BASE)と接辞(SUFFIX)の情報内容に関して、各言語別にかなりの精度で実用化できることを確認した。 4. パソコン(DOS-V)上で動作するテキスト自動解析プログラムを開発した。また同等の性能を有するプログラムをUNIX上に移植した。 5. UNIX上に移植したプログラムとデータをサーバにおき、CGI(Common Gateway Interface)を利用してインターネット上で電子辞書検索システムおよびテキスト解析システムを現在実験運用中である。ヒンディー語に関しては、研究代表者(町田)のホームページ 日本語版(http://www3.aa.tufs.ac.jp/〜kmach/index.htm) 英語版(http://www3.aa.tufs.ac.jp/〜kmach/index-e.htm) から利用できる。
|