Project/Area Number |
07558044
|
Research Category |
Grant-in-Aid for Developmental Scientific Research (B)
|
Allocation Type | Single-year Grants |
Research Field |
Intelligent informatics
|
Research Institution | Nagoya University |
Principal Investigator |
稲垣 康善 名古屋大学, 工学部, 教授 (10023079)
|
Co-Investigator(Kenkyū-buntansha) |
杉野 花津江 名古屋大学, 工学部, 助手 (40023155)
外山 勝彦 中京大学, 情報科学部, 助教授 (70217561)
坂部 俊樹 名古屋大学, 工学部, 教授 (60111829)
|
Project Period (FY) |
1995
|
Project Status |
Completed (Fiscal Year 1995)
|
Budget Amount *help |
¥4,500,000 (Direct Cost: ¥4,500,000)
Fiscal Year 1995: ¥4,500,000 (Direct Cost: ¥4,500,000)
|
Keywords | ウイグル語‐日本語電子化辞書 / ウイグル語‐日本語機械翻訳 |
Research Abstract |
本研究では、ウイグル語‐日本語両言語間の機械翻訳のためのウイグル語‐日本語、日本語‐ウイグル語電子辞書を作成するために、(1)本研究者らがすでに作成した「IPAL計算機用日本語基本動詞辞書」をベースにした日本語‐ウイグル語電子辞書(約1200単語)ならびに(2)飯沼英二著「ウイグル語辞典」穂高書店(約15000単語)を電算入力したものを統合し、一括電算処理可能な形にした。 ・単語数:約17000 ・辞書の形式: \<uウイグル語見出し語>\<品詞>\j(<日本語訳>)^* (\ue<ウイグル語用例>\je<日本語用例>)^*.ここで、u,j,ue,jeは、\と\で区切られている部分を識別するために付けたタグである。また、ウイグル語の表記には英語アルファベットを用いた。ただし、ウイグル語アルファベットは、32文字であり、足りない文字の代わりに、それに近い発音の文字の前に‘!'を付けたものを用いた。 例: \u baj \NN \j 税 \ue〜idarisi \ je 税務署. \ue〜kirimi\je 税収. \ue〜alma!k \je 徴税する. \ue〜t!olim!ek \je 税を納める。 ・品詞の付与:元の辞書には品詞の付与がないため、品詞情報を加えた。 ・訳語のチェック:元の辞書がウイグル語‐中国語の辞書をもとにして作られているので、訳語に妥当性を欠くものがあったので、それをチェックし修正した。 ・例文の妥当性のチェック:例文には、二次翻訳による不適切さの他、現状にあわないものもあったので、必要な部分を改めた。 ・日本語‐ウイグル語電子辞書の作成:ウイグル語‐日本語辞書から、逆辞書を作ることによって作成する予定である。 ・辞書記述言語の設計:電子辞書は、新項目の追加、内容の変更、データの再利用などが容易にできることが求められる。このため、文法が形式的かつ単純明解であり、機械的処理に適しかつ辞書作成者ならびにユーザー共に使いやすい辞書記述言語を(仮称DicScript)を設計した。DicScriptは、レジストリベース(項目やタグなどの形式的記述を登録する)、構文チェッカー(あるデータ項目は、文法に合っているかどうかのチェック)、インタフェース(各項目にアクセスする関数群)、入力シート(データや項目の入力と追加が会話的にできるGUIシステム)の機構を持っている。DicScriptの実装は現在進行中である。
|
Report
(1 results)
Research Products
(2 results)