• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

日本語‐ウイグル語機械翻訳のための電子辞書の作成

研究課題

研究課題/領域番号 07558044
研究種目

試験研究(B)

配分区分補助金
研究分野 知能情報学
研究機関名古屋大学

研究代表者

稲垣 康善  名古屋大学, 工学部, 教授 (10023079)

研究分担者 杉野 花津江  名古屋大学, 工学部, 助手 (40023155)
外山 勝彦  中京大学, 情報科学部, 助教授 (70217561)
坂部 俊樹  名古屋大学, 工学部, 教授 (60111829)
研究期間 (年度) 1995
研究課題ステータス 完了 (1995年度)
配分額 *注記
4,500千円 (直接経費: 4,500千円)
1995年度: 4,500千円 (直接経費: 4,500千円)
キーワードウイグル語‐日本語電子化辞書 / ウイグル語‐日本語機械翻訳
研究概要

本研究では、ウイグル語‐日本語両言語間の機械翻訳のためのウイグル語‐日本語、日本語‐ウイグル語電子辞書を作成するために、(1)本研究者らがすでに作成した「IPAL計算機用日本語基本動詞辞書」をベースにした日本語‐ウイグル語電子辞書(約1200単語)ならびに(2)飯沼英二著「ウイグル語辞典」穂高書店(約15000単語)を電算入力したものを統合し、一括電算処理可能な形にした。
・単語数:約17000
・辞書の形式: \<uウイグル語見出し語>\<品詞>\j(<日本語訳>)^*
(\ue<ウイグル語用例>\je<日本語用例>)^*.ここで、u,j,ue,jeは、\と\で区切られている部分を識別するために付けたタグである。また、ウイグル語の表記には英語アルファベットを用いた。ただし、ウイグル語アルファベットは、32文字であり、足りない文字の代わりに、それに近い発音の文字の前に‘!'を付けたものを用いた。
例: \u baj \NN \j 税 \ue〜idarisi \ je 税務署. \ue〜kirimi\je 税収.
\ue〜alma!k \je 徴税する. \ue〜t!olim!ek \je 税を納める。
・品詞の付与:元の辞書には品詞の付与がないため、品詞情報を加えた。
・訳語のチェック:元の辞書がウイグル語‐中国語の辞書をもとにして作られているので、訳語に妥当性を欠くものがあったので、それをチェックし修正した。
・例文の妥当性のチェック:例文には、二次翻訳による不適切さの他、現状にあわないものもあったので、必要な部分を改めた。
・日本語‐ウイグル語電子辞書の作成:ウイグル語‐日本語辞書から、逆辞書を作ることによって作成する予定である。
・辞書記述言語の設計:電子辞書は、新項目の追加、内容の変更、データの再利用などが容易にできることが求められる。このため、文法が形式的かつ単純明解であり、機械的処理に適しかつ辞書作成者ならびにユーザー共に使いやすい辞書記述言語を(仮称DicScript)を設計した。DicScriptは、レジストリベース(項目やタグなどの形式的記述を登録する)、構文チェッカー(あるデータ項目は、文法に合っているかどうかのチェック)、インタフェース(各項目にアクセスする関数群)、入力シート(データや項目の入力と追加が会話的にできるGUIシステム)の機構を持っている。DicScriptの実装は現在進行中である。

報告書

(1件)
  • 1995 実績報告書
  • 研究成果

    (2件)

すべて その他

すべて 文献書誌 (2件)

  • [文献書誌] Muhtar Mahsut: "日本語‐ウイグル語機械翻訳のための動詞接尾辞に関する一考察" 電子情報通信学会総合大会講演論文集. D-115. (1995)

    • 関連する報告書
      1995 実績報告書
  • [文献書誌] Muhtar Mahsut: "A Parameterized Approach to Processing Auxiliary Verbs in Japanese-Uighur Machine Translation" Proc.of SNLP'95. 308-316 (1995)

    • 関連する報告書
      1995 実績報告書

URL: 

公開日: 1995-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi