• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

派生文法に基づく膠着語間における多言語機械翻訳システムの開発

Research Project

Project/Area Number 13780223
Research Category

Grant-in-Aid for Young Scientists (B)

Allocation TypeSingle-year Grants
Research Field 計算機科学
Research InstitutionNagoya University

Principal Investigator

小川 泰弘  名古屋大学, 大学院・工学研究科, 助手 (70332707)

Project Period (FY) 2001 – 2002
Project Status Completed (Fiscal Year 2002)
Budget Amount *help
¥1,300,000 (Direct Cost: ¥1,300,000)
Fiscal Year 2002: ¥500,000 (Direct Cost: ¥500,000)
Fiscal Year 2001: ¥800,000 (Direct Cost: ¥800,000)
Keywords機械翻訳 / 膠着語 / 日本語 / ウイグル語 / 派生文法 / 形態素解析 / 音韻変化処理 / 言い換え
Research Abstract

本研究は,膠着語の性質に着目した多言語間翻訳システムの開発を目的とする.本年度は,その中でも,ウイグル語-日本語機械翻訳システムを目指して,以下の研究を行った.
1.ウイグル語音韻変化規則の体系化
本研究では,前年度に形態素解析システムMAJOを改良した日本語-ウイグル語機械翻訳システムを作成した.このシステムでは,出力文における音韻変化処理部が独立している.本年度の研究では,ウイグル語の音韻変化を処理するため,ウイグル語の音韻変化規則を調査・整理し,翻訳システム用の音韻変化規則を整備した.
2.日本語-ウイグル語辞書の半自動作成とその評価
機械翻訳には電子化された辞書が必要であるが,日本語-ウイグル語にはそうした辞書がなかった.そこでウイグル語-日本語辞書を電子化し,その逆辞書を半自動的に生成する形で語彙数約2万語の機械翻訳用辞書を作成した.本年度は,この辞書における基本語彙の収録率を調査した.その結果,基本語彙2000語ベースで,国立国語研究所の教育基本語彙の69.2%,EDRコーパスの頻出語の75.2%が収録されていることが分かった.
3.日本語-ウイグル語翻訳実験
本研究で作成した日本語-ウイグル語機械翻訳システムと対訳辞書を利用しての翻訳実験を行った.新聞の社説など136文を翻訳した結果では,最初名詞の47.8%,動詞の32.7%が辞書になかったが,それを登録した後の実験では,文節単位で82.4%の正解率であった.
4.言い換えを利用した日本語-ウイグル語辞書の拡充
3.で述べたように,翻訳辞書の収録単語数はまだまだ不十分であるが,その構築コストは多大であるので,計算機を利用した対訳辞書の拡充も検討した.これは,辞書の未登録語を同等の意味をもつ登録語に言い換えることで実現した.具体的には,辞書の語義文とシソーラスに基づく類似度を用いて日本語の言い換え獲得する手法を開発した.

Report

(2 results)
  • 2002 Annual Research Report
  • 2001 Annual Research Report
  • Research Products

    (10 results)

All Other

All Publications (10 results)

  • [Publications] 小川 泰弘: "日本語-ウイグル語機械翻訳特有の諸問題について"言語処理学会 第9回年次大会発表演論文集. (発表予定). (2003)

    • Related Report
      2002 Annual Research Report
  • [Publications] 釜谷 聡史: "日本語-ウイグル語対訳辞書拡充のための日本語言い換え処理"情報処理学会 自然言語処理 研究報告. 154. 55-62 (2003)

    • Related Report
      2002 Annual Research Report
  • [Publications] ムフタル・マフスット: "日本語-ウイグル語辞書の自動作成とその収録語の分析"情報処理学会 自然言語処理 研究報告. 151. 7-14 (2002)

    • Related Report
      2002 Annual Research Report
  • [Publications] 小川 泰弘: "日本語-ウイグル語間機械翻訳におけるウイグル語音韻変化処理の形式化"言語処理学会 第8回年次大会発表演論文集. 29-36 (2002)

    • Related Report
      2002 Annual Research Report
  • [Publications] 小川 泰弘: "膠着語形態素解析における音韻変化処理"情報処理学会 第64回全国大会講演論文集(2). 45-46 (2002)

    • Related Report
      2002 Annual Research Report
  • [Publications] 釜谷 聡史: "辞書語義文を利用した対訳辞書の拡充"情報処理学会 第64回全国大会講演論文集(2). 91-92 (2002)

    • Related Report
      2002 Annual Research Report
  • [Publications] 小川 泰弘: "膠着語形態素解析における音韻変化処理"情報処理学会 第64回全国大会講演論文集. (発表予定). (2002)

    • Related Report
      2001 Annual Research Report
  • [Publications] 小川 泰弘: "日本語-ウイグル語間機械翻訳におけるウイグル語音韻変化処理の形式化"言語処理学会 第8回年次大会発表演論文集. (発表予定). (2002)

    • Related Report
      2001 Annual Research Report
  • [Publications] Muhtar Mahsut: "Utilizing Agglutinative Features in Japanese-Uighur Machine Translation"Proceeding of MT Summit VIII. 217-222 (2001)

    • Related Report
      2001 Annual Research Report
  • [Publications] 小川 泰弘: "派生文法に基づく膠着語形態素解析システムおよび文生成モジュールの開発"電気関係学会 東海支部連合大会講演論文集. 554-554 (2001)

    • Related Report
      2001 Annual Research Report

URL: 

Published: 2001-04-01   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi