• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2012 Fiscal Year Research-status Report

プログラム合成・分解による機械翻訳

Research Project

Project/Area Number 24700136
Research Category

Grant-in-Aid for Young Scientists (B)

Research InstitutionNational Institute of Informatics

Principal Investigator

松崎 拓也  国立情報学研究所, 社会共有知研究センター, 特任准教授 (40463872)

Project Period (FY) 2012-04-01 – 2015-03-31
Keywords機械翻訳 / 意味解析
Research Abstract

1. 日英翻訳システムの基礎となる日本語CCG文法の開発を進めた。この文法は広範囲のジャンルの文に対し、受身・使役といった格交代の現象や、種々の連体修飾、また複雑な並列構造など、様々な構文を一貫した方法で解析し、述語項構造レベルの深い意味構造を出力するものであり、今後、本研究での日本語文の意味構造・統語構造から翻訳対象言語への翻訳ルールを獲得するための基盤となると同時に、機械翻訳に限らない種々の応用が期待されるものである。
2. 構文アノテーション付き対訳コーパスの開発を行った。このコーパスは、英語構文解析の研究において標準的に用いられている PennTreebank コーパスの Wall Street Journal 部分の対訳データに対し、構文アノテーションおよび名詞間のアラインメントを付加したものである。対訳コーパスの両言語に構文アノテーションが付加されたデータはほとんど例が無く、今後、本研究で観察用および評価用データとして必須となる。
3. 日本語の意味解析に関する研究を行った。この研究では与えられたテキストに対する適切な意味構造が比較的明確である数学テキストを対象とし、深い意味解析を行うための基盤である意味導出の理論的枠組みについて検討を行った。スコープ曖昧性の解決など、意味構造の細部に渡る正確な把握が正確な翻訳のための必須条件となる数学テキストは、高精度な翻訳技術開発の対象ドメインとして非常に望ましい性質を持っている。

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

日本語CCG文法の開発、対訳・構文情報付きコーパスの整備、および意味解析手法の研究など、深い統語・意味解析を基礎とする翻訳システム開発に対する必須の予備段階にあたる研究を進めたものの、翻訳ルールの抽出までは至らなかった。この遅れは当該年度以前に完了見込みであった研究の進行状況が予想よりも遅かったことを受けたものである。

Strategy for Future Research Activity

当初の研究課題のうち、日本語CCGによる構文解析結果と英語HPSGによる構文解析結果の相互間の翻訳に集中し、当初の推進方策に従って研究を進める。

Expenditure Plans for the Next FY Research Funding

必要を見込んでいた計算機環境の整備について、代替の環境が利用可能であることが判明した一方、対訳データ作成の必要性が明らかになったため、使途の変更を行った。この差額と、当初旅費などとして計上していたが不要となった額を併せた約90万円は、次年度、対訳データの追加作成に充てる。これは翻訳ルール獲得について客観的かつ信頼のおける精度評価を行うことで研究進捗の効率化を図る目的である。これ以外の研究費使用は当初計画に従い進める。

  • Research Products

    (3 results)

All 2012 Other

All Presentation (2 results) Remarks (1 results)

  • [Presentation] Toward Wide-Coverage Natural Language Mathematical Problem Solving2012

    • Author(s)
      Takuya MATSUZAKI
    • Organizer
      the 9th International Workshop on Logic and Engineering of Natural Language Semantics
    • Place of Presentation
      JA-AZMホール(宮崎)
    • Year and Date
      20121130-20121202
  • [Presentation] Akamon: An Open Source Toolkit for Tree/Forest-Based Statistical Machine Translation2012

    • Author(s)
      Xianchao Wu, Takuya Matsuzaki, Jun'ichi Tsujii
    • Organizer
      the 50th Annual Meeting of the Association for Computational Linguistics
    • Place of Presentation
      Jeju Island, Korea
    • Year and Date
      20120708-20120714
  • [Remarks] ResearchMap 松崎拓也

    • URL

      http://researchmap.jp/mtzk/

URL: 

Published: 2014-07-24  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi