• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2013 Fiscal Year Research-status Report

プログラム合成・分解による機械翻訳

Research Project

Project/Area Number 24700136
Research InstitutionNational Institute of Informatics

Principal Investigator

松崎 拓也  国立情報学研究所, 社会共有知研究センター, 特任准教授 (40463872)

Keywords自然言語処理 / 構文解析
Research Abstract

1. 日英翻訳システムの基礎となる日本語CCG文法の開発を進めた。特に、格要素を取る名詞(不飽和名詞)の解析について重点的に研究を進めた。また、CCG辞書の拡充につとめ、数学教科書から収集した語に対して辞書エントリを順次定義した。現在の辞書は約6000の辞書エントリを含み、計1600の単語表層形と2500種の意味関数の間の対応が定義されている。
2. CCG文法を用いた統語・意味解析処理の研究を進めた。まず、統計的係り受け解析器の出力した係り受け構造を制約として、その制約内で最もスコアの高いCCG導出木を出力とする方式について検討した。スコア関数として、導出木に含まれるシンボル数や特定のルールの適用回数などに対する重み付き和を用いた。係り受け解析器の出力が正しい場合にはほぼ正確な導出木が得られるようになった。
3. 係り受け解析器の解析精度を向上させるために、ターゲットドメインとして選んだ数学問題テキストに対する係り受けコーパスを作成し、新聞に対する係り受けコーパスである京大コーパスと併せ統計的係り受け解析器を再訓練し、数学問題に対する解析精度を向上させた。
4.係り受け解析器を経由せず、CCG文法を直接用いて解析を行うために、開発したCCG辞書を汎用構文解析器 Enju の形式に変換し、文法規則も同様にEnju の形式による再実装を行った。
5. 対象ドメインにおける意味的制約を統語曖昧性解消へ利用するために、意味表示部分の各部分の型を、対応する統語範疇に付加するためのプログラムを実装した。

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

翻訳の前提となるCCG文法および構文解析器の実現に時間がかかっているため。

Strategy for Future Research Activity

日本語CCG構文解析器の完成および精度向上のための研究を進めたのち、日英のCCG導出木をアノテートしたパラレルツリーバンクの構築を行い、翻訳ルール獲得を試みる。

Expenditure Plans for the Next FY Research Funding

国内学会にのみ参加したため、旅費支出額が当初予定を下回った。
謝金作業を依頼できる作業者を見つけられなかったため人件費・謝金支出額が当初予定を下回った。
成果発表の機会を増やし、旅費に用いる。
謝金作業者を確保し、パラレルツリーバンクの作成に用いる。

  • Research Products

    (5 results)

All 2013 Other

All Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (2 results) Remarks (1 results)

  • [Journal Article] Probabilistic Chinese word segmentation with non-local information and stochastic training.2013

    • Author(s)
      Xu Sun,Yao-zhong Zhang,Takuya Matsuzaki,Yoshimasa Tsuruoka,Jun'ichi Tsujii
    • Journal Title

      Information Processing & Management

      Volume: 49(3) Pages: 626-636

    • DOI

      10.1016/j.ipm.2012.12.003

    • Peer Reviewed
  • [Journal Article] Latent Structured Perceptrons for Large-Scale Learning with Hidden Information.2013

    • Author(s)
      Xu Sun,Takuya Matsuzaki,Wenjie Li
    • Journal Title

      IEEE Transactions on Knowledge and Data Engineering

      Volume: 25(9) Pages: 2063-2075

    • DOI

      http://doi.ieeecomputersociety.org/10.1109/TKDE.2012.129

    • Peer Reviewed
  • [Presentation] Deep Context-free Grammar for Chinese with Broad-coverage

    • Author(s)
      Xiangli Wang, Yi Zhang, Yusuke Miyao, Takuya Matsuzaki and Junichi Tsujii
    • Organizer
      The Seventh SIGHAN Workshop on Chinese Language Processing
    • Place of Presentation
      Nagoya Congress Center
  • [Presentation] The Complexity of Math Problems -- Linguistic, or Computational?

    • Author(s)
      Takuya Matsuzaki, Hidenao Iwane, Hirokazu Anai and Noriko Arai
    • Organizer
      the 6th International Joint Conference on Natural Language Processing
    • Place of Presentation
      Nagoya Congress Center
  • [Remarks] 松崎拓也

    • URL

      http://researchmap.jp/mtzk/

URL: 

Published: 2015-05-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi