2008 Fiscal Year Annual Research Report
主辞駆動句構造文法のための統計同期文法による機械翻訳
Project/Area Number |
19680007
|
Research Institution | The University of Tokyo |
Principal Investigator |
二宮 崇 The University of Tokyo, 情報基盤センター, 講師 (20444094)
|
Keywords | 自然言語処理 / 機械翻訳 / HPSG / 構文解析 / オンライン学習 / 読解支援 |
Research Abstract |
平成20年度および平成21年度(繰越)は、研究計画に沿って、1) 対訳テキストの入手と拡充、2) 機械翻訳システムのための基礎システム、3) 構文解析の性能向上を行った。 [対訳テキストの入手と拡充]機械翻訳システムの作成において対訳テキストが必要不可欠であるが、入手予定の対訳テキストが想定していた量の半分しか得られないことが計画申請後に判明した。不十分な量の対訳テキストでは十分な精度の機械翻訳システムを実現することが困難であるため、対訳テキストの開発を行い、対訳テキストの量を拡充した。このため研究計画に遅延が生じたが、繰越申請を行い、この作業は平成21年度にも継続して行われた。 [基礎システム]演繹操作によるHPSG構文木データの開発を目標とし、その開発を容易にする軽量素性構造ライブラリを開発中であり、型システムの演繹部を完成した。また、統計的モデルの学習のために、オンライン学習の研究および開発を行った。オンライン学習はデータを逐次的に受け取る高速かつ省メモリの優れた学習手法であるが、従来は精度の面で問題があった。本研究で開発した手法は精度面の問題を克服し、機械学習において最も性能が高いと考えられているSVMや最大エントロピー法に匹敵する精度を達成した。また、機械翻訳に関連し対訳表示による英文読解支援の研究も行い、この成果は主要な国際会議であるIUIにおいて発表した。 [構文解析]機械翻訳システムの基幹エンジンとなる構文解析システムの性能を向上させることは非常に重要なタスクである。昨年度に引き続き構文解析性能の改良を行った。従来の構文解析手法では動的計画法に基づく手法が主に使われていたが、動的計画法による素性の局所的制限を克服するために、動的計画法を用いない構文解析手法を開発し、実験によりその有効性を確認した。この成果は主要な国際会議であるEACLにおいて発表した。
|
Research Products
(18 results)
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
[Remarks] 下記の受賞があった。
-
[Remarks] NLP若手の会 第4回シンポジウム奨励賞,NLP若手の会,2009年9月.
-
[Remarks] 情報処理学会創立50周年記念(第72回)全国大会 学生奨励賞,情報処理学会,2010年3月.