平成21年度および平成22年度(繰越)は、研究計画に沿って、対訳テキストの開発、機械翻訳のための基盤システムの開発、主辞駆動句構造文法(HPSG)のための同期文法の開発を行った。 [対訳テキストの開発]本課題は、英字新聞ウォール・ストリート・ジャーナルに付与されたHPSG構文構造から自動的に同期文法を得ることを目標としているが、そのためにはこの新聞の英日対訳テキストが必要となる。本課題では、ウォール・ストリート・ジャーナルの英日対訳を約1万1千文開発した。本課題で翻訳したウォール・ストリート・ジャーナルのテキストは、自然言語処理で最もよく用いられるデータであり、この対訳テキストは自然言語処理全般で有用なデータとして用いられることが期待される。 [基盤システム]演繹操作によるHPSG構文構造データの開発を目標とし、その開発を容易にするライブラリを開発した。また、統計的モデルの学習のために、オンライン学習の研究および開発を行った。本研究で開発した手法はオンライン学習における精度面の問題を克服し、機械学習において最も性能が高いと考えられているSVMに匹敵する精度を達成した。また、機械翻訳に関連し対訳表示による英文読解支援の研究も行った。 [HPSG同期文法の開発]HPSG同期文法を開発するために、本課題において開発した対訳テキストと、GIZA++と呼ばれる単語対応付けソフトウェアを用いて、単語レベルで対応付けされたウォール・ストリート・ジャーナルの対訳テキストを開発した。この対訳テキストにはHPSG構文構造が付与されているため、これらのHPSG構文構造と単語対応に対しコーパスベースの帰納的文法開発手法を適用することにより、英語文法と日本語文法が対応付けされたHPSG同期文法を獲得することに成功した。
|