研究課題
平成20年度および平成21年度(繰越)は、研究計画に沿って、1) 対訳テキストの入手と拡充、2) 機械翻訳システムのための基礎システム、3) 構文解析の性能向上を行った。[対訳テキストの入手と拡充]機械翻訳システムの作成において対訳テキストが必要不可欠であるが、入手予定の対訳テキストが想定していた量の半分しか得られないことが計画申請後に判明した。不十分な量の対訳テキストでは十分な精度の機械翻訳システムを実現することが困難であるため、対訳テキストの開発を行い、対訳テキストの量を拡充した。このため研究計画に遅延が生じたが、繰越申請を行い、この作業は平成21年度にも継続して行われた。[基礎システム]演繹操作によるHPSG構文木データの開発を目標とし、その開発を容易にする軽量素性構造ライブラリを開発中であり、型システムの演繹部を完成した。また、統計的モデルの学習のために、オンライン学習の研究および開発を行った。オンライン学習はデータを逐次的に受け取る高速かつ省メモリの優れた学習手法であるが、従来は精度の面で問題があった。本研究で開発した手法は精度面の問題を克服し、機械学習において最も性能が高いと考えられているSVMや最大エントロピー法に匹敵する精度を達成した。また、機械翻訳に関連し対訳表示による英文読解支援の研究も行い、この成果は主要な国際会議であるIUIにおいて発表した。[構文解析]機械翻訳システムの基幹エンジンとなる構文解析システムの性能を向上させることは非常に重要なタスクである。昨年度に引き続き構文解析性能の改良を行った。従来の構文解析手法では動的計画法に基づく手法が主に使われていたが、動的計画法による素性の局所的制限を克服するために、動的計画法を用いない構文解析手法を開発し、実験によりその有効性を確認した。この成果は主要な国際会議であるEACLにおいて発表した。
すべて 2010 2009 2008 その他
すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (10件) 図書 (3件) 備考 (3件)
Proceedings of the 2010 International Conference on Intelligent User Interfaces (IUI2010)
ページ: 51-60
Proceedings of the 12th Conference of the European Chapter of the Association for Computational Linguistics (EACL 2009)
ページ: 603-611