2007年度は、研究計画に沿って、1)機械翻訳研究の調査、2)統計同期HPSG文法、3)英語HPSG文法を導出するためのHPSGツリーバンクの研究を行った。 [機械翻訳研究の調査]第7回日中自然言語処理共同研究促進会議、および、JSTの科学技術振興調整費による「日中・中日言語処理技術の開発研究」のプロジェクト会議に参加し、最新の機械翻訳研究について調査した。特に黒橋らによる構造的アライメントに基づく用例ベースは同期文法の一種と考えられ、アライメントの精度など、同期HPSG文法でも重要となる技術の性能について知見を得ることができた。 [統計同期HPSG文法]統計同期HPSG文法は、LTAGのための同期文法とほぼ同様の手法で理論化が可能である。同期LTAGや同期HPSGにおいて翻訳対応は主に語彙項目の対応に還元されるため、より性能の高い翻訳を実現するためには、精度の高い語彙項目選択モデルが重要な技術要素となる。2007年度はスーパータグ確率モデルと呼ばれる非常に高い次元の静的な語彙素性を持つ語彙項目選択確率モデルを最大エントロピー法の参照分布に組み込む手法を提案し、構文解析のタスクにおいて、非常に高い精度を達成することを実験により確認した。 [HPSGツリーバンクの開発]同期HPSGを作成するためには、同期HPSGツリーバンクの存在が望ましいが、自動的に導出される英語HPSGツリーバンクは完全形のHPSG構文木集合であり、各構文木ノードには非常に多くの情報が付与されるため、このツリーバンクに対し同期HPSGツリーバンクを作成することは難しい。演繹操作により完全形のHPSG構文木が復元可能なツリーバンクの開発を目標とし、その開発を容易にする軽量素性構造ライブラリを開発中である。
|