• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2007 年度 実績報告書

主辞駆動句構造文法のための統計同期文法による機械翻訳

研究課題

研究課題/領域番号 19680007
研究機関東京大学

研究代表者

二宮 崇  東京大学, 情報基盤センター, 講師 (20444094)

キーワード自然言語処理 / 機械翻訳 / 多言語処理 / HPSG / 構文解析
研究概要

2007年度は、研究計画に沿って、1)機械翻訳研究の調査、2)統計同期HPSG文法、3)英語HPSG文法を導出するためのHPSGツリーバンクの研究を行った。
[機械翻訳研究の調査]第7回日中自然言語処理共同研究促進会議、および、JSTの科学技術振興調整費による「日中・中日言語処理技術の開発研究」のプロジェクト会議に参加し、最新の機械翻訳研究について調査した。特に黒橋らによる構造的アライメントに基づく用例ベースは同期文法の一種と考えられ、アライメントの精度など、同期HPSG文法でも重要となる技術の性能について知見を得ることができた。
[統計同期HPSG文法]統計同期HPSG文法は、LTAGのための同期文法とほぼ同様の手法で理論化が可能である。同期LTAGや同期HPSGにおいて翻訳対応は主に語彙項目の対応に還元されるため、より性能の高い翻訳を実現するためには、精度の高い語彙項目選択モデルが重要な技術要素となる。2007年度はスーパータグ確率モデルと呼ばれる非常に高い次元の静的な語彙素性を持つ語彙項目選択確率モデルを最大エントロピー法の参照分布に組み込む手法を提案し、構文解析のタスクにおいて、非常に高い精度を達成することを実験により確認した。
[HPSGツリーバンクの開発]同期HPSGを作成するためには、同期HPSGツリーバンクの存在が望ましいが、自動的に導出される英語HPSGツリーバンクは完全形のHPSG構文木集合であり、各構文木ノードには非常に多くの情報が付与されるため、このツリーバンクに対し同期HPSGツリーバンクを作成することは難しい。演繹操作により完全形のHPSG構文木が復元可能なツリーバンクの開発を目標とし、その開発を容易にする軽量素性構造ライブラリを開発中である。

  • 研究成果

    (2件)

すべて 2008 2007

すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (1件)

  • [雑誌論文] A log-linear model with an n-gram reference distribution for accurate HPSG parsing2007

    • 著者名/発表者名
      Takashi Ninomiya
    • 雑誌名

      Proceedings of the 10th International Conference on Parsing Technologies (IWPT-2007)

      ページ: 60-68

    • 査読あり
  • [学会発表] 辞書引き履歴のソーシャル化による学習者支援2008

    • 著者名/発表者名
      江原遥
    • 学会等名
      第14回言語処理学会年次大会併設ワークショップ「教育・学習を支援する言語処理」
    • 発表場所
      東京
    • 年月日
      2008-03-21

URL: 

公開日: 2010-02-04   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi