• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2010 年度 実績報告書

単語・フレーズ・言語モデルを統合したフレーズ並び替えモデルに基づく統計的機械翻訳

研究課題

研究課題/領域番号 21300048
研究機関筑波大学

研究代表者

山本 幹雄  筑波大学, 大学院・システム情報工学研究科, 教授 (40210562)

研究分担者 乾 孝司  筑波大学, 大学院・システム情報工学研究科, 助教 (60397031)
キーワード多言語処理 / 人工知能 / 自然言語処理 / 並び替えモデル / 言語モデル / 統計的機械翻訳
研究概要

本研究では、フレーズ並び替えモデルに焦点をあて、主に3つのアプローチ(隣接フレーズモデル、構文モデル、言語モデル)を比較検討し、その結果に基づく融合モデルを開発することによりモデルの高度化を行い、日英翻訳などの構造的に遠い言語間の翻訳性能を飛躍的に高めることを目的としている。3年間の研究期間の2年目であるH22年度は「新モデルの開発」フェーズと位置づけ、1年目に得られた知見を元に主に新しいフレーズ並び替えモデルを検討した。年度当初の予備実験で可能性が高いと考えられた次の2種類のモデルを集中的に検討した。(a)言語モデルを並び替えモデルとして階層フレーズモデルと同時に利用するために、構文解析(係り受け解析)を行った大量のデータを利用した木構造言語モデルを新たに開発し、デコーダに組み込んだ。残念ながら、最終的に顕著な性能向上は見られなかったが、言語モデルによって木構造情報を翻訳に反映させることができることを確認できたため、引き続き最終年度も本モデルの検討を継続する。(b)階層フレーズ規則から並び替え規則と翻訳規則を分離する方法を一般化し、より長距離の並び替え規則を抽出する方法を開発した。特に、階層フレーズを長距離化すると組合わせ的な爆発が生じるが、これを並び替えルール抽出に適するものだけに制限することにより管理可能な数に押さえる方法を開発した。同時にこのモデルを用いるデコーダにも改良を加え、長いフレーズ中に数カ所の翻訳されない部分があっても並び替えモデルを適用できるようにした。また、日英以外に中英翻訳データを手に入れ、評価実験の準備を整えた。

  • 研究成果

    (3件)

すべて 2011 2010

すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (1件)

  • [雑誌論文] 統計的機械翻訳におけるフレーズ対応最適化を利用したN-best翻訣候補のリランキング2010

    • 著者名/発表者名
      越川満
    • 雑誌名

      情報処理学会論文誌

      巻: 51 ページ: 1443-1451

    • 査読あり
  • [雑誌論文] フレーズテーブル及び既存対訳辞書を用いた専門用語の訳語推定2010

    • 著者名/発表者名
      森下洋平
    • 雑誌名

      電子情報通信学会論文誌

      巻: J93-D ページ: 2525-2537

    • 査読あり
  • [学会発表] 評価文書分類における異言語翻訳データの利用法2011

    • 著者名/発表者名
      乾孝司
    • 学会等名
      言語処理学会第17回年次大会
    • 発表場所
      豊橋市
    • 年月日
      2011-03-09

URL: 

公開日: 2012-07-19  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi