• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

半教師あり学習による対訳コーパスのアラインメント

研究課題

研究課題/領域番号 20500149
研究種目

基盤研究(C)

配分区分補助金
応募区分一般
研究分野 知能情報学
研究機関近畿大学

研究代表者

山本 博史  近畿大学, 理工学部, 教授 (00395013)

連携研究者 隅田 英一郎  情報通信研究機構 (90395020)
安田 圭志  情報通信研究機構 (50395018)
ゴー チュイリン  情報通信研究機構 (90531616)
研究期間 (年度) 2008 – 2010
研究課題ステータス 完了 (2010年度)
配分額 *注記
3,900千円 (直接経費: 3,000千円、間接経費: 900千円)
2010年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2009年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2008年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
キーワード自然言語処理 / アライメント / 多言語化 / 半教師あり学習 / 固有名詞 / 確率付き制約
研究概要

本研究では、対訳文間単語アライメントを決定する際に、従来の単語情報だけでなく、品詞や、構文構造と取り入れることで、精度の向上を図る。この時、全ての学習コーパスに対して品詞や、構文情報を与えることは困難であるため、半教師ありの学習を行う。日英中の3ヶ国語パラレルコーパスに対し、品詞タグおよび固有名詞意味情報を用いた半教師ありアライメント学習を行い、効果が確認できた。さらに構文構造をアライメントに用いることで性能の向上が確認できた。

報告書

(4件)
  • 2010 実績報告書   研究成果報告書 ( PDF )
  • 2009 実績報告書
  • 2008 実績報告書
  • 研究成果

    (15件)

すべて 2011 2010 2009 2008

すべて 雑誌論文 (5件) (うち査読あり 5件) 学会発表 (10件)

  • [雑誌論文] A Reordering Model Using a Source-Side Parse-Tree for Statistical Machine Translation2009

    • 著者名/発表者名
      HASHIMOTO Kei, YAMAMOTO Hirofumi, OKUMA Hideo, SUMITA Eiichiro, TOKUDA Keiichi
    • 雑誌名

      IEICE transactions on information and systems 92(12)

      ページ: 2386-2393

    • NAID

      10026812507

    • 関連する報告書
      2010 研究成果報告書
    • 査読あり
  • [雑誌論文] Imposing Constraints from the Source Tree on ITG Constraints for SMT2009

    • 著者名/発表者名
      YAMAMOTO Hirofumi, OKUMA Hideo, SUMITA Eiichiro
    • 雑誌名

      EICE transactions on information and systems 92(9)

      ページ: 1762-1770

    • NAID

      10026811036

    • 関連する報告書
      2010 研究成果報告書
    • 査読あり
  • [雑誌論文] A Feature-rich Supervised Word Alignment Model for Phrase-based Statistical Machine Translation2009

    • 著者名/発表者名
      Chooi-Ling Goh, Eiichiro Sumita
    • 雑誌名

      International Journal of Asian Language Processing Vol.19, No.3

      ページ: 109-125

    • 関連する報告書
      2010 研究成果報告書
    • 査読あり
  • [雑誌論文] A Reordering Model Using a Source-Side Parse-Tree for Statistical Machine Translation2009

    • 著者名/発表者名
      橋本佳
    • 雑誌名

      IEICE TRANSACTIONS on Information and Systems Vol.E92-D, No.12

      ページ: 2386-2393

    • 関連する報告書
      2009 実績報告書
    • 査読あり
  • [雑誌論文] A Feature-rich Supervised Word Alignment Model for Phrase-based Statistical Machine Translation2009

    • 著者名/発表者名
      ゴー・チュイリン
    • 雑誌名

      International Journal of Asian Language Processing Vol.19, No.3

      ページ: 109-125

    • 関連する報告書
      2009 実績報告書
    • 査読あり
  • [学会発表] 英日SMTへのHead-Final制約の導入2011

    • 著者名/発表者名
      西村拓哉,山本博史,大熊英男,村上仁一
    • 学会等名
      言語処理学会第17回年次大会
    • 発表場所
      豊橋技術科学大学
    • 年月日
      2011-03-08
    • 関連する報告書
      2010 研究成果報告書
  • [学会発表] 英日SMTへのHead-Final制約の導入2011

    • 著者名/発表者名
      西村拓哉
    • 学会等名
      言語処理学会 第17回年次大会
    • 発表場所
      豊橋技科大学(愛知)
    • 年月日
      2011-03-08
    • 関連する報告書
      2010 実績報告書
  • [学会発表] 統計的機械翻訳における未登録語のグループ化による翻訳2010

    • 著者名/発表者名
      吉崎大輔,山本博史,大熊英男,匂坂芳典
    • 学会等名
      言語処理学会 第16回年次大会
    • 発表場所
      東京大学
    • 年月日
      2010-03-10
    • 関連する報告書
      2010 研究成果報告書
  • [学会発表] 統計的機械翻訳における未登録語のグループ化による翻訳2010

    • 著者名/発表者名
      吉崎大輔
    • 学会等名
      言語処理学会 第16回年次大会
    • 発表場所
      東京大学(東京)
    • 年月日
      2010-03-10
    • 関連する報告書
      2009 実績報告書
  • [学会発表] Supervised Word Alignment for Phrase-based Statistical Machine Translation2009

    • 著者名/発表者名
      ゴー・チュイリン
    • 学会等名
      言語処理学会 第15回年次大会
    • 発表場所
      鳥取
    • 年月日
      2009-03-05
    • 関連する報告書
      2008 実績報告書
  • [学会発表] Supervised Word Alignment for Phrase-based Statistical Machine Translation2009

    • 著者名/発表者名
      ゴー・チュイリン,隅田英一郎
    • 学会等名
      言語処理学会第15回年次大会論文集(873-876)
    • 発表場所
      鳥取大学
    • 関連する報告書
      2010 研究成果報告書
  • [学会発表] Guidelines for Chinese-English Word Alignment2008

    • 著者名/発表者名
      Hongmei ZHAO
    • 学会等名
      The 4th China Workshop on Machine Translation, CWMT' 2008
    • 発表場所
      北京(中国)
    • 年月日
      2008-11-27
    • 関連する報告書
      2008 実績報告書
  • [学会発表] Imposing Constraints from the Source Tree on ITG Constraints for SMT2008

    • 著者名/発表者名
      山本博史
    • 学会等名
      ACL-08 : HLT SSST-2 (The Second Workshop on Syntax Structure in Statistical Translation)
    • 発表場所
      オハイオ(米国)
    • 年月日
      2008-06-20
    • 関連する報告書
      2008 実績報告書
  • [学会発表] Guidelines for Chinese-English Word Alignment2008

    • 著者名/発表者名
      Hongmei Zhao, Qun Liu, Ruiqiang Zhang, Yajuan Lv, 隅田英一郎, ゴー・チュイリン
    • 学会等名
      CWMT'2008論文集(153-163)
    • 発表場所
      北京(中国)
    • 関連する報告書
      2010 研究成果報告書
  • [学会発表] Imposing Constraints from the Source Tree on ITG Constraints for SMT2008

    • 著者名/発表者名
      山本博史,大熊英男,隅田英一郎
    • 学会等名
      ACL-08 : HLT Second Workshop on Syntax and Structure in Statistical Translation (SSST-2)
    • 発表場所
      オハイオ(米国)
    • 関連する報告書
      2010 研究成果報告書

URL: 

公開日: 2008-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi