• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2011 年度 実績報告書

選択型翻訳による言語横断検索の実現

研究課題

研究課題/領域番号 22650047
研究機関名古屋大学

研究代表者

佐藤 理史  名古屋大学, 工学研究科, 教授 (30205918)

キーワード多言語処理 / 機械翻訳 / 選択型翻訳 / 複合語 / 言語横断検索 / 情報検索支援 / ウィキペディア
研究概要

ウェブ上の百科事典『ウィキペディア』には、多くの言語の版がある。本研究では、その中で最大の『英語ウィキペディア(EnWiki)』を、日本語で引くことができるシステムを作成した。システムの中核は、日本語タームの英訳機構である。選択型翻訳(Non-Productive Machine Translation)と名付けた機構は、要素合成法で英訳候補を生成した後、ターゲットリストと呼ぶ大規模な訳語候補リストに含まれる候補のみを出力する。このターゲットリストに、EnWikiの見出し語リスト(590万件)を用いることにより、EnWikiを引くことができる訳語が得られる。
通常、日本語タームとその英訳には、構成要素間に対応関係がある。このため、要素合成法で利用する対訳辞書が完全であり、かつ、訳語がEnWikiの見出し語に存在すれば、上記の方法で必ず正しい訳語を得ることができる。しかし、実際のターム翻訳には、カタカナ表記による音訳、表記ゆれ、翻訳のゆれなどの現象が見られ、利用可能な対訳辞書は、これらの現象を十分にはカバーしない。この問題を解決するために、本研究では、選択型翻訳に7つの拡張機構を導入し、辞書の不備を補い、システムの能力を向上させた。本年度は、特に、これらの拡張機構について研究した。
システムの評価のために、3種類のテストセット(合計11,070件)を編纂した。評価実験により、いずれのテストセットに対しても、70%以上の日本語タームに対し、正しい訳語を出力できることを確認した。拡張機構の導入による性能の向上は9.4-20.4%であり、大きな効果があることがわかった。さらに、本システムの性能は、ウェブの翻訳サービスや市販翻訳ソフトを凌駕していることも確認した。

  • 研究成果

    (3件)

すべて 2012 2011

すべて 学会発表 (3件)

  • [学会発表] 英語ウィキペディアを日本語で引く:性能向上の検討2012

    • 著者名/発表者名
      岡田昌也,佐藤理史,駒谷和範
    • 学会等名
      言語処理学会第18回年次大会
    • 発表場所
      広島市立大学(広島県)
    • 年月日
      2012-03-15
  • [学会発表] Japanese-English Cross-Language Headword Search of Wikipedia2011

    • 著者名/発表者名
      Satoshi Sato, Masaya Okada
    • 学会等名
      Proceedings of 9th International Conference on Terminology and Artificial Intelligence
    • 発表場所
      University Paris 7, France
    • 年月日
      2011-11-08
  • [学会発表] 英語ウィキペディアを日本語で引く2011

    • 著者名/発表者名
      岡田昌也, 佐藤理史, 駒谷和範
    • 学会等名
      2011年度人工知能学会全国大会(第25回)
    • 発表場所
      アイーナいわて県民情報交流センター(岩手県)
    • 年月日
      2011-06-02

URL: 

公開日: 2013-06-26  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi