• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

言語横断情報検索および多言語情報抽出の技術を利用した翻訳知識獲得の研究

研究課題

研究課題/領域番号 14780275
研究種目

若手研究(B)

配分区分補助金
研究分野 知能情報学
研究機関京都大学 (2003)
豊橋技術科学大学 (2002)

研究代表者

宇津呂 武仁  京都大学, 情報学研究科, 講師 (90263433)

研究期間 (年度) 2002 – 2003
研究課題ステータス 完了 (2003年度)
配分額 *注記
4,800千円 (直接経費: 4,800千円)
2003年度: 2,400千円 (直接経費: 2,400千円)
2002年度: 2,400千円 (直接経費: 2,400千円)
キーワード自然言語処理 / 機械翻訳 / WWW / 翻訳知識獲得 / 対訳辞書 / 言語横断情報検索 / 二言語文書 / 固有表現
研究概要

本研究では,WWW(ワールドワイドウェブ)上の新聞社などの報道記事のページから日本語・英語等,異なった言語で書かれた文書を収集し,多種多様な分野について,分野固有の人名・地名・組織名などの固有名詞(固有表現)や事象・言い回しなどの翻訳知識を獲得する手法の研究を行なった.本年度は,昨年度に収集した二言語報道記事を情報源として,翻訳知識の獲得手法の研究,および,獲得された翻訳知識の評価を行なった.本年度の研究項目は次の2点である.
1.翻訳知識の候補の自動収集および候補の順位付け
2.獲得された翻訳知識の評価
まず,第1点については,報道記事中の人名・地名・組織名などの分野固有の固有名詞(固有表現)や事象・言い回しなどについて,翻訳知識の候補を収集する手法を確立した.さらに,各々の言語の表現が出現する対訳文書組候補の順位付けの情報,周囲の共起単語のパターンなど,多種多様な知識を最適な形で統合することにより,翻訳知識の候補の順位付けを行なう手法を確立した.ここでは,特に,訳語対応を推定する複数の統計的尺度を導入し,これらの複数尺度の最適な統合を行なうことにより,翻訳知識の候補の順位付け性能が改善できることを示した.
第2点については,獲得された翻訳知識が,既存の対訳辞書や翻訳ソフトに既登録であるかどうかの評価を行ない,一定量の新規翻訳知識が獲得されていることを確認した.これにより,既存の対訳辞書や翻訳ソフトの性能向上に寄与できることを示した.

報告書

(2件)
  • 2003 実績報告書
  • 2002 実績報告書
  • 研究成果

    (15件)

すべて その他

すべて 文献書誌 (15件)

  • [文献書誌] 堀内貴司: "日英報道記事からの訳語対獲得における言語横断情報検索の有効性の評価"言語処理学会第9回年次大会論文集. 341-344 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 浜本武: "言語横断関連報道記事検索における翻訳ソフト・対訳辞書・数値表現翻訳規則の性能比較"言語処理学会第9回年次大会論文集. 425-428 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 日野浩平: "日英関連報道記事からの翻訳知識獲得のためのユーザインタフェースの作成"言語処理学会第9回年次大会論文集. 421-424 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Takehito Utsuro: "Effect of Cross-Language IR in Bilingual Lexicon Acquisition from Comparable Corpora"Proceedings of the 9th European Chapter of the Association for Computational Linguistics. 355-362 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 日野浩平: "日英報道記事からの訳語対応推定における複数の推定尺度の利用"言語処理学会第10回年次大会論文集. 249-252 (2004)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 木田充洋: "ウェブ上の日英非対訳文書を用いた訳語対応推定"言語処理学会第10回年次大会論文集. 253-256 (2004)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 堀内貴司: "翻訳知識獲得のための言語横断関連報道記事検索"言語処理学会第8回年次大会論文集. 303-306 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 堀内貴司: "言語横断検索により自動収拾された日英関連報道記事からの訳語対応の獲得"情報処理学会研究報告. 2000-NL-150. 191-198 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] Takehito Utsuro: "Combining Outputs of Multiple Japanese Named Entity Chunkers by Stacking"Proceedings of the 2002 Conference on Empirical Methods in Natural Language Processing. 281-288 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] Takehito Utsuro: "Semi-automatic Compilation of Bilingual Lexicon Entries from Cross-Lingually Relevant News Articles on WWW News Sites"Machine Translation : From Research to Real Users. 165-176 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] Takehito Utsuro: "Translation Knowledge Acquisition from Cross-Lingually Relevant News Articles"Proceedings of the 2nd China-Japan Natural Language Processing Joint Research Promotion Conference. 123-134 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 堀内貴司: "日英報道記事からの訳語対獲得における言語横断情報検索の有効性の評価"言語処理学会第9回年次大会論文集. (2003)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 浜本武: "言語横断関連報道記事検索における翻訳ソフト・対話辞書・数値表現翻訳規則の性能比較"言語処理学会第9回年次大会論文集. (2003)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 日野浩平: "日英関連報道記事からの翻訳知識獲得のためのユーザインタフェースの作成"言語処理学会第9回年次大会論文集. (2003)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] Takehito Utsuro: "Effect of Cross-Language IR in Bilingual Lexicon Acquisition from Comparable Corpora"Proceedings of the 9th European Chapter of the Association for Computational Linguistics. (2003)

    • 関連する報告書
      2002 実績報告書

URL: 

公開日: 2002-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi