• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

WWW上の多言語文書から翻訳知識を発見するための知的インタフェースの研究

研究課題

研究課題/領域番号 15017245
研究種目

特定領域研究

配分区分補助金
審査区分 理工系
研究機関京都大学

研究代表者

宇津呂 武仁  京都大学, 情報学研究科, 講師 (90263433)

研究期間 (年度) 2003
研究課題ステータス 完了 (2003年度)
配分額 *注記
4,000千円 (直接経費: 4,000千円)
2003年度: 4,000千円 (直接経費: 4,000千円)
キーワード自然言語処理 / 機械翻訳 / WWW / 翻訳知識獲得 / 対訳辞書 / 言語横断情報検索 / 二言語文書 / 検索エンジン
研究概要

本研究では,WWW(ワールドワイドウェブ)上の多種多様な多言語文書集合を情報源として翻訳知識を発見する技術を確立することを目的として,翻訳知識発見モデルおよび翻訳知識発見インタフェースについて研究を行なった.本年度の研究項目は次の2点である.
1.多言語文書集合からの包括的翻訳知識発見モデルの研究
2.翻訳知識獲得のための知的インタフェースの研究
まず,第1点については,これまでの技術の範囲では,翻訳知識獲得の情報源がWWW上の報道記事に限定されていたが,WWW上の一般の多言語文書にまで情報源を拡張する技術について研究を行なった.具体的には,まず,翻訳知識の候補については,従来技術にしたがい,報道記事中の人名・地名・組織名などの分野固有の固有名詞(固有表現)や事象・言い回しなどについて,翻訳知識の候補を収集する.次に,これらの翻訳知識の候補の正確な順位付けを行なうために,WWW検索エンジンを用いて多様な多言語文書を収集する.そして,収集された多言語文書を統合的に利用して翻訳知識の候補の順位付けを行なう包括的翻訳知識発見モデルを考案した.
第2点については,翻訳知識の候補の順位付け規則によって得られた順位を参照しながら,簡単な操作をするだけで,利用者が必要とする翻訳知識を手軽にかつ確実に獲得できるインタフェースを開発した.このインタフェースでは,利用者が効率的に翻訳知識を発見できるように,各々の表現が出現する元文書,既存の対訳辞書や翻訳ソフトの情報等,多様な情報を簡単に閲覧できる機能を実現した.

報告書

(1件)
  • 2003 実績報告書
  • 研究成果

    (6件)

すべて その他

すべて 文献書誌 (6件)

  • [文献書誌] 堀内貴司: "日英報道記事からの訳語対獲得における言語横断情報検索の有効性の評価"言語処理学会第9回年次大会論文集. 341-344 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 浜本武: "言語横断関連報道記事検索における翻訳ソフト・対訳辞書・数値表現翻訳規則の性能比較"言語処理学会第9回年次大会論文集. 425-428 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 日野浩平: "日英関連報道記事からの翻訳知識獲得のためのユーザインタフェースの作成"言語処理学会第9回年次大会論文集. 421-424 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Takehito Utsuro: "Effect of Cross-Language IR in Bilingual Lexicon Acquisition from Comparable Corpora"Proceedings of the 9th European Chapter of the Association for Computational Linguistics. 355-362 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 日野浩平: "日英報道記事からの訳語対応推定における複数の推定尺度の利用"言語処理学会第10回年次大会論文集. 249-252 (2004)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 木田充洋: "ウェブ上の日英非対訳文書を用いた訳語対応推定"言語処理学会第10回年次大会論文集. 253-256 (2004)

    • 関連する報告書
      2003 実績報告書

URL: 

公開日: 2003-04-01   更新日: 2018-03-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi