• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

実世界の大規模言語資源からの翻訳知識獲得に基づく機械翻訳モデルの研究

研究課題

研究課題/領域番号 16700141
研究種目

若手研究(B)

配分区分補助金
研究分野 知能情報学
研究機関京都大学

研究代表者

宇津呂 武仁  京都大学, 情報学研究科, 講師 (90263433)

研究期間 (年度) 2004 – 2005
研究課題ステータス 完了 (2005年度)
配分額 *注記
3,700千円 (直接経費: 3,700千円)
2005年度: 1,800千円 (直接経費: 1,800千円)
2004年度: 1,900千円 (直接経費: 1,900千円)
キーワード自然言語処理 / 機械翻訳 / WWW / 翻訳知識獲得 / 訳語推定 / 対訳辞書 / 翻訳 / 翻訳モデル
研究概要

本研究では,現在の機械翻訳モデルの弱点を克服することを目的として,人間の翻訳者,特に,プロの翻訳者が持つ翻訳戦略を模倣し,計算機上の機械翻訳モデルとして実現することを目的として,以下の研究を行った.(i)翻訳対象の文書の原言語解析・翻訳変換・目的言語生成といった各処理を遂行するのに際して,あらかじめモデルが持っている言語知識が十分であるか否かを検出する機構を実現する.(ii)(i)で不足していると判定された言語知識を,実世界の大規模言語資源,具体的には,WWW上の文書群から収集するための戦略を,計算機上のソフトウェアとして実現する.
本年度は,翻訳において必要な知識のうち,不足していると判定された言語知識を,WWW上の多言語文書群から獲得する技術について研究を行った.ここでは,従来より研究代表者が行ってきた翻訳知識獲得の要素技術を発展させる形で研究を行った.特に,これまでに開発した翻訳知識獲得技術は,WWW上の多言語報道記事を情報源として翻訳知識を獲得するというものであったが,本研究では,情報源を報道記事に限定せずに,WWW上の一般の多言語文書群に拡張して翻訳知識の獲得を行う.具体的には,いくつかの原言語用語およびその目的言語訳の組を「種」として,「種」の出現するページから多様な手がかりを収集し,翻訳知識獲得において有益な戦略を帰納的に発見するというアプローチをとった.ここでは,「種」となる原言語用語を用いて,翻訳対象の文書の専門分野を推定し,その専門分野の多言語文書を収集した結果から,専門分野特有の翻訳知識を獲得するという戦略であった.この汎用の戦略を,各々の専門分野に適応させて,各専門分野に特化した翻訳知識獲得の戦略を帰納的に発見するという技術の開発を行った.

報告書

(2件)
  • 2005 実績報告書
  • 2004 実績報告書
  • 研究成果

    (14件)

すべて 2006 2005 2004

すべて 雑誌論文 (14件)

  • [雑誌論文] 大型英和辞典と関連用語収集技術を用いた対訳専門用語集の自動編集2006

    • 著者名/発表者名
      佐々木靖弘, 佐藤理史, 宇津呂武仁
    • 雑誌名

      言語処理学会第12回年次大会発表論文集

      ページ: 384-387

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] ウェブを利用した専門用語の分野判定2006

    • 著者名/発表者名
      木田充洋, 外池昌嗣, 佐藤理史, 宇津呂武仁
    • 雑誌名

      言語処理学会第12回年次大会発表論文集

      ページ: 388-391

    • NAID

      110007380383

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] ウェブと要素合成法を用いた専門用語訳語推定2006

    • 著者名/発表者名
      外池昌嗣, 佐藤理史, 宇津呂武仁
    • 雑誌名

      言語処理学会第12回年次大会発表論文集

      ページ: 412-415

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] 対訳辞書とウェブを利用した専門文書中の用語の訳語推定2006

    • 著者名/発表者名
      馬場康夫, 外池昌嗣, 佐藤理史, 宇津呂武仁
    • 雑誌名

      言語処理学会第12回年次大会発表論文集

      ページ: 416-419

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] 日英関連報道記事を用いた訳語対応推定2005

    • 著者名/発表者名
      宇津呂武仁, 日野浩平, 堀内貴司, 中川聖一
    • 雑誌名

      自然言語処理(言語処理学会論文誌) 12・5

      ページ: 43-69

    • NAID

      40007011332

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Effect of Domain-Specific Corpus in Compositional Translation Estimation for Technical Terms,2005

    • 著者名/発表者名
      Masatugu Tonoike, Mitsuhiro Kida, Toshihiro Takagi, Yasuhiro Sasaki, Takehito Utsuro, Satoshi Sato
    • 雑誌名

      Proceedings of the 2nd International Joint Conference on Natural Language Processing, Companion Volume

      ページ: 116-121

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] ウェブを利用した専門用語対訳集自動生成のための訳語候補収集2005

    • 著者名/発表者名
      高木俊宏, 木田充洋, 外池昌嗣, 佐々木靖弘, 日野浩平, 宇津呂武仁, 佐藤理史
    • 雑誌名

      言語処理学会第11回年次大会発表論文集

      ページ: 13-16

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] 要素合成法を用いた専門用語の訳語候補生成・検証2005

    • 著者名/発表者名
      外池昌嗣, 木田充洋, 高木俊宏, 宇津呂武仁, 佐藤理史
    • 雑誌名

      言語処理学会第11回年次大会発表論文集

      ページ: 17-20

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] ウェブからの関連語収集手法を用いた専門用語の訳語推定2005

    • 著者名/発表者名
      日野浩平, 佐々木靖弘, 宇津呂武仁, 土屋雅稔, 中川聖一, 佐藤理史
    • 雑誌名

      言語処理学会第11回年次大会発表論文集

      ページ: 21-24

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Automatic Collection of Related Terms in French2005

    • 著者名/発表者名
      Xavier Robitaille, Satoshi Sato, Takehito Utsuro
    • 雑誌名

      言語処理学会第11回年次大会発表論文集

      ページ: 891-894

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] ウェブを利用した専門用語集の自動編集2005

    • 著者名/発表者名
      佐々木靖弘, 佐藤理史, 宇津呂武仁
    • 雑誌名

      言語処理学会第11回年次大会発表論文集

      ページ: 895-898

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] 日英報道記事からの訳語対応推定:ターム頻度と訳語対応推定性能の相関の評価2004

    • 著者名/発表者名
      日野浩平, 宇津呂武仁, 中川聖一
    • 雑誌名

      情報処理学会研究報告,2004-NL-162 2004・73

      ページ: 57-63

    • NAID

      110002911728

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] 日英二言語文書を用いた対訳対応推定:ウェブ上の非対訳文書を用いた訳語候補順位付け2004

    • 著者名/発表者名
      木田充洋, 宇津呂武仁, 日野浩平, 佐藤理史
    • 雑誌名

      情報処理学会研究報告,2004-NL-162 2004・73

      ページ: 65-70

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Integrating Cross-Lingually Relevant News Articles and Monolingual Web Documents in Bilingual Lexicon Acquisition2004

    • 著者名/発表者名
      Takehito Utsuro, Kohei Hino, Mitsuhiro Kida, Seiichi Nakagawa, Satoshi Sato
    • 雑誌名

      Proceedings of the 20th International Conference on Computational Linguistics

      ページ: 1036-1042

    • 関連する報告書
      2004 実績報告書

URL: 

公開日: 2004-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi