• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2004 Fiscal Year Annual Research Report

実世界の関連性を投影した語彙空間の構築

Research Project

Project/Area Number 16016249
Research InstitutionKyoto University

Principal Investigator

佐藤 理史  京都大学, 情報学研究科, 助教授 (30205918)

Co-Investigator(Kenkyū-buntansha) 宇津呂 武仁  京都大学, 情報学研究科, 講師 (90263433)
Keywords専門用語集 / 自動編集 / 対訳用語集 / 専門的用語抽出 / 訳語推定 / ウェブ / 関連用語
Research Abstract

本研究では、ウェブから、実世界を投影した語彙空間を作成する方法論を確立することを目的として、特定の分野・トピック・タイプの語彙を収集する技術と、用語間の関係を推定する技術を研究している。本年度は、用語集の自動編集に必要な関連用語収集法と、対訳用語集の自動編集に必要な訳語推定法に関して成果を得た。
(1)用語集の自動編集
与えられた用語から、それに関連する用語をウェブから自動収集する技術を開発した。この技術は、サーチエンジンを用いて特定の分野のコーパスを作成し、そこから関連用語の候補語を抽出し、最後に、ウェブのヒット数に基づく関連度指標によって、関連用語を決定する。日本語を対象としたシステムの他に、フランス語を対象としたシステムも実装した。日本語のシステムは、約30語程度、フランス語のシステムでは、約15語程度の関連用語を85%から90%の精度で収集することができる。これらの用語集合を更に拡大する方法と、そとから、最終的に用語集の見出し語集合を決定する方法についても、検討を行なった。
(2)対訳用語集の自動編集
単言語の用語集が与えられた時、それぞれの用語の訳を推定して、対訳用語集を作成する枠組を提案した。この枠組では、まず、既存の辞書を利用して、いくつかの用語の訳語を決定し、それらの訳語を手がかりに、相手側言語でコーパスを作成する。要素合成法によって候補を生成できる用語に対しては、このコーパスを用いて、正しい訳を決定する。要素合成法で候補が作成できない場合は、文脈ベクトルを用いた訳語推定を適用する。本年度は、この枠組みの実現に必要な要素技術の開発とそれらの実験的検証を行なった。現時点で達成できている精度は高くないが、専門用語の翻訳対の約80%は、要素間に対応がとれるため、このような枠組みは有望と考えられる。

  • Research Products

    (11 results)

All 2005 2004 Other

All Journal Article (11 results)

  • [Journal Article] ウェブを利用した専門用語対訳集自動生成のための訳語候補収集2005

    • Author(s)
      高木俊宏, 木田充洋, 外池昌嗣, 佐々木靖弘, 日野浩平, 宇津呂武仁, 佐藤理史
    • Journal Title

      言語処理学会第11回年次大会発表論文集

      Pages: 13-16

  • [Journal Article] ウェブからの関連語収集手法を用いた専門用語の訳語推定2005

    • Author(s)
      日野浩平, 佐々木靖弘, 宇津呂武仁, 土屋雅稔, 中川聖一, 佐藤理史
    • Journal Title

      言語処理学会第11回年次大会発表論文集

      Pages: 21-24

  • [Journal Article] 対訳人名検索における翻字・サーチエンジンの有効性評価2005

    • Author(s)
      辻慶太, 佐藤理史, 影浦峡
    • Journal Title

      言語処理学会第11回年次大会発表論文集

      Pages: 352-355

  • [Journal Article] Automatic Collection of Related Terms in French2005

    • Author(s)
      Xavier Robitaille, Satoshi Sato, Takehito Utsuro
    • Journal Title

      言語処理学会第11回年次大会発表論文集

      Pages: 891-894

  • [Journal Article] ウェブを利用した専門用語集の自動編集2005

    • Author(s)
      佐々木靖弘, 佐藤理史, 宇津呂武仁
    • Journal Title

      言語処理学会第11回年次大会発表論文集

      Pages: 895-898

  • [Journal Article] 日英報道記事からの訳語対応推定:ターム頻度と訳語対応推定性能の相関の評価2004

    • Author(s)
      日野浩平, 宇津呂武仁, 中川聖
    • Journal Title

      情報処理学会研究報告,2004-NL-162 2004・73

      Pages: 57-63

  • [Journal Article] 日英二言語文書を用いた対訳対応推定:ウェブの非対訳文書を用いた訳語候補順位付け2004

    • Author(s)
      木田充洋, 宇津呂武仁, 日野浩平, 佐藤理史
    • Journal Title

      情報処理学会研究報告,2004-NL-162 2004・73

      Pages: 65-70

  • [Journal Article] Integrating Cross-Lingually Relevant News Articles and Monolingual Web Documents in Bilingual Lexicon Acquisition2004

    • Author(s)
      Takehito Utsuro, Kohei Hino, Mitsuhiro Kida, Seiichi Nakagawa, Satoshi Sato
    • Journal Title

      Proceedings of the 20th International Conference on Computational Linguistics 1036-1042

      Pages: 1036-1042

  • [Journal Article] 境界認定の提案:(1)コンセプトと実現法2004

    • Author(s)
      佐藤理史
    • Journal Title

      情報処理学会研究報告,2004-NL-164 2004・108

      Pages: 25-32

  • [Journal Article] 境界認定の提案:(2)背景と思想2004

    • Author(s)
      佐藤理史
    • Journal Title

      情報処理学会研究報告,2004-NL-164 2004・108

      Pages: 33-40

  • [Journal Article] 要素合成法を用いた専門用語の訳語候補生成・検証

    • Author(s)
      外池昌嗣, 木田充洋, 高木俊宏, 宇津呂武仁, 佐藤理史
    • Journal Title

      言語処理学会第11回年次大会発表論文集

      Pages: 17-20

URL: 

Published: 2006-07-12   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi