研究課題
本研究では、実世界を投影した語彙空間をウェブから作成する方法論を確立することを目的として、特定の分野やトピックの語彙を収集する技術と、用語間の関連および対訳関係を推定する技術を研究した。本年度は、次の成果を得た。(1)関連用語の自動収集昨年度作成した関連用語自動収集システムに対し、参照セットと名付けた評価用セットを用いた性能評価を行なうとともに、主観的評価も併せて行なった。参照セットを用いた評価では、1つの用語から収集される関連用語上位20語のうち、平均10語が正しい関連用語と判定された。一方、主観的評価では、平均16語が正しい関連用語と判定された。これらの評価により、本システムが有効に機能していることが確認できた。(2)日仏対訳用語集の自動生成上記のシステムと用語集間の対応関係を推定する技術を組みあわせて、1組の日仏訳語対から、それらに関連する対訳用語集を自動生成することを実現した。1組の訳語対から、20組強の訳語対が得られ、そのうち、約80%が、正しい訳語対であった。(3)日英対訳用語集の自動生成特定の分野の用語集(単言語)を翻訳する技術を開発した。まず、対訳辞書を引き、用語を、辞書に訳語が載っているものと訳語が不明なものに分ける。得られた訳語を利用して、目標言語側の分野コーパスを作成する。一方、訳語が不明なものに対しては、要素合成法を用いて訳語候補を生成し、作成した分野コーパスを用いて適切な訳語を決定する。
すべて 2006 2005
すべて 雑誌論文 (6件)
Proceedings of the 11^<th> Conference of European Chapter of the Association for Computational Linguistic
言語処理学会第12回年次大会発表論文集
ページ: 412-415
ページ: 388-391
自然言語処理 12・5
ページ: 3-42
Proceedings of the Pacific Association for Computational Linguistics
ページ: 325-331
Proceedings of the 2nd International Joint Conference on Natural Language Processing Companion Volume
ページ: 116-121