研究課題/領域番号 |
16016249
|
研究種目 |
特定領域研究
|
配分区分 | 補助金 |
審査区分 |
理工系
|
研究機関 | 名古屋大学 (2005) 京都大学 (2004) |
研究代表者 |
佐藤 理史 名古屋大学, 大学院・工学研究科, 教授 (30205918)
|
研究分担者 |
宇津呂 武仁 京都大学, 大学院・情報学研究, 講師 (90263433)
|
研究期間 (年度) |
2004 – 2005
|
研究課題ステータス |
完了 (2005年度)
|
配分額 *注記 |
8,700千円 (直接経費: 8,700千円)
2005年度: 4,400千円 (直接経費: 4,400千円)
2004年度: 4,300千円 (直接経費: 4,300千円)
|
キーワード | 専門用語集 / 自動編集 / 対訳用語集 / 訳語推定 / ウェブ / 関連用語 / 専門的用語抽出 |
研究概要 |
本研究では、実世界を投影した語彙空間をウェブから作成する方法論を確立することを目的として、特定の分野やトピックの語彙を収集する技術と、用語間の関連および対訳関係を推定する技術を研究した。本年度は、次の成果を得た。 (1)関連用語の自動収集 昨年度作成した関連用語自動収集システムに対し、参照セットと名付けた評価用セットを用いた性能評価を行なうとともに、主観的評価も併せて行なった。参照セットを用いた評価では、1つの用語から収集される関連用語上位20語のうち、平均10語が正しい関連用語と判定された。一方、主観的評価では、平均16語が正しい関連用語と判定された。これらの評価により、本システムが有効に機能していることが確認できた。 (2)日仏対訳用語集の自動生成 上記のシステムと用語集間の対応関係を推定する技術を組みあわせて、1組の日仏訳語対から、それらに関連する対訳用語集を自動生成することを実現した。1組の訳語対から、20組強の訳語対が得られ、そのうち、約80%が、正しい訳語対であった。 (3)日英対訳用語集の自動生成 特定の分野の用語集(単言語)を翻訳する技術を開発した。まず、対訳辞書を引き、用語を、辞書に訳語が載っているものと訳語が不明なものに分ける。得られた訳語を利用して、目標言語側の分野コーパスを作成する。一方、訳語が不明なものに対しては、要素合成法を用いて訳語候補を生成し、作成した分野コーパスを用いて適切な訳語を決定する。
|