• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

Webテキストとサーチエンジンに基づく同義語・訳語提示システムの構築

研究課題

研究課題/領域番号 17700261
研究種目

若手研究(B)

配分区分補助金
研究分野 情報図書館学・人文社会情報学
研究機関筑波大学

研究代表者

辻 慶太  筑波大学, 大学院図書館情報メディア研究科, 助教授 (30333545)

研究期間 (年度) 2005 – 2006
研究課題ステータス 完了 (2006年度)
配分額 *注記
1,000千円 (直接経費: 1,000千円)
2006年度: 500千円 (直接経費: 500千円)
2005年度: 500千円 (直接経費: 500千円)
キーワード同義語 / 訳語 / 翻字 / サーチエンジン / 検索エンジン / Web / 自動抽出 / 複合語 / 辞書
研究概要

本研究では,次の3つを行った。即ち,(a)既存の辞書や翻字パターンに基づいて,同義語・訳語候補を効果的に生成する手法を開発する。例えば英語複合語においては語尾を適宜形容詞形に変える処理の有効性を検証する,あるいは効果的な翻字パターンを同定するといった研究を行う。これらはいわばルールベースによる候補生成研究と言える。(b)Webから特定の文章表現に基づいて同義語・訳語を抽出する手法を開発する。具体的には,辞書が挙げる同義語・訳語の対をそれぞれサーチエンジンで検索し,Webで同義語や訳語が現れている文章表現を調べ,「別名」「略称」といったそれぞれの抽出に有用な特徴的表現を把握する。さらに得られた表現を利用することで,Webからどの程度同義語・訳語が抽出できるかを調査する。(a)に対してこちらは,実際に存在する語を候補とする研究と言える。(c)(a)の辞書・翻字パターンに基づいて得られた候補語と,(b)の文章表現に基づいて得られた候補語とをサーチエンジンに送ることで,適切な同義語・訳語を絞り込む手法を検討する。
本研究の結果,上に挙げた手法・アイデアのいくつかはある程度有効ではあったが,先行研究を上回るようなパフォーマンスを得ることはできなかった。同義語が互いに結びついて存在しているWebページでは,結びつきを示す言語表現としてサンプルの犬半を占めるのは括弧("("や")"など)であり,これら括弧は既存のサーチエンジンでは検索できないという点で,Webからの同義語抽出にはあまり役に立たないことが分かった。

報告書

(2件)
  • 2006 実績報告書
  • 2005 実績報告書

URL: 

公開日: 2005-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi