• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2001 Fiscal Year Annual Research Report

ワールドワイドウェブからの用語説明の自動抽出

Research Project

Project/Area Number 12878058
Research InstitutionKyoto University

Principal Investigator

佐藤 理史  京都大学, 情報学研究科, 助教授 (30205918)

Keywords用語定義文 / ワールドワイドウェブ / 定義文抽出 / 自動編集
Research Abstract

本研究の目的は、与えられた用語に対して、(1)その用語が説明されているウェブページを見つけ出し、(2)そのページから用語の説明だけを抜き出し、(3)それらを整理して提示するシステムを実現することである。昨年度の研究で、プロトタイプシステムを実現することができたので、今年度は、各部の改良と調整を行なった。
【a.ペ-ジ収集の改良】
これまではページ収集にGooとInfoseekを利用していたが、これに加えてLycosを利用し、収集するページを増やした。
【b.用語説明の抽出】
これまでは、形態素解析結果に基づき用語を定義する文(用語定義文)を判定し、用語を説明する段落(用語説明)を抽出していた。文を構文解析し、その結果に基づき定義文を判定するプログラムを作成し、この部分の改良を試みたが、結果は芳しくなかった。
【c.用語説明のグループ化】
プログラムの一部を変更し、グループ化モジュールの高速化を実現した。
2年間の研究により、ウェブを仮想的な辞書・辞典化することができることを実証した。これにより、当初の目的を達成できたと考える。しかしながら、精度(品質)と速度については、さらなる改善が必要である。
なお、本システムのアーキテクチャが他の言語に対しても有効であることを実証するために、英語に対してほぼ同様のシステムを実現し、動作することを確認した。

  • Research Products

    (1 results)

All Other

All Publications (1 results)

  • [Publications] 佐藤理史, 佐藤円: "情報の自動編集とWITプロジェクト"電子図書館-デジタル情報の流通と図書館の未来(日本図書館情報学研究委員会編、勉誠出版). 131-149 (2002)

URL: 

Published: 2003-04-03   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi