• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

ワールドワイドウェブからの用語説明の自動抽出

Research Project

Project/Area Number 12878058
Research Category

Grant-in-Aid for Exploratory Research

Allocation TypeSingle-year Grants
Research Field Intelligent informatics
Research InstitutionKyoto University

Principal Investigator

佐藤 理史  京都大学, 情報学研究科, 助教授 (30205918)

Project Period (FY) 2000 – 2001
Project Status Completed (Fiscal Year 2001)
Budget Amount *help
¥2,100,000 (Direct Cost: ¥2,100,000)
Fiscal Year 2001: ¥1,000,000 (Direct Cost: ¥1,000,000)
Fiscal Year 2000: ¥1,100,000 (Direct Cost: ¥1,100,000)
Keywords用語定義文 / ワールドワイドウェブ / 定義文抽出 / 自動編集 / 用語定義 / 情報抽出 / サーチエンジン / World Wide Web
Research Abstract

本研究の目的は、与えられた用語に対して、(1)その用語が説明されているウェブページを見つけ出し、(2)そのページから用語の説明だけを抜き出し、(3)それらを整理して提示するシステムを実現することである。昨年度の研究で、プロトタイプシステムを実現することができたので、今年度は、各部の改良と調整を行なった。
【a.ペ-ジ収集の改良】
これまではページ収集にGooとInfoseekを利用していたが、これに加えてLycosを利用し、収集するページを増やした。
【b.用語説明の抽出】
これまでは、形態素解析結果に基づき用語を定義する文(用語定義文)を判定し、用語を説明する段落(用語説明)を抽出していた。文を構文解析し、その結果に基づき定義文を判定するプログラムを作成し、この部分の改良を試みたが、結果は芳しくなかった。
【c.用語説明のグループ化】
プログラムの一部を変更し、グループ化モジュールの高速化を実現した。
2年間の研究により、ウェブを仮想的な辞書・辞典化することができることを実証した。これにより、当初の目的を達成できたと考える。しかしながら、精度(品質)と速度については、さらなる改善が必要である。
なお、本システムのアーキテクチャが他の言語に対しても有効であることを実証するために、英語に対してほぼ同様のシステムを実現し、動作することを確認した。

Report

(2 results)
  • 2001 Annual Research Report
  • 2000 Annual Research Report
  • Research Products

    (3 results)

All Other

All Publications (3 results)

  • [Publications] 佐藤理史, 佐藤円: "情報の自動編集とWITプロジェクト"電子図書館-デジタル情報の流通と図書館の未来(日本図書館情報学研究委員会編、勉誠出版). 131-149 (2002)

    • Related Report
      2001 Annual Research Report
  • [Publications] 桜井裕,佐藤理史: "ワールドワイドウェブを利用した用語検索"情報処理学会研究報告(自然言語処理研究会NL-137). 2000・53. 23-29 (2000)

    • Related Report
      2000 Annual Research Report
  • [Publications] Satoshi Sato: "Automated Editing of Hypertext Resume from the World Wide Web"Proc.of 2001 Symposium on Applications and the Internet (SAINT-01). 15-22 (2001)

    • Related Report
      2000 Annual Research Report

URL: 

Published: 2000-04-01   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi