• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2011 Fiscal Year Annual Research Report

分野認知レベルに適した検索のための専門度付専門用語シソーラスの構築

Research Project

Project/Area Number 22500226
Research InstitutionNational Institute of Informatics

Principal Investigator

内山 清子  国立情報学研究所, コンテンツシステム開発室, 特任研究員 (20458970)

Keywords専門用語 / 分野基礎性 / C-Value
Research Abstract

平成23年度は、専門用語の分野基礎性の指標を再度検討した。これまで分析対象を論文と新聞としていたが、書籍情報が分野基礎性の指標として適していることがわかったため、データとして書籍の目次情報の追加作業を行った。対象分野は「自然言語処理」とし、書籍のタイトルに「自然言語処理」と記述されている書籍の目次と、情報処理学会の自然言語処理研究会の1993年から2007年までの論文の抄録、タイトル、著者、著者キーワードと全文データを分析対象データとした。前年度の分析結果から、C-Valueによる指標を用いることとした。C-Valueで計算した結果を上位100から500まで出力し、正解率を比較した。正解データは、あらかじめ専門家によって、N1:最も重要で必須である用語~N4:専門的で高度な難解専門用語までの4段階に分けて作成した。対象データをタイトルに含まれる用語の頻度、著者キーワードに出現する用語の頻度そして書籍の目次に出現する用語の頻度の3種類を用意し、それぞれについてC-Valueで計算を行った。その結果、N1の最も分野基礎性が高い用語の抽出は、書籍の目次データを利用するのと精度が高いことがわかった。また上位300語まで抽出してみると、著者キーワードを利用した方が抽出精度が高いことがわかった。この結果から書籍は一般向けに書かれているため、基礎的な用語を用いる傾向が高いが、更に専門的な用語の掲載は著者に依存するので、広い範囲の分野基礎用語を抽出するのには適切ではないと考えられる。今後は本文データの論理構造に着目した分析を行う予定である。

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

対象とするテキストの範囲を広げたことによって、有益な情報を得ることができた。

Strategy for Future Research Activity

論文本文の構造に着目した研究を更に進めることによって、異なった視点による分野基礎性の基準が明確になることが期待できる。

Research Products

(5 results)

All 2012 2011

All Journal Article Book

  • [Journal Article] CiNiiデータベースを用いた研究動向分析システムの構築2012

    • Author(s)
      福田悟志,難波英嗣,竹澤寿幸,武田英明,相澤彰子,大向一輝,宮尾祐介,内山清子
    • Journal Title

      言語処理学会第18回年次大会発表論文集

      Volume: - Pages: 539-542

  • [Journal Article] A Study for Identifying Domain-Specific Introductory Terms in Research Papers2011

    • Author(s)
      Kiyoko Uchiyama
    • Journal Title

      Proceeding of the 9th International conference on Terminology and Artificial Intelligence

      Volume: 1 Pages: 147-150

    • Peer Reviewed
  • [Journal Article] オススメ論文検索システム:OSUSUME2011

    • Author(s)
      内山清子、高須淳宏、相澤彰子、難波英嗣、宮尾祐介
    • Journal Title

      第25回人工知能学会全国大会

      Volume: 1 Pages: 1-4

  • [Journal Article] 論文中の引用文における構文パターンを用いた論文・概念間の関係抽出2011

    • Author(s)
      亀田尭宙, 内山清子, 宮尾祐介, 武田 英明,相澤彰子
    • Journal Title

      人工知能学会知識ベースシステム研究会資料

      Volume: 94 Pages: 25-31

  • [Book] 言語と情報科学2011

    • Author(s)
      松本裕治編集、第3章、相澤彰子、内山清子
    • Total Pages
      216
    • Publisher
      朝倉書店

URL: 

Published: 2014-07-24  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi