• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2013 Fiscal Year Annual Research Report

語彙データベースと大規模コーパスに基づく意味クラス推定器の開発

Research Project

Project/Area Number 23700159
Research InstitutionTohoku University

Principal Investigator

岡崎 直観  東北大学, 情報科学研究科, 准教授 (50601118)

Keywords固有表現抽出 / 情報抽出 / 自然言語処理 / 機械学習
Research Abstract

本研究の目的は,テキストから特定の意味クラスに属する概念・実体の表現(例えば製品名や病名など)を抽出するプログラム(意味クラス推定器)を,低コストで開発することである.この目的の達成のため,①意味クラスが付与された訓練データの自動獲得,②自動獲得された訓練データからの意味クラス推定器の構築,③意味クラス推定器の性能評価,の3つの研究項目を設定していた.平成24年度までに,項目①②③の研究を進めた.
平成24年度後半に,既存の辞書とラベル付けされていないテキストコーパスから,認識したい意味クラスの表現の周辺文脈を自動的に獲得する研究を進めた.辞書から学習データを自動的に獲得する平成24年度までの研究内容に対し,本手法は,辞書から意味クラスの周辺に頻出するパターンを自動的に獲得するものである.本手法は,意味クラスタガー構築における辞書の活用方法の新しいアイディアであり,実験により意味クラスタガーの性能が向上することを確認できた.その内容を論文にまとめ,データマイニングと知識処理に関する国際会議に投稿し,受理された.この段階(平成24年度末)で本研究をまとめる作業の殆どは完了していたが,この国際会議の開催日は平成25年度頭(平成25年4月15日)であったため,出張旅費を拠出するために研究機関を1年間延長した.平成25年度は,評価データの整備や,その整備のためのソフトウェア開発を進めながら,国際会議やジャーナル論文で研究成果を発表した.

  • Research Products

    (4 results)

All 2013

All Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (2 results)

  • [Journal Article] Named entity recognition with multiple segment representations2013

    • Author(s)
      Han-Cheol Cho, Naoaki Okazaki, Makoto Miwa, Jun'ichi Tsujii
    • Journal Title

      Information Processing & Management

      Volume: Vol.49, No.4 Pages: 954-965

    • DOI

      10.1016/j.ipm.2013.03.002

    • Peer Reviewed
  • [Journal Article] カテゴリ間の兄弟関係を活用した集合拡張2013

    • Author(s)
      高瀬翔, 岡崎直観, 乾健太郎
    • Journal Title

      自然言語処理

      Volume: Vol.20, No.2 Pages: 273-296

    • DOI

      10.5715/jnlp.20.273

    • Peer Reviewed
  • [Presentation] ウェブ文書の構造を利用した場所名・住所ペアの獲得2013

    • Author(s)
      佐藤貴大, 岡崎直観, 乾健太郎
    • Organizer
      第27回人工知能学会全国大会
    • Place of Presentation
      富山国際会議場
    • Year and Date
      20130604-20130607
  • [Presentation] Inducing Context Gazetteers from Encyclopedic Database for Named Entity Recognition2013

    • Author(s)
      Han-Cheol Cho, Naoaki Okazaki, Kentaro Inui
    • Organizer
      17th Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD 2013)
    • Place of Presentation
      Surfers Paradise Marriott, Gold Coast, Australia
    • Year and Date
      20130414-20130417

URL: 

Published: 2015-05-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi