• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2010 Fiscal Year Annual Research Report

非文法的かつ断片化したテキストからの情報抽出に関する研究

Research Project

Project/Area Number 20680006
Research InstitutionThe University of Tokyo

Principal Investigator

荒牧 英治  東京大学, 知の構造化センター, 特任講師 (70401073)

Keywords言語処理 / 医療情報 / テキストマイニング / 知識処理
Research Abstract

本提案の最終目的は,従来とは異なる性質(非文法的・断片化)をもつカルテ文章から「いつ何が起こったのか」という情報を抽出することであり,このための基礎データとして,カルテデータ中のあらゆる事象表現(サ変名詞,動詞)と時間表現のアノテーションを行った.アノテーション指針を決めるのは時間・コストのかかる作業であるが,これには,時間・事象表現のアノテーション枠組みであるTIMEML[Sauri2006]のサブセットを用い,議論の時間を軽減するとともに,既存のリソースとの交換性を高めた.また,疾患名のアノテーションは医学知識(診療情報技師相当)が必要であるため,医師,看護師を含む医療者に一部の作業を依頼し,専門的に妥当なデータを構築した.約2年に渡るデータ構築の結果,本データは精神科,産婦人科を除外したほぼ全診療科をカバーした約680文書となった.これは国内の医療文章のアノテーションとしては最大規模のものである.また,一部のデータは,仮想の患者を想定しているため,倫理的問題に配慮することなく公開可能なデータとなっている.このデータを用いれば,医療文章からの用語抽出をはじめとした多くのアプリケーションが将来的に可能となる.最終年度では,構築したデータの公開を行い,また,実用例として本データを用いた検索システムを構築し,2つの学会(日本内科学会,日本循環器学会)に提供を行った.また,国際会議での発表を含む多数の会議/学会にて発表を行い成果普及に務めた.

  • Research Products

    (7 results)

All 2011 2010 Other

All Journal Article (5 results) (of which Peer Reviewed: 5 results) Presentation (1 results) Remarks (1 results)

  • [Journal Article] WikipediaとWebの情報を組み合わせたオントロジ構築の試み2011

    • Author(s)
      白川真澄, 中山浩太郎, 荒牧英治, 原隆浩, 西尾章治郎
    • Journal Title

      電子情報通信学会和文論文誌

      Volume: No.3 Pages: 525-539

    • Peer Reviewed
  • [Journal Article] Exacting content holes by comparing community-type content with Wikipedia2010

    • Author(s)
      Akiyo Nadamoto, Eiji Aramaki, Takeshi Abekawa, Yohei Murakami
    • Journal Title

      nternational Journal of Web Information Systems

      Volume: Vol6(3) Pages: 248-260

    • Peer Reviewed
  • [Journal Article] 格助詞付きWeb検索クエリを用いた関連のある概念間の関係抽出2010

    • Author(s)
      白川真澄, 中山浩太郎, 荒牧英治, 原隆浩, 西尾章治郎
    • Journal Title

      日本データベース学会論文誌(DBSJ)

      Volume: Vol.9, No.1 Pages: 35-40

    • Peer Reviewed
  • [Journal Article] The Internal Structure of a Disease Name and its Application for ICD Coding2010

    • Author(s)
      Emiko Yamada, Eiji Aramaki, Takeshi Imai, Kazuhiko Ohe
    • Journal Title

      tud Health Technol Inform.2010

      Pages: 1010-1014

    • Peer Reviewed
  • [Journal Article] Extraction of Adverse Drug Effects from Clinical Records2010

    • Author(s)
      Eiji Aramaki, Yasuhide Miura, Masatsugu Tonoike, Tomoko Ohkuma, Hiroshi Mashuichi, Kayo Waki, Kazuhiko Ohe
    • Journal Title

      Stud Health Technol Inform.2010

      Pages: 739-743

    • Peer Reviewed
  • [Presentation] Adverse-Effect Relations Extraction from Massive Clinical Records2010

    • Author(s)
      Yasuhide Miura, Eiji Aramaki, Tomoko Ohkuma, Masatsugu Tonoike, Daigo Sugihara, Hiroshi Masuichi, Kazuhiko Ohe
    • Organizer
      COLING 2010 Workshop (In cooperation with Info-plosion) The Second International Workshop on NLP Challenges in the Information Explosion Era (NLPIX2010)
    • Place of Presentation
      Beijing, China
    • Year and Date
      2010-06-21
  • [Remarks]

    • URL

      http://mednlp.jp

URL: 

Published: 2012-07-19  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi