• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

臨床医療コーパスの構築に関する研究

Research Project

Project/Area Number 18700133
Research Category

Grant-in-Aid for Young Scientists (B)

Allocation TypeSingle-year Grants
Research Field Intelligent informatics
Research InstitutionThe University of Tokyo

Principal Investigator

荒牧 英治  The University of Tokyo, 医学部・附属病院, 特任助教 (70401073)

Project Period (FY) 2006 – 2008
Project Status Completed (Fiscal Year 2007)
Budget Amount *help
¥2,000,000 (Direct Cost: ¥2,000,000)
Fiscal Year 2007: ¥900,000 (Direct Cost: ¥900,000)
Fiscal Year 2006: ¥1,100,000 (Direct Cost: ¥1,100,000)
Keywords情報工学 / 自然言語処理 / 情報システム / 機械学習 / 医療・福祉 / 人工知能
Research Abstract

申請者等は,臨床医学分野の知識ベースの構築を目指している.ここでいう知識ベースとは,主要な医療用語とそれらの関係を記述したデータベースであり,主要な疾患に対して,その発生部位,治療や薬剤などの情報を保持するものである.このような知識ベースが利用可能となれば,不適切な治療や投薬に対して警告を発する次世代の電子カルテや,綿密な医療統計データの集計が可能となり,医療ミスの軽減や,正確かつ大規模なデータ分析が実現可能となる.このため,医療情報処理分野では,知識ベースの構築が急がれている.このような背景のもと,本研究では,大量に存在する電子テキストを利用して,知識ベースを自動構築する研究を行った.申請者等は,まず,(1)教師なし学習アプローチを行い,用語の上位/下位関係や用語の分類について,有望な精度で,これらを抽出した.しかし,疾患とその治療法など,より詳細な情報に関しては,十分な精度を得ることはできなかった.次に,(2)医療テキスト(医学辞書200文,電子カルテ300文章)に対して疾患とその治療法など臨床医療知識をアノテートし,そこから機械学習を行った.この結果,日付表現や薬品などいくつかのカテゴリについては90%を超える高い精度で推定が可能となったが,症状や検査値解釈など,語よりも長い句や文の表現される知識については,不十分な精度しか得られなかった.現在は,アノテーション有りのデータと大量に存在するアノテーション無しのデータの両者を組み合わせ,現実的な精度を得るための研究を継続中である.

Report

(2 results)
  • 2007 Annual Research Report
  • 2006 Annual Research Report
  • Research Products

    (13 results)

All 2008 2007 2006

All Journal Article (9 results) (of which Peer Reviewed: 2 results) Presentation (4 results)

  • [Journal Article] 情報検索尺度Okapi-BM25と交換可能語ペアを用いた自動ICDコーディングに関する研究2007

    • Author(s)
      荒牧英治, 今井健, 梶野正幸, 美代賢吾, 大江和彦
    • Journal Title

      医療情報学 27-1

      Pages: 101-107

    • NAID

      10022604900

    • Related Report
      2007 Annual Research Report
    • Peer Reviewed
  • [Journal Article] 自然言語処理によるオントロジー構築支援の試みとその問題点2007

    • Author(s)
      荒牧英治, 今井健, 梶野正幸, 美代賢吾, 大江和彦
    • Journal Title

      言語的オントロジーの構築・連携・利用(言語処理学会第13回年次大会併設ワークショップ)

      Pages: 51-54

    • Related Report
      2006 Annual Research Report
  • [Journal Article] 非文法的かつ断片化されたテキストからの頑健な情報抽出2007

    • Author(s)
      荒牧英治, 今井健, 美代賢吾, 大江和彦
    • Journal Title

      言語処理学会第13回年次大会

      Pages: 570-573

    • Related Report
      2006 Annual Research Report
  • [Journal Article] 医学辞書を用いた用語間関係の自動抽出手法と用語の自動分類手法に関する研究2006

    • Author(s)
      荒牧英治, 今井健, 梶野正幸, 美代賢吾, 大江和彦
    • Journal Title

      医療情報学 25-6

      Pages: 463-474

    • NAID

      10022604285

    • Related Report
      2007 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Automatic Deidentification by using Sentence Features and Label Consistency2006

    • Author(s)
      Eiji Aramaki, Takeshi Imai, Kengo Miyo, Kazuhiko Ohe
    • Journal Title

      Workshop on Challenges in Natural Language Processing for Clinical Data

    • Related Report
      2006 Annual Research Report
  • [Journal Article] Patient Status Classification by using Rule based Sentence Extraction and BM25-kNN based Classifier2006

    • Author(s)
      Eiji Aramaki, Takeshi Imai, Kengo Miyo, Kazuhiko Ohe
    • Journal Title

      Workshop on Challenges in Natural Language Processing for Clinical Data

    • Related Report
      2006 Annual Research Report
  • [Journal Article] 医学辞書を用いた用語間関係の自動抽出手法と用語の自動分類手法に関する研究2006

    • Author(s)
      荒牧英治, 今井健, 梶野正幸, 美代賢吾, 大江和彦
    • Journal Title

      医療情報学 25・6

      Pages: 463-474

    • NAID

      10022604285

    • Related Report
      2006 Annual Research Report
  • [Journal Article] メタ関係を利用したテキストからの人体部位関係の抽出2006

    • Author(s)
      荒牧英治, 今井健, 梶野正幸, 美代賢吾, 大江和彦
    • Journal Title

      言語処理学会第12回年次大会

      Pages: 508-511

    • Related Report
      2006 Annual Research Report
  • [Journal Article] i2b2-NLPシェアードタスク・ワークショップに参加して2006

    • Author(s)
      荒牧英治
    • Journal Title

      医療情報学 26・6

      Pages: 395-399

    • NAID

      10022604774

    • Related Report
      2006 Annual Research Report
  • [Presentation] Orthographic Disambiguation Incorporating Transliterated Probability2008

    • Author(s)
      Eiji Aramaki, Takeshi Imai, Kengo Miyo, Kazuhiko Ohe
    • Organizer
      International Joint Conference on Natural Language Processing (I JCNLP2008)
    • Place of Presentation
      India
    • Related Report
      2007 Annual Research Report
  • [Presentation] Support Vector Machine Based Orthographic Disambiguation2007

    • Author(s)
      Eiji Aramaki, Takeshi Imai, Kengo Miyo, Kazuhiko Ohe
    • Organizer
      The Conference on Theoretical and Method ological Issues in Machine Translation (TMI2007)
    • Place of Presentation
      Sweden
    • Related Report
      2007 Annual Research Report
  • [Presentation] UTH: Semantic Relation Classification using Physical Sizes2007

    • Author(s)
      Eiji Aramaki, Takeshi Imai, Kengo Miyo, Kazuhiko Ohe
    • Organizer
      the Association for Computational Lingu istics (ACL2007) Workshop on Semantic Evaluations (SemEval 2007)
    • Place of Presentation
      Czech
    • Related Report
      2007 Annual Research Report
  • [Presentation] A Statistical Selector of the Best among Multiple ICD-coding Methods2007

    • Author(s)
      Eiji Aramaki, Takeshi Imai, Masayuki Kajino, Kengo Miyo, Kazuhiko Ohe
    • Organizer
      Medinfo
    • Place of Presentation
      Australia
    • Related Report
      2007 Annual Research Report

URL: 

Published: 2006-04-01   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi