• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2007 年度 実績報告書

臨床医療コーパスの構築に関する研究

研究課題

研究課題/領域番号 18700133
研究機関東京大学

研究代表者

荒牧 英治  東京大学, 医学部・附属病院, 特任助教 (70401073)

キーワード情報工学
研究概要

申請者等は,臨床医学分野の知識ベースの構築を目指している.ここでいう知識ベースとは,主要な医療用語とそれらの関係を記述したデータベースであり,主要な疾患に対して,その発生部位,治療や薬剤などの情報を保持するものである.このような知識ベースが利用可能となれば,不適切な治療や投薬に対して警告を発する次世代の電子カルテや,綿密な医療統計データの集計が可能となり,医療ミスの軽減や,正確かつ大規模なデータ分析が実現可能となる.このため,医療情報処理分野では,知識ベースの構築が急がれている.このような背景のもと,本研究では,大量に存在する電子テキストを利用して,知識ベースを自動構築する研究を行った.申請者等は,まず,(1)教師なし学習アプローチを行い,用語の上位/下位関係や用語の分類について,有望な精度で,これらを抽出した.しかし,疾患とその治療法など,より詳細な情報に関しては,十分な精度を得ることはできなかった.次に,(2)医療テキスト(医学辞書200文,電子カルテ300文章)に対して疾患とその治療法など臨床医療知識をアノテートし,そこから機械学習を行った.この結果,日付表現や薬品などいくつかのカテゴリについては90%を超える高い精度で推定が可能となったが,症状や検査値解釈など,語よりも長い句や文の表現される知識については,不十分な精度しか得られなかった.現在は,アノテーション有りのデータと大量に存在するアノテーション無しのデータの両者を組み合わせ,現実的な精度を得るための研究を継続中である.

  • 研究成果

    (6件)

すべて 2008 2007 2006

すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (4件)

  • [雑誌論文] 情報検索尺度Okapi-BM25と交換可能語ペアを用いた自動ICDコーディングに関する研究2007

    • 著者名/発表者名
      荒牧英治, 今井健, 梶野正幸, 美代賢吾, 大江和彦
    • 雑誌名

      医療情報学 27-1

      ページ: 101-107

    • 査読あり
  • [雑誌論文] 医学辞書を用いた用語間関係の自動抽出手法と用語の自動分類手法に関する研究2006

    • 著者名/発表者名
      荒牧英治, 今井健, 梶野正幸, 美代賢吾, 大江和彦
    • 雑誌名

      医療情報学 25-6

      ページ: 463-474

    • 査読あり
  • [学会発表] Orthographic Disambiguation Incorporating Transliterated Probability2008

    • 著者名/発表者名
      Eiji Aramaki, Takeshi Imai, Kengo Miyo, Kazuhiko Ohe
    • 学会等名
      International Joint Conference on Natural Language Processing (I JCNLP2008)
    • 発表場所
      India
    • 年月日
      20080400
  • [学会発表] Support Vector Machine Based Orthographic Disambiguation2007

    • 著者名/発表者名
      Eiji Aramaki, Takeshi Imai, Kengo Miyo, Kazuhiko Ohe
    • 学会等名
      The Conference on Theoretical and Method ological Issues in Machine Translation (TMI2007)
    • 発表場所
      Sweden
    • 年月日
      20071100
  • [学会発表] UTH: Semantic Relation Classification using Physical Sizes2007

    • 著者名/発表者名
      Eiji Aramaki, Takeshi Imai, Kengo Miyo, Kazuhiko Ohe
    • 学会等名
      the Association for Computational Lingu istics (ACL2007) Workshop on Semantic Evaluations (SemEval 2007)
    • 発表場所
      Czech
    • 年月日
      20070000
  • [学会発表] A Statistical Selector of the Best among Multiple ICD-coding Methods2007

    • 著者名/発表者名
      Eiji Aramaki, Takeshi Imai, Masayuki Kajino, Kengo Miyo, Kazuhiko Ohe
    • 学会等名
      Medinfo
    • 発表場所
      Australia
    • 年月日
      20070000

URL: 

公開日: 2010-02-04   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi