• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2016 Fiscal Year Research-status Report

高品位な知識抽出を実現する三階層オントロジーフレームワークの開発

Research Project

Project/Area Number 15K08845
Research InstitutionEhime University

Principal Investigator

木村 映善  愛媛大学, 医学系研究科, 准教授 (20363244)

Co-Investigator(Kenkyū-buntansha) 岡本 和也  京都大学, 医学研究科, 講師 (60565018)
今井 健  東京大学, 大学院医学系研究科(医学部), 准教授 (90401075)
Project Period (FY) 2015-04-01 – 2018-03-31
Keywords機械学習 / ターミノロジー / オントロジー / UMLS
Outline of Annual Research Achievements

UMLSからSNOMED-CTの概念と英語のリードタームを抽出し、有害事象周りの概念に限定して日本語タームを対応付けたデータベースを構築することを試みた。研究者が独自に蓄積した英和用語データベースにUMLSのSpecial Lexicon Toolを使って英語の用語をnormalizeした上で、UMLSの英語の用語集と日本語のマッピングを行い、Neo4jデータベースに展開した。有害事象に関する記述として、アレルギーに関する記載に関する用語を収集するために、代表研究者が所属する医療機関の電子カルテから、患者基本プロファイルに記載されているアレルギーに関する文章・用語を抽出し、整理した。ターミノロジサービスの実装として、FHIR Terminology Serviceの仕様に基づいてターミノロジサービスを構築した。NLPの結果から精緻な概念抽出を実現するために、単語の分散表現の獲得、分散表現のクラスタリングによる同義語抽出、同義語辞書編成の一連のタスクを構成した。基本的検証では、文書から抽出した分散表現に加法構成性を確認し、同義語編成による分散表現の抽出の精緻化を確認した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

文章中からの有害事象の関係抽出はNLPとSVM等による機械学習を組み合わせて実現することを目指していた。NLPから単語が切り出された段階では複数の意味を持つ単語が存在し得るため、UMLSからSNOMED-CTの概念と英語のリードタームと有害事象周りの概念に限定して日本語タームを対応付けたデータベースを構築し、抽出された単語を当該データベースの概念にマッピングするタスクを想定していた。電子カルテにおけるアレルギーに関する記述状況を調査する過程で、表記揺れの幅が大きく、従来の医学用語辞書のみでは精緻なNLPが困難であることが確認された。そのため、単純なNLPの結果から概念のマッピングを試みることにかえて、以下の一連の処理サイクルを組み上げた。単語の分散表現の獲得による概念の擬似的抽出及びクラスタリングによる同義語の候補抽出、前出の候補群から人力による同義語の選択を経てNLP用の同義語辞書を編纂し、NLP時に同じ語の表記揺れに対して同じ代表表記を与えられるようにし、さらに精緻な単語分散表現の獲得を試みた。文書から獲得した分散表現に加法構成性を確認し、かつ同義語辞書編成による分散表現の精緻化の可能性を確認した。

Strategy for Future Research Activity

最終年度の目標として有害事象検出アルゴリズムの適用可能性の検証を行う。フレーズをこれまでに構築した分散表現の集合としてみなして、フレーズの類似度による評価を行う。研究者所属病院のインシデントレポートからアレルギー、有害事象であることを明確に記載されているものを手作業で抽出し、それらのフレーズから有害事象に関するフレーズとしてのベクトルを算出する。電子カルテから診療録のデータを抽出し、フレーズの集合とした上で、ベクトルの算出を行う。先述のインシデントレポートのフレーズとの類似度評価を行うことで、有害事象の記述の可能性があるものを抽出し、評価を行う。
さらに複数の概念を持ちうる単語について、フレーズ中の共起関係から、概念を特定するタスクについての評価も試みる予定である。

Causes of Carryover

平成28年の執行計画として、国際学会発表・米国・欧州について2回を計上していたが、実績は1回に留まり、その分が剰余となった。

Expenditure Plan for Carryover Budget

平成29年度参加予定のMIE 2017(欧州医療情報学会)、AMIA2017(米国医療情報学会)に加え、採録された場合はMEDINFO2017(国際医療情報学会)の出張に平成28年度からの持ち越し分を充てる予定である。

  • Research Products

    (11 results)

All 2016

All Journal Article (10 results) (of which Peer Reviewed: 4 results) Presentation (1 results)

  • [Journal Article] 秘密分散技術を利用した医療情報の遠隔保存と参照環境の評価2016

    • Author(s)
      木村 映善, 松村 泰志, 三原 直樹, 黒田 知宏, 山下 芳範, 平松 治彦, 真鍋 史朗, 田中 大介, 佐藤 敦, 山倉 直
    • Journal Title

      電子情報通信学会論文誌D

      Volume: 99 Pages: 526-538

    • DOI

      10.14923/transinfj.2015AIP0010

    • Peer Reviewed
  • [Journal Article] Evaluation of Secure Computation in a Distributed Healthcare Setting.2016

    • Author(s)
      Eizen KIMURA, Koki HAMADA, Ryo KIKUCHI, Koji CHIDA, Kazuya OKAMOTO, Shirou MANABE, Tomohiko KURODA, Yasushi MATSUMURA, Toshihiro TAKEDA, MIHARA N.
    • Journal Title

      Stud Health Technol Inform.

      Volume: 228 Pages: 152-156

    • Peer Reviewed
  • [Journal Article] The inequality of patient profile information in Japanese hospitals2016

    • Author(s)
      Yukio Kurihara, Haku Ishida, Eizen KIMURA, Akira Gochi, Hiroshi Kondoh, Ken-ichiro SHIMAI, Noriaki Nakajima, Takeshi Tanaka, kiyomu Ishikawa, Michihiro Oohara, Takeharu Sonoda, Kohei Takai.
    • Journal Title

      Stud Health Technol Inform.

      Volume: 228 Pages: 412-415

  • [Journal Article] 秘密計算による分散医療統計システムの実装評価 (情報通信マネジメント)2016

    • Author(s)
      濱田 浩気, 木村 映善, 菊池 亮, 千田 浩司, 岡本 和也, 真鍋 史朗, 黒田 知宏, 松村 泰志, 武田 理宏, 三原 直樹.
    • Journal Title

      電子情報通信学会技術研究報告

      Volume: 116 Pages: 111-117

    • Peer Reviewed
  • [Journal Article] 匿名化ヘルス情報の再特定化リスク除去の統計量への 影響評価方法の検討2016

    • Author(s)
      栗原 幸男, 石田 博, 木村 映善, 入野 了士
    • Journal Title

      医療情報学

      Volume: 36 Pages: 710-712

  • [Journal Article] 患者基本プロファイルのアレルギー項目の用語集編成に関する検討2016

    • Author(s)
      蒲生 祥子, 木村 映善, 石原 謙
    • Journal Title

      医療情報学

      Volume: 36 Pages: 846-848

  • [Journal Article] 病院情報システムにおける患者プロファイル情報項目の保有状況調査2016

    • Author(s)
      栗原 幸男, 石田 博, 木村 映善, 近藤 博史, 島井 健一郎, 田中 武志, 中島 典明
    • Journal Title

      医療情報学

      Volume: 36 Pages: 1086-1088

  • [Journal Article] 標準化されたデータソースを用いたSDM構築2016

    • Author(s)
      木村 映善, 高月 常光, 崔 ムン相, 張 彰祐, 蒲生 祥子, 石原 謙, 鈴木 英夫
    • Journal Title

      医療情報学

      Volume: 36 Pages: 160-161

    • Peer Reviewed
  • [Journal Article] 健康診査実施機関における健診データの利活用と匿名化データの外部提供に関する調査研究2016

    • Author(s)
      入野 了士, 木村 映善, 石田 博, 栗原 幸男.
    • Journal Title

      医療情報学

      Volume: 36 Pages: 1014-1017

  • [Journal Article] SS-MIX2ベースの地域医療連携システムにおける 患者プロファイル情報統合の課題2016

    • Author(s)
      栗原 幸男, 近藤 博史, 入江 真行, 木村 映善, 合地 明, 高井 康平, 原田 正治, 大原 通宏
    • Journal Title

      医療情報学

      Volume: 36 Pages: 238-239

  • [Presentation] Stream Computingを医療情報システムに導入する試み.2016

    • Author(s)
      木村 映善, 蒲生 祥子, 石原 謙.
    • Organizer
      第43回日本Mテクノロジー学会大会
    • Place of Presentation
      キャンパスイノベーションセンター東京(東京都港区)
    • Year and Date
      2016-08-26 – 2016-08-27

URL: 

Published: 2018-01-16  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi