• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2016 年度 実施状況報告書

高品位な知識抽出を実現する三階層オントロジーフレームワークの開発

研究課題

研究課題/領域番号 15K08845
研究機関愛媛大学

研究代表者

木村 映善  愛媛大学, 医学系研究科, 准教授 (20363244)

研究分担者 岡本 和也  京都大学, 医学研究科, 講師 (60565018)
今井 健  東京大学, 大学院医学系研究科(医学部), 准教授 (90401075)
研究期間 (年度) 2015-04-01 – 2018-03-31
キーワード機械学習 / ターミノロジー / オントロジー / UMLS
研究実績の概要

UMLSからSNOMED-CTの概念と英語のリードタームを抽出し、有害事象周りの概念に限定して日本語タームを対応付けたデータベースを構築することを試みた。研究者が独自に蓄積した英和用語データベースにUMLSのSpecial Lexicon Toolを使って英語の用語をnormalizeした上で、UMLSの英語の用語集と日本語のマッピングを行い、Neo4jデータベースに展開した。有害事象に関する記述として、アレルギーに関する記載に関する用語を収集するために、代表研究者が所属する医療機関の電子カルテから、患者基本プロファイルに記載されているアレルギーに関する文章・用語を抽出し、整理した。ターミノロジサービスの実装として、FHIR Terminology Serviceの仕様に基づいてターミノロジサービスを構築した。NLPの結果から精緻な概念抽出を実現するために、単語の分散表現の獲得、分散表現のクラスタリングによる同義語抽出、同義語辞書編成の一連のタスクを構成した。基本的検証では、文書から抽出した分散表現に加法構成性を確認し、同義語編成による分散表現の抽出の精緻化を確認した。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

文章中からの有害事象の関係抽出はNLPとSVM等による機械学習を組み合わせて実現することを目指していた。NLPから単語が切り出された段階では複数の意味を持つ単語が存在し得るため、UMLSからSNOMED-CTの概念と英語のリードタームと有害事象周りの概念に限定して日本語タームを対応付けたデータベースを構築し、抽出された単語を当該データベースの概念にマッピングするタスクを想定していた。電子カルテにおけるアレルギーに関する記述状況を調査する過程で、表記揺れの幅が大きく、従来の医学用語辞書のみでは精緻なNLPが困難であることが確認された。そのため、単純なNLPの結果から概念のマッピングを試みることにかえて、以下の一連の処理サイクルを組み上げた。単語の分散表現の獲得による概念の擬似的抽出及びクラスタリングによる同義語の候補抽出、前出の候補群から人力による同義語の選択を経てNLP用の同義語辞書を編纂し、NLP時に同じ語の表記揺れに対して同じ代表表記を与えられるようにし、さらに精緻な単語分散表現の獲得を試みた。文書から獲得した分散表現に加法構成性を確認し、かつ同義語辞書編成による分散表現の精緻化の可能性を確認した。

今後の研究の推進方策

最終年度の目標として有害事象検出アルゴリズムの適用可能性の検証を行う。フレーズをこれまでに構築した分散表現の集合としてみなして、フレーズの類似度による評価を行う。研究者所属病院のインシデントレポートからアレルギー、有害事象であることを明確に記載されているものを手作業で抽出し、それらのフレーズから有害事象に関するフレーズとしてのベクトルを算出する。電子カルテから診療録のデータを抽出し、フレーズの集合とした上で、ベクトルの算出を行う。先述のインシデントレポートのフレーズとの類似度評価を行うことで、有害事象の記述の可能性があるものを抽出し、評価を行う。
さらに複数の概念を持ちうる単語について、フレーズ中の共起関係から、概念を特定するタスクについての評価も試みる予定である。

次年度使用額が生じた理由

平成28年の執行計画として、国際学会発表・米国・欧州について2回を計上していたが、実績は1回に留まり、その分が剰余となった。

次年度使用額の使用計画

平成29年度参加予定のMIE 2017(欧州医療情報学会)、AMIA2017(米国医療情報学会)に加え、採録された場合はMEDINFO2017(国際医療情報学会)の出張に平成28年度からの持ち越し分を充てる予定である。

  • 研究成果

    (11件)

すべて 2016

すべて 雑誌論文 (10件) (うち査読あり 4件) 学会発表 (1件)

  • [雑誌論文] 秘密分散技術を利用した医療情報の遠隔保存と参照環境の評価2016

    • 著者名/発表者名
      木村 映善, 松村 泰志, 三原 直樹, 黒田 知宏, 山下 芳範, 平松 治彦, 真鍋 史朗, 田中 大介, 佐藤 敦, 山倉 直
    • 雑誌名

      電子情報通信学会論文誌D

      巻: 99 ページ: 526-538

    • DOI

      10.14923/transinfj.2015AIP0010

    • 査読あり
  • [雑誌論文] Evaluation of Secure Computation in a Distributed Healthcare Setting.2016

    • 著者名/発表者名
      Eizen KIMURA, Koki HAMADA, Ryo KIKUCHI, Koji CHIDA, Kazuya OKAMOTO, Shirou MANABE, Tomohiko KURODA, Yasushi MATSUMURA, Toshihiro TAKEDA, MIHARA N.
    • 雑誌名

      Stud Health Technol Inform.

      巻: 228 ページ: 152-156

    • 査読あり
  • [雑誌論文] The inequality of patient profile information in Japanese hospitals2016

    • 著者名/発表者名
      Yukio Kurihara, Haku Ishida, Eizen KIMURA, Akira Gochi, Hiroshi Kondoh, Ken-ichiro SHIMAI, Noriaki Nakajima, Takeshi Tanaka, kiyomu Ishikawa, Michihiro Oohara, Takeharu Sonoda, Kohei Takai.
    • 雑誌名

      Stud Health Technol Inform.

      巻: 228 ページ: 412-415

  • [雑誌論文] 秘密計算による分散医療統計システムの実装評価 (情報通信マネジメント)2016

    • 著者名/発表者名
      濱田 浩気, 木村 映善, 菊池 亮, 千田 浩司, 岡本 和也, 真鍋 史朗, 黒田 知宏, 松村 泰志, 武田 理宏, 三原 直樹.
    • 雑誌名

      電子情報通信学会技術研究報告

      巻: 116 ページ: 111-117

    • 査読あり
  • [雑誌論文] 匿名化ヘルス情報の再特定化リスク除去の統計量への 影響評価方法の検討2016

    • 著者名/発表者名
      栗原 幸男, 石田 博, 木村 映善, 入野 了士
    • 雑誌名

      医療情報学

      巻: 36 ページ: 710-712

  • [雑誌論文] 患者基本プロファイルのアレルギー項目の用語集編成に関する検討2016

    • 著者名/発表者名
      蒲生 祥子, 木村 映善, 石原 謙
    • 雑誌名

      医療情報学

      巻: 36 ページ: 846-848

  • [雑誌論文] 病院情報システムにおける患者プロファイル情報項目の保有状況調査2016

    • 著者名/発表者名
      栗原 幸男, 石田 博, 木村 映善, 近藤 博史, 島井 健一郎, 田中 武志, 中島 典明
    • 雑誌名

      医療情報学

      巻: 36 ページ: 1086-1088

  • [雑誌論文] 標準化されたデータソースを用いたSDM構築2016

    • 著者名/発表者名
      木村 映善, 高月 常光, 崔 ムン相, 張 彰祐, 蒲生 祥子, 石原 謙, 鈴木 英夫
    • 雑誌名

      医療情報学

      巻: 36 ページ: 160-161

    • 査読あり
  • [雑誌論文] 健康診査実施機関における健診データの利活用と匿名化データの外部提供に関する調査研究2016

    • 著者名/発表者名
      入野 了士, 木村 映善, 石田 博, 栗原 幸男.
    • 雑誌名

      医療情報学

      巻: 36 ページ: 1014-1017

  • [雑誌論文] SS-MIX2ベースの地域医療連携システムにおける 患者プロファイル情報統合の課題2016

    • 著者名/発表者名
      栗原 幸男, 近藤 博史, 入江 真行, 木村 映善, 合地 明, 高井 康平, 原田 正治, 大原 通宏
    • 雑誌名

      医療情報学

      巻: 36 ページ: 238-239

  • [学会発表] Stream Computingを医療情報システムに導入する試み.2016

    • 著者名/発表者名
      木村 映善, 蒲生 祥子, 石原 謙.
    • 学会等名
      第43回日本Mテクノロジー学会大会
    • 発表場所
      キャンパスイノベーションセンター東京(東京都港区)
    • 年月日
      2016-08-26 – 2016-08-27

URL: 

公開日: 2018-01-16  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi