• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

e-Phenotyping from clinical text for hereditary disorders and feasibility evaluation for clinical applications

Research Project

Project/Area Number 20H04279
Research Category

Grant-in-Aid for Scientific Research (B)

Allocation TypeSingle-year Grants
Section一般
Review Section Basic Section 62010:Life, health and medical informatics-related
Research InstitutionThe University of Tokyo

Principal Investigator

Kawazoe Yoshimasa  東京大学, 医学部附属病院, 特任准教授 (10621477)

Co-Investigator(Kenkyū-buntansha) 関 倫久  東京大学, 医学部附属病院, 助教 (30528873)
篠原 恵美子  東京大学, 医学部附属病院, 特任助教 (40582755)
Project Period (FY) 2020-04-01 – 2023-03-31
Project Status Completed (Fiscal Year 2022)
Budget Amount *help
¥18,070,000 (Direct Cost: ¥13,900,000、Indirect Cost: ¥4,170,000)
Fiscal Year 2022: ¥4,420,000 (Direct Cost: ¥3,400,000、Indirect Cost: ¥1,020,000)
Fiscal Year 2021: ¥4,420,000 (Direct Cost: ¥3,400,000、Indirect Cost: ¥1,020,000)
Fiscal Year 2020: ¥9,230,000 (Direct Cost: ¥7,100,000、Indirect Cost: ¥2,130,000)
Keywords診療記録 / 遺伝性疾患 / 表現型 / 自然言語処理 / Phenotyping / Human Phenotype Ontology / Named Entity Recognition / Relation Extraction / 診療テキスト / 告示難病
Outline of Research at the Start

遺伝性疾患は種類が多く頻度が低いことから、医師にとって未経験の疾患が多く存在するため、疾患の見落としが生じる可能性が高い。そのため、診療記録等のテキストから抽出した患者の表現型に関する情報と情報検索技術を活用して、候補となる原因遺伝子や遺伝性疾患を推定するための技術は重要なものとなる。本研究では、診療テキストから表現型を抽出する基盤技術の開発と、抽出された表現型から既存のアルゴリズムを利用して得られる遺伝性疾患のランキングの精度評価を行う。

Outline of Final Research Achievements

We collected case report texts for 362 cases of 151 designated intractable diseases and developed criteria for annotating phenotypes using 70 type of named entity tag and 35 type of relationship tags. We annotated 57,520 phenotypes and mapped these phenotypes to term codes in the disease name glossaries (UMLS, HPO, MEDIS standard disease name master). As a result, a corpus of 179 cases, for which permission for redistribution was obtained, was published on the researchers' website. A machine learning model was also developed to reproduce the annotations, and its accuracy was evaluated. Although the accuracy of unique expression extraction and relationship extraction was relatively high, the accuracy of mapping phenotype strings to HPO codes was insufficient and remains as future work.

Academic Significance and Societal Importance of the Research Achievements

本研究は自然言語処理の基盤技術として、表現型(患者の状態)を抽出するための詳細なアノテーション基準を開発し、この基準でアノテートされた高品質なコーパスを構築・公開した。診療テキストを入力として、計算機がこのアノテーションを再現することで、患者の表現型(例えば、どの部位に症状が生じているのか、その症状は持続しているのか改善しているのかなど)を自動で抽出し集計できるようになる。機械学習による表現型の抽出は良好な性能を示したものの、抽出された表現型を医学用語集の用語に対応付けるエンティティリンキングの性能は十分ではないため、この性能を向上するための手法を開発することが今後の課題としてあげられた。

Report

(4 results)
  • 2022 Annual Research Report   Final Research Report ( PDF )
  • 2021 Annual Research Report
  • 2020 Annual Research Report
  • Research Products

    (16 results)

All 2023 2022 2021 Other

All Journal Article (2 results) (of which Peer Reviewed: 2 results,  Open Access: 1 results) Presentation (10 results) (of which Int'l Joint Research: 1 results,  Invited: 1 results) Book (1 results) Remarks (3 results)

  • [Journal Article] Development of comprehensive annotation criteria for patients’ states from clinical texts2022

    • Author(s)
      Shinohara Emiko、Shibata Daisaku、Kawazoe Yoshimasa
    • Journal Title

      Journal of Biomedical Informatics

      Volume: 134 Pages: 104200-104200

    • DOI

      10.1016/j.jbi.2022.104200

    • Related Report
      2022 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] 症例報告に対する網羅的な所見アノテーションのためのアノテーション基準の構築2022

    • Author(s)
      篠原 恵美子, 河添 悦昌, 柴田 大作, 嶋本 公徳, 関 倫久
    • Journal Title

      医療情報学

      Volume: 42(1) Pages: 3-15

    • Related Report
      2022 Annual Research Report
    • Peer Reviewed
  • [Presentation] 医療デジタルツインを加速する自然言語処理2023

    • Author(s)
      河添 悦昌
    • Organizer
      第31回日本医学会総会 U40委員会企画 AIは医師を置き換えるか? ~医療AIの未来予想図~
    • Related Report
      2022 Annual Research Report
    • Invited
  • [Presentation] UMLSからの同義語を追加した形態素解析辞書を使用したPhenotypingの性能評価2023

    • Author(s)
      榎原 芽美, 柴田 大作, 篠原 恵美子, 河添 悦昌, 大江 和彦
    • Organizer
      第27回日本医療情報学会春季学術大会
    • Related Report
      2022 Annual Research Report
  • [Presentation] Towards structuring clinical texts: Joint entity and relation extraction from Japanese case report corpus2023

    • Author(s)
      Daisaku Shibata, Emiko Shinohara, Kiminori Shimamoto and Yoshimasa Kawazoe
    • Organizer
      MedInfo 2023, the 19th world congress on medical and health informatics
    • Related Report
      2022 Annual Research Report
    • Int'l Joint Research
  • [Presentation] 患者状態表現の病名交換コードへのマッピング2022

    • Author(s)
      柴田大作, 河添悦昌, 篠原恵美子, 嶋本公徳
    • Organizer
      第42回医療情報連合大会
    • Related Report
      2022 Annual Research Report
  • [Presentation] アレルギー情報の標準化を目指すJFAGYアレルゲン用語集とアレルゲンコードシステム2022

    • Author(s)
      河添 悦昌, 永島 里美, 大江 和彦
    • Organizer
      第42回医療情報連合大会
    • Related Report
      2022 Annual Research Report
  • [Presentation] 希少・難治性疾患の症例報告テキストコーパスと情報抽出精度の評価2022

    • Author(s)
      柴田 大作, 河添 悦昌, 篠原 恵美子, 嶋本 公徳
    • Organizer
      第36回人工知能学会全国大会
    • Related Report
      2022 Annual Research Report 2021 Annual Research Report
  • [Presentation] 詳細なアノテーション基準に基づく症例報告コーパスからの固有表現及び関係の抽出精度2021

    • Author(s)
      柴田 大作,河添 悦昌,篠原 恵美子,嶋本 公徳
    • Organizer
      第41回医療情報学連合大会
    • Related Report
      2021 Annual Research Report
  • [Presentation] 患者状態に関する網羅的なアノテーション基準とFHIR Conditionリソースとのマッピングの検討2021

    • Author(s)
      河添 悦昌,篠原 恵美子
    • Organizer
      第41回医療情報学連合大会
    • Related Report
      2021 Annual Research Report
  • [Presentation] 希少・難治性疾患を対象とした症例報告テキストコーパスの構築2021

    • Author(s)
      河添 悦昌,篠原 恵美子
    • Organizer
      第41回医療情報学連合大会
    • Related Report
      2021 Annual Research Report
  • [Presentation] 医療テキストに対する網羅的な所見アノテーションのためのアノテーション基準の構築2021

    • Author(s)
      篠原 恵美子, 河添 悦昌, 柴田 大作, 嶋本 公徳, 関 倫久
    • Organizer
      第25回日本医療情報学会春季学術大会シンポジウム
    • Related Report
      2020 Annual Research Report
  • [Book] 医学のあゆみ283巻2号2022

    • Author(s)
      河添 悦昌, 篠原 恵美子
    • Total Pages
      6
    • Publisher
      医歯薬出版
    • Related Report
      2022 Annual Research Report
  • [Remarks] 症例報告コーパス(iCorpus)

    • URL

      https://ai-health.m.u-tokyo.ac.jp/home/research/corpus

    • Related Report
      2022 Annual Research Report
  • [Remarks] 症例報告コーパス(iCorpus)

    • URL

      https://ai-health.m.u-tokyo.ac.jp/home/research/corpus

    • Related Report
      2021 Annual Research Report
  • [Remarks] 医療AI開発学講座 - 症例報告コーパス

    • URL

      https://ai-health.m.u-tokyo.ac.jp/corpus

    • Related Report
      2020 Annual Research Report

URL: 

Published: 2020-04-28   Modified: 2024-01-30  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi