• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2022 Fiscal Year Annual Research Report

医療記録文に含まれる合成語の語構成解析 -リアルワールドデータの利活用に向けてー

Research Project

Project/Area Number 21H03777
Research InstitutionSeinan Jo Gakuin University

Principal Investigator

相良 かおる  西南女学院大学, 保健福祉学部, 准教授 (00330887)

Co-Investigator(Kenkyū-buntansha) 東条 佳奈  大阪大学, 大学院人文学研究科(人文学専攻、芸術学専攻、日本学専攻), 講師 (20782220)
山崎 誠  大学共同利用機関法人人間文化研究機構国立国語研究所, 研究系, 教授 (30182489)
麻 子軒  関西大学, 国際教育センター, 留学生別科特任常勤講師 (30880249)
黒田 航  杏林大学, 医学部, 准教授 (30425764)
Project Period (FY) 2021-04-01 – 2024-03-31
Keywords縮約医療表現 / 実践医療用語 / 語構成 / 意味分類
Outline of Annual Research Achievements

本研究の目的は、医療記録に含まれる医療縮約表現(以下、「縮約表現」という)を対象に、①医療の観点からみた語構成要素に分割し、②それぞれの語構成要素を意味的に分類し、そして③語構成要素間の文法的な構造を明らかにすることである。
そのために昨年度は、ComeJisyoUtf8-3 の見出し語より品詞が名詞となっているものから 5,711 語の縮約表現候補を選定した。
2022年度は、この5,711語を見直し、重複を除いた5,690語について、①短い単位に語分割し、語末の異なる814要素を抽出した。②次に5,690語を814の語末要素で分類し、同じ語末要素を持つ縮約表現から、無作為に1語を抽出した。③この語末要素の異なる縮約表現814語に「VAC療養中」など、名詞以外の縮約表現8語を加えた822語について、医師により医療の観点からみた縮約表現の確実性のチェックを行い、対象とする縮約表現558語を選定した。④そして対象縮約表現558語の語構成解析を行い、得られた語構成要素1,017要素に52種類の意味ラベルを付与した。
本研究では、選定した合成語(複合語および縮約表現)を医療の観点からみた語構成要素に分割する。すなわち、有意味な語を網羅的に抽出してはおらず、医療言語処理で使えるデータを増やす、すなわち被覆率の向上においての貢献度が高いとは言えない。
そこで、合成語から有意味な部分文字列を網羅的に抽出する手法「並列分散形態論解析」と、網羅的ではないものの簡便な手法「複層化形態論解析」を提案した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

縮約表現558語について、公開には至らなかったものの、①医療の観点からみた語構成要素に分割し、②それぞれの語構成要素を意味的に分類したこと、および、医療分野の複合語および縮約表現から有意味な部分文字列を網羅的に抽出する手法「並列分散形態論解析」と、網羅的ではないものの簡便な手法「複層化形態論解析」を提案したことから、概ね順調に進展していると判断した。

Strategy for Future Research Activity

最終年度である2023年度の研究計画は以下の通りである。
1.縮約表現558語を構成する語構成要素に付与した意味ラベルを見直し、意味分類の方法を提案する
2.医療の意味的な観点からみた縮約表現の語構成を明らかにする
3.縮約表現の語彙試案表を作成し公開する
4.本研究で得られた知見を公開する
5.医療の観点からみた意味の単位で医療テキストを語分割するツールのプロトタイプを作成する

  • Research Products

    (7 results)

All 2023 2022

All Presentation (7 results)

  • [Presentation] 要素の重複と不連続性を扱える抽出型の語構成要素解析:並列分散型形態素解析の提案2023

    • Author(s)
      黒田航, 相良かおる, 東条佳奈, 麻子軒, 西嶋佑太郎, 山崎誠
    • Organizer
      言語処理学会第29回年次大会
  • [Presentation] 医療縮約表現―医療記録に含まれる句や節に相当する合成語―2023

    • Author(s)
      相良かおる, 黒田航, 東条佳奈, 西嶋佑太郎, 麻子軒, 山崎誠
    • Organizer
      言語処理学会第29回年次大会
  • [Presentation] 医療記録における縮約表現の分析2022

    • Author(s)
      東条佳奈, 黒田航, 相良かおる, 西嶋佑太郎, 麻子軒, 山崎誠
    • Organizer
      言語資源ワークショップ2022
  • [Presentation] 実践医療用語における語構成要素の結合順序に関する量的調査2022

    • Author(s)
      麻 子軒, 黒田 航, 相良 かおる, 東条 佳奈, 西嶋 佑太郎, 山崎 誠
    • Organizer
      計量国語学会 第66回大会
  • [Presentation] 医療記録における縮約表現の量的構造―医療用語との比較―2022

    • Author(s)
      山崎 誠, 黒田 航, 東条 佳奈, 西嶋 佑太郎, 麻 子軒, 相良 かおる
    • Organizer
      言語資源ワークショップ2022
  • [Presentation] 「急性」を含む病名の語構成2022

    • Author(s)
      相良かおる, 西嶋佑太郎, 東条佳奈, 高崎智子, 山崎誠
    • Organizer
      言語資源ワークショップ2022
  • [Presentation] 合成語の語構造と意味分類2022

    • Author(s)
      相良かおる
    • Organizer
      第23回日本医療情報学会学術大会

URL: 

Published: 2023-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi