• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2021 Fiscal Year Annual Research Report

医療記録文に含まれる合成語の語構成解析 -リアルワールドデータの利活用に向けてー

Research Project

Project/Area Number 21H03777
Research InstitutionSeinan Jo Gakuin University

Principal Investigator

相良 かおる  西南女学院大学, 保健福祉学部, 准教授 (00330887)

Co-Investigator(Kenkyū-buntansha) 東条 佳奈  大阪大学, 文学研究科, 助教 (20782220)
山崎 誠  大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変化研究領域, 教授 (30182489)
高崎 智子  西南女学院大学, 保健福祉学部, 教授 (30882865)
Project Period (FY) 2021-04-01 – 2024-03-31
Keywords縮約医療用語 / 実践医療用語 / 語構成 / 意味分類
Outline of Annual Research Achievements

本研究の目的は、①医療記録に含まれる縮約医療用語を語構成要素に分割し、②次にそれぞれの語構成要素の意味分類を行い、③語構成要素間の文法的な構造を明らかにすることである。
そのために設定した実施計画は、(A)JP18H03499 の助成を得て実施した一般語を含む複合語(7,192 語)を構成する語構成要素(6,380 要素)の分割の妥当性の検証と、これらに付与した 80 種類の意味ラベルを見直し体系化すること、(B)縮約医療用語の選定方法を定め、無償公開している実践医療用語辞書 ComeJisyoUtf8-3(登録語数 118,404語)の見出し語、および 3 種類の匿名加工済みの医療記録データより縮約医療用語を抽出すること、(C)抽出した縮約医療用語の語種を調べ、本研究で対象とする縮約医療用語選定することである。
これらの実施計画の内、(A)については、2021 年度に公開した『実践医療用語_語構成要素語彙試案表Ver1』の複合語7,192 語より抽出した語構成要素6,380 要素とこれらに付与した80 種の意味ラベルを見直し、語構成要素 6,633 要素に 41 種の意味ラベルを付与した『実践医療用語_語構成要素語彙試案表 Ver2』を公開した。(B)については、ComeJisyoUtf8-3 の見出し語より 5,712 語の縮約医療用語を選定した。
また、(A)の見直しで得られた知見を、人文科学とコンピュータシンポジウム 2021 と、言語処理学会第 28 回年次大会で発表した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

縮約医療用語 5,712 語を選定したこと、また、前述(A)の語構成要素 6,633 要素を見出し語とした形態素解析器 MeCab 用のユーザ辞書を作成したことで、半自動で縮約医療用語の大まかな語分割と意味ラベルの付与が可能となったことから、進捗状況はおおむね順調に進展していると判断した。
なお、あらかじめ枠組みを定めて意味分類する方が効率的であることから、意味ラベルの体系化を実施計画に加えたが、縮約医療用語には、患者の症状に関する記述が含まれており、多くが病名である複合語を対象とした前述(A)の 41 種の意味ラベルでは分類できない語構成要素があると考えられることから、意味ラベルの体系化は見送った。
また、当初は、語種のバランスが考慮された縮約医療用語を研究対象とすべきだと考えていたが、縮約医療用語の語種分布を明らかにすることが重要であると気付き、(C)は実施しなかった。

Strategy for Future Research Activity

以下の手順で研究を進める。
1.縮約医療用語を作成したユーザ辞書で大まかに語分割し意味ラベルを付与する。
2.縮約医療用語の語構成の解析を行い、語構成要素を抽出する。
3.抽出した語構成要素の意味分類を行い、意味ラベルを付与する。
4.縮約医療用語の語彙試案表を作成し、公開する。
5.縮約医療用語の語構成と意味分類の分析で得られた言語学的な知見を公開する。

Remarks

「実践医療用語_語構成要素語彙試案表Ver.2.0」は、特定非営利活動法人 言語資源協会(GSK)のサイトから無償でダウンロードが可能です。

  • Research Products

    (6 results)

All 2022 2021 Other

All Presentation (5 results) Remarks (1 results)

  • [Presentation] ComeJisyoUtf8-3の誤解析調査 -看護師・助産師・管理栄養士国家試験問題文の語分割-2022

    • Author(s)
      相良かおる
    • Organizer
      言語処理学会 第28回年次大会
  • [Presentation] 医療用語の is-a オントロジー構築の FCA を使った効率化2022

    • Author(s)
      黒田航,相良かおる
    • Organizer
      言語処理学会 第28回年次大会
  • [Presentation] 医療用語に含まれる助数詞について2021

    • Author(s)
      東条佳奈,相良かおる, 西嶋佑太朗, 麻子軒, 山崎誠
    • Organizer
      人文科学とコンピュータシンポジウム2021
  • [Presentation] 人間可読と機械可読の看護記録を目指して -看護と看語-2021

    • Author(s)
      相良かおる
    • Organizer
      日本医療情報学会看護学術大会論文集 : JAMI-NI,2021
  • [Presentation] 実践医療用語の合成語生成ツールの作成と公開2021

    • Author(s)
      相良かおる
    • Organizer
      第25回日本医療情報学会春季学術大会 25th JAMI(Nov.2021)
  • [Remarks] 「実践医療用語_語構成要素語彙試案表」(GSK2020-G)Ver.2.0

    • URL

      https://www.gsk.or.jp/catalog/gsk2020-g/

URL: 

Published: 2022-12-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi