研究課題/領域番号 |
21H03777
|
研究機関 | 西南女学院大学 |
研究代表者 |
相良 かおる 西南女学院大学, 保健福祉学部, 准教授 (00330887)
|
研究分担者 |
東条 佳奈 大阪大学, 文学研究科, 助教 (20782220)
山崎 誠 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変化研究領域, 教授 (30182489)
高崎 智子 西南女学院大学, 保健福祉学部, 教授 (30882865)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
キーワード | 縮約医療用語 / 実践医療用語 / 語構成 / 意味分類 |
研究実績の概要 |
本研究の目的は、①医療記録に含まれる縮約医療用語を語構成要素に分割し、②次にそれぞれの語構成要素の意味分類を行い、③語構成要素間の文法的な構造を明らかにすることである。 そのために設定した実施計画は、(A)JP18H03499 の助成を得て実施した一般語を含む複合語(7,192 語)を構成する語構成要素(6,380 要素)の分割の妥当性の検証と、これらに付与した 80 種類の意味ラベルを見直し体系化すること、(B)縮約医療用語の選定方法を定め、無償公開している実践医療用語辞書 ComeJisyoUtf8-3(登録語数 118,404語)の見出し語、および 3 種類の匿名加工済みの医療記録データより縮約医療用語を抽出すること、(C)抽出した縮約医療用語の語種を調べ、本研究で対象とする縮約医療用語選定することである。 これらの実施計画の内、(A)については、2021 年度に公開した『実践医療用語_語構成要素語彙試案表Ver1』の複合語7,192 語より抽出した語構成要素6,380 要素とこれらに付与した80 種の意味ラベルを見直し、語構成要素 6,633 要素に 41 種の意味ラベルを付与した『実践医療用語_語構成要素語彙試案表 Ver2』を公開した。(B)については、ComeJisyoUtf8-3 の見出し語より 5,712 語の縮約医療用語を選定した。 また、(A)の見直しで得られた知見を、人文科学とコンピュータシンポジウム 2021 と、言語処理学会第 28 回年次大会で発表した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
縮約医療用語 5,712 語を選定したこと、また、前述(A)の語構成要素 6,633 要素を見出し語とした形態素解析器 MeCab 用のユーザ辞書を作成したことで、半自動で縮約医療用語の大まかな語分割と意味ラベルの付与が可能となったことから、進捗状況はおおむね順調に進展していると判断した。 なお、あらかじめ枠組みを定めて意味分類する方が効率的であることから、意味ラベルの体系化を実施計画に加えたが、縮約医療用語には、患者の症状に関する記述が含まれており、多くが病名である複合語を対象とした前述(A)の 41 種の意味ラベルでは分類できない語構成要素があると考えられることから、意味ラベルの体系化は見送った。 また、当初は、語種のバランスが考慮された縮約医療用語を研究対象とすべきだと考えていたが、縮約医療用語の語種分布を明らかにすることが重要であると気付き、(C)は実施しなかった。
|
今後の研究の推進方策 |
以下の手順で研究を進める。 1.縮約医療用語を作成したユーザ辞書で大まかに語分割し意味ラベルを付与する。 2.縮約医療用語の語構成の解析を行い、語構成要素を抽出する。 3.抽出した語構成要素の意味分類を行い、意味ラベルを付与する。 4.縮約医療用語の語彙試案表を作成し、公開する。 5.縮約医療用語の語構成と意味分類の分析で得られた言語学的な知見を公開する。
|
備考 |
「実践医療用語_語構成要素語彙試案表Ver.2.0」は、特定非営利活動法人 言語資源協会(GSK)のサイトから無償でダウンロードが可能です。
|