研究課題/領域番号 |
21H03777
|
研究機関 | 西南女学院大学 |
研究代表者 |
相良 かおる 西南女学院大学, 保健福祉学部, 准教授 (00330887)
|
研究分担者 |
東条 佳奈 大阪大学, 大学院人文学研究科(人文学専攻、芸術学専攻、日本学専攻), 講師 (20782220)
山崎 誠 大学共同利用機関法人人間文化研究機構国立国語研究所, 研究系, 教授 (30182489)
麻 子軒 関西大学, 国際教育センター, 留学生別科特任常勤講師 (30880249)
黒田 航 杏林大学, 医学部, 准教授 (30425764)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
キーワード | 縮約医療表現 / 実践医療用語 / 語構成 / 意味分類 |
研究実績の概要 |
本研究の目的は、医療記録に含まれる医療縮約表現(以下、「縮約表現」という)を対象に、①医療の観点からみた語構成要素に分割し、②それぞれの語構成要素を意味的に分類し、そして③語構成要素間の文法的な構造を明らかにすることである。 そのために昨年度は、ComeJisyoUtf8-3 の見出し語より品詞が名詞となっているものから 5,711 語の縮約表現候補を選定した。 2022年度は、この5,711語を見直し、重複を除いた5,690語について、①短い単位に語分割し、語末の異なる814要素を抽出した。②次に5,690語を814の語末要素で分類し、同じ語末要素を持つ縮約表現から、無作為に1語を抽出した。③この語末要素の異なる縮約表現814語に「VAC療養中」など、名詞以外の縮約表現8語を加えた822語について、医師により医療の観点からみた縮約表現の確実性のチェックを行い、対象とする縮約表現558語を選定した。④そして対象縮約表現558語の語構成解析を行い、得られた語構成要素1,017要素に52種類の意味ラベルを付与した。 本研究では、選定した合成語(複合語および縮約表現)を医療の観点からみた語構成要素に分割する。すなわち、有意味な語を網羅的に抽出してはおらず、医療言語処理で使えるデータを増やす、すなわち被覆率の向上においての貢献度が高いとは言えない。 そこで、合成語から有意味な部分文字列を網羅的に抽出する手法「並列分散形態論解析」と、網羅的ではないものの簡便な手法「複層化形態論解析」を提案した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
縮約表現558語について、公開には至らなかったものの、①医療の観点からみた語構成要素に分割し、②それぞれの語構成要素を意味的に分類したこと、および、医療分野の複合語および縮約表現から有意味な部分文字列を網羅的に抽出する手法「並列分散形態論解析」と、網羅的ではないものの簡便な手法「複層化形態論解析」を提案したことから、概ね順調に進展していると判断した。
|
今後の研究の推進方策 |
最終年度である2023年度の研究計画は以下の通りである。 1.縮約表現558語を構成する語構成要素に付与した意味ラベルを見直し、意味分類の方法を提案する 2.医療の意味的な観点からみた縮約表現の語構成を明らかにする 3.縮約表現の語彙試案表を作成し公開する 4.本研究で得られた知見を公開する 5.医療の観点からみた意味の単位で医療テキストを語分割するツールのプロトタイプを作成する
|