2023 Fiscal Year Annual Research Report
医療記録文に含まれる合成語の語構成解析 -リアルワールドデータの利活用に向けてー
Project/Area Number |
21H03777
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
相良 かおる 奈良先端科学技術大学院大学, 先端科学技術研究科, 客員准教授 (00330887)
|
Co-Investigator(Kenkyū-buntansha) |
東条 佳奈 大阪大学, 大学院人文学研究科(人文学専攻、芸術学専攻、日本学専攻), 講師 (20782220)
山崎 誠 大学共同利用機関法人人間文化研究機構国立国語研究所, 研究系, 客員教授 (30182489)
黒田 航 杏林大学, 医学部, 准教授 (30425764)
麻 子軒 関西大学, 国際教育センター, 留学生別科特任常勤講師 (30880249)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | 医療用語 / 合成語 / 縮約表現 / 語構成 / 意味分類 |
Outline of Annual Research Achievements |
医療記録に含まれる合成語には、複合語に加えて、「気管支肺胞洗浄異常」のような助詞が省略された合成語(本研究では、「医療縮約表現」という)がある。本研究の目的は、これら医療縮約表現を、医療の観点からみた語構成要素に分割し、それぞれの語構成要素を意味的に分類し、そして語構成要素間の文法的な構造を明らかにすることである。また、医療記録には個人情報が含まれ、持ち出しが困難である。そこで、医療施設内で、医療従事者が医療記録データから合成語とこれらの語構成要素の抽出を支援するツールを作成し、公開することである。本年度の研究成果は、以下の通りである。 (1)昨年の分析結果の見直しを行い、縮約表現810語より、語構成要素1,264語を抽出し、これらに付与する50種の意味ラベルを決定し、各要素に付与した。 (2)分析結果(1)をまとめた縮約表現の語彙試案表を作成した。 (3)医療記録データの文字コード処理、正規化処理などの前処理機能と、形態素解析用ユーザ辞書の作成支援、および本研究で提案の複層化形態素解析(Multi-Layered Morphological)による合成語とこれらの語構成要素の抽出機能を持つツールを作成した。
|
Research Progress Status |
令和5年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
令和5年度が最終年度であるため、記入しない。
|
Remarks |
オープンソースソフトウエアの開発サイトOSDNの不調に伴い、2020以降に公開したComeJisyoを含む研究成果物の公開用にWebページを作成した。本研究成果物である言語処理支援ツールも本Webページで公開する。なお、医療縮約表現の分析結果をまとめた語彙試案表は、特定非営利活動法人 言語資源協会(GSK)より公開する。
|
Research Products
(4 results)