2020 Fiscal Year Research-status Report
医学用語における語構成要素の構造化と学習難易度に関する研究
Project/Area Number |
20K12552
|
Research Institution | Shonan Institute of Technology |
Principal Investigator |
内山 清子 湘南工科大学, 工学部, 教授 (20458970)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Keywords | 医療用語 / 学習難易度 / 医療用語の属性 / 自動判定 |
Outline of Annual Research Achievements |
本研究では、語彙・語用・文脈レベルの情報を付与して医学用語を構造化することと、その構造化データに基づいて造語力、学習頻度、説明力の観点から学習難易度を設定し、その有効性を検証することを目的とする。これにより、看護師などを目指す学習者に対して、学習難易度順に医療用語を学習し、学習レベルに合った辞書の語釈文を提示することで効率的な医療分野の学習支援を目指している。 昨年度は、コロナの影響もあり学会発表などが不透明な部分もあり、発表に向けた準備等もなかなか実施できずにいたため、先行研究の調査や対象とする医療用語の選定などに時間を費やした。 ComeJisyoに収録されている医学用語や医学用語辞書から語釈文を収集し、統計処理した結果に基づいて研究対象として選定していく予定であったが、看護学生の学習を支援することを想定しているため、看護学生の教科書を分析対象とした。現在、その中から用語を抽出できるよう、現在準備を進めている。今年度は医療用語の抽出と整理、またその過程で医療用語の電子化への問題点などについて進めていく予定である。 次に医学用語の構造化の第一段階として語彙レベルでの分析を実施する。まず医学用語を複合語、単純語、接頭接尾辞を区別する。単純語や接頭接尾辞の場合はそのまま、複合語の場合は用語を構成する語構成要素に対して、様々な情報を付与し構造化していく。品詞情報については対象とする医学用語をmecabとunidicを利用して形態素解析をして品詞情報を付与するが、医療用語は通常の形態素解析ではうまく分割できないので、分割対象となる単位を見定めることをしていく予定である。 意味情報は現在進行中のComeJisyoの分析で使用している意味情報や医療分野のシソーラスを参考にしながら新たに定義するなどして整理する。
|
Current Status of Research Progress |
Current Status of Research Progress
4: Progress in research has been delayed.
Reason
コロナでの教育環境の変化で、オンライ授業の準備等、想定外のことが多く、研究に使える時間がほぼなかったことが原因である。昨年度の遅れを取り戻せるよう現在は少しずつ時間を作って研究できるようにしている。
|
Strategy for Future Research Activity |
当初の予定としては学習難易度や用語の属性判定を計画していたが、これを機械学習等で行えるのではないかと考え、機械学習および深層学習のプログラムの実装などを試してみるなど新しい方向性にもチャレンジできそうであるとの見通しを得た。
|
Causes of Carryover |
コロナの影響で計上していた海外で学会発表の費用が浮いてしまったため、その費用を研究に使用する書籍やソフト、謝金などに広げて使用するようにしていく。
|