2011 Fiscal Year Annual Research Report
Project/Area Number |
21300099
|
Research Institution | Seinan Jo Gakuin University |
Principal Investigator |
相良 かおる 西南女学院大学, 保健福祉学部, 講師 (00330887)
|
Co-Investigator(Kenkyū-buntansha) |
小野 正子 西南女学院大学, 保健福祉学部, 准教授 (50255957)
小木曽 智信 人間文化研究機構国立国語研究所, 言語資源研究系, 准教授 (20337489)
鈴木 隆弘 千葉大学, 医学部附属病院, 准教授 (40323422)
|
Keywords | 医療用語 / 医療記録 / 自然言語処理 / 電子カルテ / 辞書 / 医療情報 / 語彙調査 / 形態素解析 |
Research Abstract |
【2011年度の成果】 1. 2011年12月 昨年2010年に作成公開したComeJisyoV3(登録語数41,592語)の複合語の品詞(名詞サ変接続と名詞一般)について規則を定め、改定版ComeJisyoV3-1を公開 2. 2012年1月 登録語の拡充を行い、ComeJisyoV4(登録語数77,647語)を公開 3. 2012年3月 一般的な辞書(IPADIC)に登録される用語の中に、医療用語特有の読み方をするものが見つかったため、これらを追加登録し、2012年3月にComeJisyoV5(登録語数77,775語)を公開例:呼名(コメイ)、嫌気(ケンキ)、根性(コンセイ) 4. 電子医療記録に含まれる用語(ComeJisyo登録語)の語彙調査を行い、知見を研究会で発表。 5. 電子医療記録のタグ付きコーパス(品詞、フリガナ、ヨミガナ、利用場面等)869,712行を作成 【意義及び重要性】 標準化された用語や書式がない中、電子カルテシステムを導入する施設は増加し、日々大量の電子医療記録が蓄積されている中での、市販の専門用語辞書には含まれない業界用語や隠語、略語を含む単語分割用辞書ComeJisyoの作成・公開は、電子医療記録の単語分割の解析精度を向上させ、加えて、ComeJisyoを使って単語分割を行うことで、複数の解析結果の比較(メタ分析)を可能にした。 また、ComeJisyoには、品詞以外にヨミガナが付加されており、csv形式でも公開しているため、音声に変換することや、仮名漢字変換に活用が可能である。
|
Research Products
(5 results)